首页 > 聚焦 > >正文

全球微头条丨中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

来源：时代财经2023-05-10 15:58:19

(相关资料图)

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力：

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于CLUEbenchmarks 官方网站进行公示。

标签：

推荐

全球微头条丨中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

2023-05-10

环球报道:楼道里的热心人，用爱温暖邻里~

2023-05-10

全球最新：深深房A涨停报于11.73元

2023-05-10

当前快播：7大热门板块！长沙望城区2023年107宗优质地块集中亮相

2023-05-10

环球时讯：中设股份：继续在智慧交通智慧检测监测及建筑设计领域寻找优质标的或团队

2023-05-10

黑龙江哪个心脏功能衰竭医院好「特色排名」-心力衰竭的症状是什么

2023-05-10

环球快看点丨300路公交车路线调整 300路公交车路线

2023-05-10

泉州市出台智能制造数字化赋能三年行动方案

2023-05-10

田村由香里世界今日报

2023-05-10

世界新资讯：美国南部边境移民激增政府急忙应对

2023-05-10

最新消息

全球微头条丨中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

环球报道:楼道里的热心人，用爱温暖邻里~

全球最新：深深房A涨停报于11.73元

当前快播：7大热门板块！长沙望城区2023年107宗优质地块集中亮相

环球时讯：中设股份：继续在智慧交通智慧检测监测及建筑设计领域寻找优质标的或团队

黑龙江哪个心脏功能衰竭医院好「特色排名」-心力衰竭的症状是什么

环球快看点丨300路公交车路线调整 300路公交车路线

泉州市出台智能制造数字化赋能三年行动方案

田村由香里世界今日报

世界新资讯：美国南部边境移民激增政府急忙应对

看热讯：总投资38.5亿元！天山股份一项目下半年调试投产！

满眼皆盛景乡村展新颜 ——保康共同缔造试点建设掠影

北京市消协:经营者不得强制消费者"扫码点餐""扫码缴费"

参加“一起捐” 为青春助力为梦想加油！_天天日报

世界热门:新县政府网邱娟新县政府网

全国铁路完成固定资产投资1674亿元同比增长6.3%

赵勇：国际拔尖创新人才培养的新理念与新趋势|全球要闻

【焦点热闻】如何充值公交卡？

朱砂是什么东西(朱砂是什么东西提炼出来的)

严重可致呼吸衰竭，上海等地出现“鹦鹉热”病例，病毒专家：人传人概率极小世界观热点

热点！阿帕拉契亚周报 2023/5/10丨自由邦防御同捆包 &古古那电吉他丨异变公共事件&瓶盖满溢

俄胜利日阅兵如期举行对乌作战将有“大动作”？-天天热推荐

【世界速看料】双色球时隔5个月再开重号5+1，罕见号仍有人中1000万头奖+二等奖

北京保安公司招聘最新消息_北京保安公司招聘

【全球聚看点】写别人帮助我的作文_别人帮助我的作文范文精选

蓝花楹唯美盛开 “赏花经济”助力昆明文旅市场回暖向好_全球观热点

最新伦敦金价格是多少（2021年9月20日）

冰菜放冰箱冷藏还是冷冻?|全球聚看点

宝山这个平台助力中科院团队实现“天然气制氢+石墨烯”，国资投资增值30倍

全球今头条！空调房间冷量如何计算（房间空调制冷量计算）

资讯

财经时评

社会热点

精彩推送