首页 > 关注

国产大模型哪家强?体验报告第一是它

来源:南方Plus 时间:2023-08-18 10:04:02


【资料图】

500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。

《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。

在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。

《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

(文章来源:南方Plus)

相关稿件

国产大模型哪家强?体验报告第一是它

“后遗症”初现:归母净利润同比骤降八成 东风汽车集团半年报或大幅承压

经济大家谈|罗志恒:发挥金融与财政的协同作用化解地方债务风险

V观财报|商品煤售价大幅波动 平煤股份上半年净利同比降33.61%

青海格尔木首个零工驿站:告别风吹日晒谋生方式

文明实践 | 清远市财政局与英德市新时代文明实践中心结对共建!

“马王堆汉代文化沉浸式多媒体大展”策展方案评审会收官 正式启动IP合作全球招标

山西通报“3岁男童被幼师踢打灌水”:解聘园长、主任和老师

桃城区五所区直幼儿园8月18日开始报名

以棋会友 乐享“棋”中 新会区举行青少年象棋公开赛

宁波华翔董秘回复:最新情况请留意8月24日宁波华翔半年报相关内容

万里扬(002434)新增【机器人】概念

将“厕所革命”实事办到群众心坎里

金桥信息(603918.SH)控股股东累计减持公司0.74%股份

四川省阿坝州松潘县:全面提升“茶叶过度包装”治理质效

双塔食品股东户数下降1.14%,户均持股8.07万元

闻斯行诸求也退故进之由也兼人故退之 闻斯行诸

突发!上海南北高架下一车起火,现场黑烟滚滚!消防部门通报

浙江卫视惹众怒!李玟控诉《好声音》录音曝光,全台多次牵扯人命

日照旅游,哇塞,这里是山东日照哎

义眼是什么 关于义眼的介绍

新希望落子成都东三环,这一次凭什么把期待值拉满?

移动的最低月租是多少?8元套餐有哪些?

带3娃买4张票登机被拒?航司回应了

小野寺办公室支付资助

乘联会:8月1-13日新能源车市场零售20.8万辆 同比增长38%

黑莓9930怎么用联通卡(联通黑莓)

小金刚菩提子盘成后图 金刚菩提子正确刷法

罗志祥好帅(罗志祥最帅的图片)

汉族的风俗有哪些(关于汉族的风俗有哪些的基本详情介绍)