首页 > 图片资讯

商量SenseChat 2.0发布:语言大模型研究取得重要突破

来源:中关村在线 时间:2023-06-26 10:15:11


(资料图)

近日,商汤科技发布了自研中文语言大模型“商量SenseChat 2.0”的测试成绩,数据显示在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准中均超越了OpenAI的ChatGPT。在某些方面,商量SenseChat 2.0的表现已接近GPT4的水平,意味着我国语言大模型研究取得了重要突破。 这三个测试分别为:MMLU是美国加州大学伯克利分校等高校构建的多任务考试评测集;AGIEval是微软研究院推出的学科考试评测集,包括中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等;C-Eval是由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集。在这三个测试中,商量SenseChat 2.0的表现均超越了ChatGPT以及国内外多款大模型,仅次于GPT-4。 在MMLU测试中,商量SenseChat 2.0的综合得分为68.6,位居第二,仅次于GPT-4(86.4分);在AGIEval测试中,商量SenseChat 2.0以49.91分紧追GPT-4(56.4分);在C-Eval测试中,商量SenseChat 2.0获得66.1分,仅次于GPT-4(68.7分)。 目前,已有近千家企业客户通过申请使用商量SenseChat 2.0,体验其长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力。商汤科技表示,将持续对“商量SenseChat 2.0”进行快速迭代和提升,实现知识的实时更新。

相关稿件

商量SenseChat 2.0发布:语言大模型研究取得重要突破

暴打“李鬼”!又一大型央企打假! 环球快看

警惕√小心红火蚁!钦州有人被咬倒地-焦点热门

天天看点:红豆的做法家常做法?

经典恐怖电影《小丑回魂》女版小丑手办公开:美艳诡异 超逼真-全球新消息

当前讯息:焦点速递!一次还本付息和分期付息的区别?主要有三点不一样

长沙沙湾社区:开展消防 “大比武”,筑牢安全防火墙|快播报

非法占用耕地林地农用地 四川公布一批典型案例

天天微速讯:湖州市残联开展省政府民生实事项目重要公共服务场所无障碍改造工作验收

信息:北京2023年普通本科录取控制分数线为448分

【关注】正式复航!

高考志愿填报相关App会员费不菲,AI填报靠不靠谱? 天天时快讯

我国首次高压力纯氢管道试验取得成功 各项结果均达预期

我国首艘深远海多功能科学考察及文物考古船广州开建 环球看点

全球资讯:龙腾凤江舞端阳!2023年潮州市饶平县“凤江杯”龙舟赛开桨

浙商银行(02016)拟斥资约 23.34 亿元购置深圳分行营业办公用房

外交部发言人就瓦格纳集团事件答记者问-全球视讯

奉百禄:6.24黄金走势先空后涨看震荡 下周建议关注美联储_每日快看

39℃的天气要来了!但降水时间就在……

浙海德曼:融资净偿还11.57万元,融资余额5483.88万元(06-08)

以青春之歌 逐强国之梦 天天即时看

西安美术学院灵异事件是真的吗_灵异事件是真的吗

长沙一民宅被8个桥墩包围,房顶距离高速桥仅1米多 全球速读

粤港海关开展跨境缉毒合作 查获各类毒品达561.3公斤

生死狙击斜石跳教学详细(生死狙击斜石跳) 快播报

2023天津购房政策首付比例是多少?_焦点快看

沈阳:全日制中专以上毕业生购房可享受全额契税补贴-世界消息

世界简讯:湖北公布2023年高考分数线:普通类本科物理424分、历史426分

全球通讯!返乡不是“镀金” 如何让更多青年留乡干事

人才引领 闪耀市中!市中区海右人才节系列活动大盘点