商量SenseChat 2.0发布:语言大模型研究取得重要突破
时间:2023-06-26 10:15:11
(资料图)
近日,商汤科技发布了自研中文语言大模型“商量SenseChat 2.0”的测试成绩,数据显示在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准中均超越了OpenAI的ChatGPT。在某些方面,商量SenseChat 2.0的表现已接近GPT4的水平,意味着我国语言大模型研究取得了重要突破。 这三个测试分别为:MMLU是美国加州大学伯克利分校等高校构建的多任务考试评测集;AGIEval是微软研究院推出的学科考试评测集,包括中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等;C-Eval是由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集。在这三个测试中,商量SenseChat 2.0的表现均超越了ChatGPT以及国内外多款大模型,仅次于GPT-4。 在MMLU测试中,商量SenseChat 2.0的综合得分为68.6,位居第二,仅次于GPT-4(86.4分);在AGIEval测试中,商量SenseChat 2.0以49.91分紧追GPT-4(56.4分);在C-Eval测试中,商量SenseChat 2.0获得66.1分,仅次于GPT-4(68.7分)。 目前,已有近千家企业客户通过申请使用商量SenseChat 2.0,体验其长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力。商汤科技表示,将持续对“商量SenseChat 2.0”进行快速迭代和提升,实现知识的实时更新。
相关稿件
商量SenseChat 2.0发布:语言大模型研究取得重要突破
经典恐怖电影《小丑回魂》女版小丑手办公开:美艳诡异 超逼真-全球新消息
当前讯息:焦点速递!一次还本付息和分期付息的区别?主要有三点不一样
天天微速讯:湖州市残联开展省政府民生实事项目重要公共服务场所无障碍改造工作验收
高考志愿填报相关App会员费不菲,AI填报靠不靠谱? 天天时快讯
全球资讯:龙腾凤江舞端阳!2023年潮州市饶平县“凤江杯”龙舟赛开桨
浙商银行(02016)拟斥资约 23.34 亿元购置深圳分行营业办公用房
奉百禄:6.24黄金走势先空后涨看震荡 下周建议关注美联储_每日快看
浙海德曼:融资净偿还11.57万元,融资余额5483.88万元(06-08)