科大讯飞动真格：星火大模型七大维度评测，率先落地应用_天天热闻

5月6日，科大讯飞（002230.SZ）正式发布讯飞星火认知大模型（下称“星火”）。当有的厂商为大模型不确定的商业化落地前景感到焦虑时，科大讯飞迎头赶上，不仅现场收集问题进行测试，还针对大模型推出七大评测维度。更重要的是，红星资本局注意到，科大讯飞成为了国内率先将大模型落地应用的厂商，并推出了推出面向教育、办公、车载等行业的解决方案。科大讯飞在AI领域十年如一日的积累，在此时成为了可以燎原的星火。

【资料图】

现场收集问题进行测试

科大讯飞动真格，七大维度评测

科大讯飞一上来就是动真格。

5月6日，在发布会现场，科大讯飞的董事长刘庆峰、研究院院长刘聪在发布会现场用几分钟收集了上千个问题，并随机抽取了5个问题现场测试。

——“外星人感冒了需要戴口罩吗？”

——“我想把40㎡的房子装修成70㎡的感觉，请给出可行的方案。”

——“公众场合大声喧哗会影响别人的心情，那小声讲话是不是就不会影响？”

如果只靠回答这些问题来证明星火的能力，那科大讯飞恐怕又会落入俗套，刘庆峰显然看得更加长远，不是从企业、而是从整个行业的角度去看待问题。

“我特别想说的是，如果我们要让认知智能真的解决社会刚需（问题），而不是简单地做PR、做宣传的话，我们就要建立一套实实在在的用科学系统来评测的体系。”刘庆峰说。

作为人工智能领军之一，科大讯飞通过认知智能全国重点实验室牵头设计了评测体系，并与相关联盟共同探讨形成了覆盖七大维度的481个细分任务对通用认知大模型进行评测。

其中，七大维度指的是文本生成、语言理解、知识问答、逻辑推理、数字能力、编程能力和多模态，星火在此次的发布会上被现场考验了每一个维度的问题。

——“请问孔子在2008年的奥运会上说了些什么？”

——“等腰三角形的顶角是底角度数的2倍，请问这个三角形的底角是多少度？”

——“俗话说，男子汉大丈夫宁死不屈；但俗话又说，男子汉大丈夫能屈能伸。这两种说法应该怎么理解呢？”

红星资本局在现场注意到，星火在个别维度上的表现偶有瑕疵，但整体表现优秀，尤其是在最后一个维度多模态上，它的表现可谓是惊艳。

先是刘聪语音输入要求，让星火以“立夏”为题写一篇200字散文，然后又要求星火以温柔的男声朗读，每个任务星火都完美达成。甚至，在被提出生成女性形象的虚拟人朗读时，星火只用不到10秒的时间成功生成虚拟人的视频。

从接受语音需求到文本生成，再从语音朗读到实时生成虚拟人，星火展现了大模型能达到的丰富形态和能力，让我们认识到大模型在生活中存在的另一种无限可能。

业界尚愁落地不确定性

科大讯飞一口气推出多款落地产品

当前，业界普遍还认为，通用认知大模型的商业化前景尚不明确，行业落地存在不确定性。而科大讯飞凭借在AI领域的多年积累，此次一口气推出了搭载大模型的多款产品。

以教育领域为例，搭载星火的科大讯飞AI学习机T20系列实现了中英文作文类人批改。

刘庆峰认为，在语言学习的过程中，作文能力很难得到提升。因为针对性的指导和批改耗时耗力，老师很难对每一个学生的情况进行深度的分析、教导，而星火带来了全新的体验。

从现场实时演示来看，和传统学习机一样，该学习机也能进行针对字词标点纠错、识别句式修辞错误等基础批改，同时，该学习机还能围绕写作要求分析全篇结构和文采，如某一句可以优化、建议加入动作描写和神态描写等。

相对来看，学习机可能只调用了星火在文本生成、语言理解等维度的能力，另一产品更能综合地体现星火多维度的能力——“大模型+数字员工”。

在发布会上，刘聪要求星火复盘科大讯飞的“飞凡计划”（招收优秀应届毕业生的招聘项目），在无人操作的情况下，星火自动登录HR系统，并根据要求导出数据、分析数据、生成PPT。

红星资本局注意到，在整个过程中，星火或动用了语言理解、逻辑推理、数字能力、编程能力和多模态等多维度的能力完成指令。

星火正在对科大讯飞的“飞凡计划”进行复盘

事实上，除了上述两个领域外，科大讯飞还发布了星火在办公和汽车等领域的行业应用成果，如“大模型+智能办公本”、“大模型+讯飞听见”和“大模型+智能座舱”等。

从目前推出的大模型进度来看，科大讯飞毫无疑问是率先应用落地的厂商。可以说，星火的现在，或许可能就是不少投身AI创业浪潮之人还在畅想的未来。

科大讯飞的多年积累

从数据、算法到模型、算力均有优势

为什么科大讯飞能成为率先将大模型应用落地的厂商？

正如刘庆峰在此次发布会上说的，“这一次认知大模型本质上是一次对话式的通用智慧的涌现，语音和语言的核心能力是一个基础条件。”

红星资本局注意到，科大讯飞最早在2011年就承建了语音及语言信息处理国家工程实验室，而且在认知智能领域中不断投入进行研发，有长达十几年的积累。

以数据为例，刘聪今年曾对媒体透露，在严格遵守适用法律法规前提下，科大讯飞在多年认知智能系统研发推广中积累了超50TB的行业语料和每天超10亿人次用户交互的活跃应用。

当然，光有数据积累是不够的，还需要优秀的算法和模型。

科大讯飞财报曾披露，其在认知智能大模型最核心的Transformer深度神经网络算法方面拥有丰富的经验，且已广泛应用于科大讯飞的语音识别和图文识别等，已达到国际领先水平。

另外，科大讯飞现已开源6个大类、超过40个通用领域的系列中文预训练语言模型，相关模型库月均调用量超1000万，在Github平台获得星标数位列同类中文预训练语言模型前列。

这也体现在科大讯飞连年增长的研发费用中。红星资本局翻阅财报发现，在过去五年中，科大讯飞的研发费用分别为12.63亿元、16.40亿元、22.11亿元、28.30亿元和31.11亿元。

更为重要的是，科大讯飞在算力上占据优势。

科大讯飞在今年4月曾通过投资者关系活动记录表披露称，其在总部自建有业界一流的数据中心，且已建成4 城7中心深度学习计算平台，为大模型训练平台建设奠定了硬件基石。

这些或许是科大讯飞喊出“10月底整体赶超ChatGPT”的底气，我们拭目以待。

（唐浩）

（下载红星新闻，报料有奖！）

关键词：

科大讯飞动真格：星火大模型七大维度评测，率先落地应用_天天热闻

王佳杨个人资料简介（王佳杨...

最后一页

相关阅读

科大讯飞动真格：星火大模型七大维度评测，率先落地应用_天天热闻

5月6日，科大讯飞（002230 SZ）正式发布讯飞星火认知大模型（下称“星火”）。当有的厂商为大模型不确定的

王佳杨个人资料简介（王佳杨个人资料）

1、原创歌曲《遗憾》原创：是你大哥阿是你大哥阿的原创《遗憾》歌曲演绎地是绝大多数人在是在分手时的遗憾

1057.70亿元！淄博最新发布

5月7日，记者从淄博市统计局获悉，根据市级生产总值统一核算结果，一季度淄博市实现生产总值1057 70亿元，

环球要闻：买房全靠闲鱼？未来行业不为人知！

前两天在微博刷到一个扎心话题，月入1万难吗？评论里多数人都在猛刷：难！其中一位网友更是披露了工作后10

全球今头条！成都国际汽配展（CAPAS）主打新能源主题

【成都国际汽配展（CAPAS）主打新能源主题】成都国际汽车零配件及售后服务展览会（CAPAS）将于5月18至20日

下周关注丨4月CPI、PPI等数据将公布 这些投资机会最靠谱

5月11日，国家统计局将公布4月CPI、PPI数据。西部证券预计4月CPI同比增0 3%。4月以来，工业品价格下行速度

杭州万向职业技术学院_杭州万向职业学院官网

1、杭州万向职业技术学院、浙江广厦职业技术学院，都是民办高收费学校。2、广厦稍好，在全省专科学校中排名

圆台的体积怎么算简单点的公式_圆台的体积

1、圆台体积公式：公式描述：公式中r为上底半径、R为下底半径、h为高。2、用一个平行于圆锥底面的平面

夏日已至 来“中国凉都”赴一场清凉之旅-最资讯

2023年夏季的第一个夜晚，一场清凉之旅的邀请函如约而至——2023中国凉都·六盘水消夏文化避暑旅游季暨“百

中国驻菲律宾使馆协同菲执法部门开展案件办理

菲方感谢使馆第一时间派警务、领事官员以及翻译人员赴现场协同办案，表示将加快搜集嫌疑人犯罪证据，确保犯

营业利润增长率和净利润增长率的区别_营业利润增长率

1、恩百度词条的标题是营业利润增长率下面写的却是营业收入增长率就是字面意思利润的增长率而不是收入。本

五四夜记雨_今日最新

2023年5月4日晚自习，请假未果，闲至无聊，烦闷至极，作此文。一丝风也没有的天气，雨静静的落下来，打在柏

国际观察：策动＂颜色革命＂ “黑客帝国”终将引火烧身

近日，中国国家计算机病毒应急处理中心和360公司联合发布《“黑客帝国”调查报告——美国中央情报局（CIA）

世界速讯：最新！松江区妇幼保健院可接种HPV疫苗，接种预约渠道

5月4日，松江区妇幼保健院HPV（人乳头瘤病毒）疫苗接种服务上线。这是松江区首家区级医院提供该服务，全区

天天最新：“挖呀挖”原创为何输给了模仿 ？看完黄老师的生活照我懂了

“挖呀挖”原创为何输给了模仿？看完黄老师的生活照我懂了,原创,儿歌,歌曲,桃子,生活照,挖呀挖

退烧药副作用有哪些_退烧药副作用 今日快看

1、发热是呼吸道疾病的常见症状，但发热不是呼吸道疾病的特有症状。2、此外，非传染性疾病也会引起发热，包

曲屏电视和直屏电视哪个好-曲屏电视 每日信息

1、直屏电视比曲屏电视要好。2、区别：外观设计不一样曲屏电视在设计上，采用的是曲面的方式，屏幕的两端向

每日头条!城市猎人-tv全集爱奇艺 城市猎人tv全集

今天来聊聊关于城市猎人-tv全集爱奇艺，城市猎人tv全集的文章，现在就为大家来简单介绍下城市猎人-tv全集爱

中国移动发布5G极致专网3.0 Ultra，推出四款场景化专网产品

C114讯5月6日消息（九九）5G专网是社会数智化转型的关键基础设施，持续激发垂直行业数字化转型新动能。

有了！涉大兴这片区棚改、规划定位.....

有了！涉大兴这片区棚改、规划定位 ,棚改,街区,大兴区,黄村镇,棚户区改造

湖北十堰市三个重大林业项目可行性研究报告获发改委批复

湖北天门生物医药产业在创新绿色发展新赛道上加速迭代

2021中国攀岩自然岩壁系列赛（重庆奉节站）暨年度总决赛结束

推动侦查办案工作高质量发展 京津冀三地检察机关召开交流研讨会

感动！牺牲移民管理警察蔡晓东妻子的朋友圈令人破防……

下周关注丨4月CPI、PPI等数据将公布这些投资机会最靠谱

夏日已至来“中国凉都”赴一场清凉之旅-最资讯

天天最新：“挖呀挖”原创为何输给了模仿？看完黄老师的生活照我懂了

退烧药副作用有哪些_退烧药副作用今日快看

曲屏电视和直屏电视哪个好-曲屏电视每日信息

每日头条!城市猎人-tv全集爱奇艺城市猎人tv全集

C114讯5月6日消息（九九）5G专网是社会数智化转型的关键基础设施，持续激发垂直行业数字化转型新动能。　　

推动侦查办案工作高质量发展京津冀三地检察机关召开交流研讨会