工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客9个月前AI生活70

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

中国电子学会理事长徐晓兰:人形机器人产业迎来“井喷前夜”

8月13日,2024世界机器人大会新闻发布会举行。全国政协常委、工业和信息化部原副部长、中国电子学会理事长徐晓兰在回答记者提问时表示,人形机器人正呈现出四大发展趋势。 人形机器人是“...

大数据杀熟愈演愈烈,不要让云计算变成了“云算计”!

大数据杀熟愈演愈烈,不要让云计算变成了“云算计”!

今年两会,大数据技术衍发出的平台监管、弹窗广告、大数据杀熟等各类问题引发关注。就如何规制大数据杀熟,多位代表委员从不同方面建言献策。...

撬走端侧AI普及的最后一块「绊脚石」

撬走端侧AI普及的最后一块「绊脚石」

“现在听到AI时代要来了,就像是听到了‘狼来了’。”AI开发者小王对于AI普及的论调早已习以为常。 “AI产品开发不仅门槛高,还很难移植到不...

AI发现一款临床前「新冠特效药」,有望适用多种冠状病毒

AI发现一款临床前「新冠特效药」,有望适用多种冠状病毒

全国多地出现的本土新冠肺炎确诊病例,依旧时刻牵动着大众的心。 2022年3月28日,上海开始实施分批次封闭式管理,当地居民基本进入足不出户状态...

腾讯Q1坚实增长营收同比增11% 三大主业重回增长轨道

2023年一季度,数实经济、广告和游戏三大核心业务集体发力下,腾讯重回增长曲线。腾讯控股(00700.HK)5月17日发布的一季报显示,营业收...

安谋科技如何与Arm「异构集成」?

安谋科技如何与Arm「异构集成」?

安谋科技的纷争结束后,业界对于这技术和导向家公司的关注点回归到其产品。 继上周Arm发布全新的面向移动端的CPU和GPU产品组合之后,本周安谋...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。