工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客1年前AI生活100

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

魔视智能获北汽两款车型量产定点

魔视智能获北汽两款车型量产定点

近日,全栈式自动驾驶产品供应商、国内领先的同时具备行泊一体能力的新势力Tier 1魔视智能MOTOVIS宣布获得北汽量产定点,为北汽极狐品牌的...

FDA发布第一个医疗AI行动计划,监管的新靴子终于落地!

FDA发布第一个医疗AI行动计划,监管的新靴子终于落地!

1月12日,FDA正式发布了该机构的第一个人工智能/机器学习(AI / ML)的SaMD(Software as a Medical...

周杰伦二次元形象“周同学”牵手支付宝“蓝花火”!AR打卡得巨星周边

周杰伦二次元形象“周同学”牵手支付宝“蓝花火”!AR打卡得巨星周边

当下演唱会经济火热,福州率先开启新玩法。据悉,5月16日至19日,2024周杰伦嘉年华世界巡回演唱会福州站,将迎来10万“杰伦迷”,其中有半数...

半导体行业资本开支已超「40%红线」,「缺芯」拐点将至?

半导体行业资本开支已超「40%红线」,「缺芯」拐点将至?

“缺芯”的话题已经在半导体行业的上空萦绕了两年之久。这次由于劳动力短缺、疫情封锁等多番因素最终导致的全方位的缺芯潮一度致使手机、汽车等行业出现...

人大毕业生大肆黑进内网,窃取全校学生信息进行颜值打分;雪铁龙C6补贴9万被指涉嫌诈骗

人大毕业生盗取全校学生信息建颜值打分网站,校方:已报警 7月2日消息,近日网传中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息...

AR全息数字化智慧开关站赋能亚运

AR全息数字化智慧开关站赋能亚运

昨天,在位于德清县的杭州亚运会三人篮球场馆凤栖湖开关站内,国网德清县供电公司工作人员在检查调试设备。这是全省首座AR全息数字化智慧运维开关站...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。