通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客2年前AI生活124

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

美国对华为芯片实施断供!华为包机从台湾运回所有麒麟芯片!

美国对华为芯片实施断供!华为包机从台湾运回所有麒麟芯片!

9月15日就是美国对华为芯片开始实施全面“断供”的日子,据外媒最新消息,华为旗下海思近日大手笔包货运专机,赶在出货期限前把芯片运出,以缓解华...

面部识别初创公司Clearview违反加拿大隐私法!

面部识别初创公司Clearview违反加拿大隐私法!

图源:Getty Images 加拿大隐私专员周三表示,面部识别初创公司Clearview在加拿大民众不知情或未经允许的情况下收集他们...

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

马斯克的Space X卫星被破解,25美元的工具就能入侵终端,篡改运行任意代码,攻击手法已公开

对于黑客来说,电脑可以破解、游戏机可以破解、手机可以破解,那远在天上的卫星可以破解吗? 答案是可以的!而且被破解的还是世界首富马斯克旗下Spa...

韩国使用人工智能AI追踪新冠感染者的活动轨迹!

韩国使用人工智能AI追踪新冠感染者的活动轨迹!

首尔民众排队进行新冠检测 韩国即将推出试点项目,使用人工智能、面部识别和监控探头追踪新冠病毒感染者的行动轨迹,该项目引发部分人士对隐私...

强强联合互助共赢!华润医疗器械与科亚医疗签署战略合作协议

强强联合互助共赢!华润医疗器械与科亚医疗签署战略合作协议

9月7日,在全国上下喜迎党的二十大召开之际,华润医药商业集团医疗器械有限公司(以下简称华润医疗器械)与科亚医疗科技股份有限公司(以下简称科亚医...

快手放弃VR全景视频业务,大厂纷纷逃离XR

快手放弃VR全景视频业务,大厂纷纷逃离XR

据可靠消息称,快手即将调整运营了两年的全景视频组织业务,成为了2023年继腾讯XR内部动荡后,又一个XR业务出现剧变的互联网大厂。 经确认,...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。