通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活115

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

图森未来拟出售美国业务:身处退市边缘,多位高管已离职

图森未来拟出售美国业务:身处退市边缘,多位高管已离职

一则官方公告,坐实了图森未来出售美国业务的传言。 美国时间6月28日,图森未来表示正在评估其美国业务的战略选择, 在图森未来董事会的一致支持...

剪映海外提速商业化,将推出 CapCut 营销工具版

小编获悉,CapCut(海外版剪映)近期正在研发独立营销工具网页版,支持商家视频制作。知情人士透露,该团队目前大概10人左右,由原抖音增长负责...

对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

走进融新科技中心A座23层,映入眼帘的是绿植、野营桌椅帐篷,在如此轻松的环境下,小编见到了APUS创始人李涛,他着一身休闲装,显得尤为放松。...

韩国的年轻人青睐数字货币!

韩国的年轻人青睐数字货币!

调查显示,韩国去年的加密货币交易量增加了64%,年轻的韩国人正在转向使用加密货币作为增加财富的手段,这极大地困扰了他们的雇主。根据韩国《朝鲜...

​腾讯净利润下滑56%,员工人均月薪下降,高管称成本仍有下降空间

腾讯二季度净利润下滑56%,员工人均月薪下降,高管称成本仍有下降空间 8月17日,腾讯发布2022年第二季度财报。财报显示,腾讯二季度营收13...

“狙击”非法代理维权黑灰产!“反催收”黑灰产治理报告发布

“狙击”非法代理维权黑灰产!“反催收”黑灰产治理报告发布

图为活动主办方为“反催收”黑灰产业现状危害及其治理研究报告发布揭幕。摄影:李大 10月21日,在各级监管部门加强“非法代理维权”黑产治理的政...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。