通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活85

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

以赛引才,2022杭州全球人工智能技术创新大赛-算法挑战赛收官

以赛引才,2022杭州全球人工智能技术创新大赛-算法挑战赛收官

11月26日,2022杭州全球人工智能技术创新大赛-算法挑战赛颁奖典礼在杭州未来科技城举行,为大赛划上圆满句号。 据统计,自今年2月底...

华为P60系列发布:移动摄影的新巅峰,成为最强影像旗舰

华为P60系列发布:移动摄影的新巅峰,成为最强影像旗舰

华为于3月23日举行了2023年春季新品发布会,正式推出了华为P60系列手机,包括华为P60、华为P60 Pro、华为P60 Art三款机型。...

9项满分!腾讯云稳居中国公有云开发和基础设施平台分析师报告领导者阵营

刚刚获悉,国际权威研究机构Forrester正式发布《The Forrester Wave:Public Cloud Development...

业内首款「百美金级」纯固态补盲激光雷达

业内首款「百美金级」纯固态补盲激光雷达

于无声处听惊雷。 近日,纯固态激光雷达公司芯探科技CEO金丰向新智驾透露,芯探科技的纯固态Flash补盲激光雷达,售价已下探到100美金左右。...

5G“新基建”给移动通信产业带来更多的机遇!

5G“新基建”给移动通信产业带来更多的机遇!

今年汽车产销下降3成多,大中型钢铁企业利润骤降一半以上,有色行业利润也跌了3成多。 在诸多产业靡不振的后疫情时代,近日工信部公布的通信...

大模型生产力的头场变革,从英特尔商用 AI PC 说起

大模型生产力的头场变革,从英特尔商用 AI PC 说起

「水利万物而不争。」 这是英特尔公司高级副总裁、英特尔中国区董事长王锐女士常说的一句话,看似没有压迫性,却切实点出了英特尔作为 AI PC 概...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。