通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活98

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

Whale帷幄发布「人机协作」Alivia,AGI重塑营销科技新范式

Whale帷幄发布「人机协作」Alivia,AGI重塑营销科技新范式

4 月 20 日,品牌数字化营销运营服务商「Whale 帷幄」举办了「创造 AGI 原生的商业未来 ——2023 春季产品 Demo Day...

脸书“FaceBook”因数据泄漏被澳大利亚隐私管理机构起诉!

脸书“FaceBook”因数据泄漏被澳大利亚隐私管理机构起诉!

澳大利亚隐私管理机构对Facebook提起诉讼,声称他们在不知情的情况下向政治咨询公司剑桥分析(Cambridge Analytic...

2021年智能硬件市场盘点,智能硬件成教育市场刚需!

2021年智能硬件市场盘点,智能硬件成教育市场刚需!

今年暑假期间,国家印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,严格限制了课后补习问题。随着“双减”政策落地执行,曾经...

小米联合金山助力长江青年城智慧社区样板!

小米联合金山助力长江青年城智慧社区样板!

长江青年城是在武汉“百万大学生留汉创业就业工程”政策背景下,由卓尔、小米和金山共同打造的国内首个大型互联网青年社区。其中,小米联合金山为长江...

长城智能化最新野望: SpaceGPT 上车、城市 NOA 落地100城、杨继峰领衔 AI Lab

长城智能化最新野望: SpaceGPT 上车、城市 NOA 落地100城、杨继峰领衔 AI Lab

市值千亿的主机厂长城汽车,在沉寂了近两年后,再度对外披露其在智能化方面的最新进展:智能空间、大模型上车、明年计划城市NOA落地100城……...

网约车运营也存在“缺斤短两”问题!

网约车运营也存在“缺斤短两”问题!

智能出行已经成为国民出行的重要方式,便捷的打车方式,详细的车辆信息显示,都为打车出行提供方便。但与此同时,对于网约车的管理与制约一直在完善,...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。