上海人工智能实验室等开源书生·浦语20B模型,阿里云魔搭社区全球首发

访客2年前AI生活205

9月20日,上海人工智能实验室等机构发布书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发、免费商用。书生·浦语大模型体系与魔搭社区建立重磅生态合作,共同推动中国大模型生态建设。

上海人工智能实验室等开源书生·浦语20B模型,阿里云魔搭社区全球首发

书生·浦语(InternLM)大语言模型由上海人工智能实验室联合多家机构共同推出。今年6月,InternLM千亿参数(104B)语言大模型首次发布,现已经历多轮升级;7月,上海人工智能实验室开源书生·浦语70亿参数的轻量级版本InternLM-7B,且在业内率先开源贯穿数据、预训练、微调、部署和评测的全链条工具体系。InternLM-7B也已上线魔搭社区。

本次发布的InternLM-20B是一款中量级大模型,性能先进且应用便捷,模型基于2.3T Tokens预训练语料从头训练,相较于InternLM-7B,其理解能力、推理能力、数学能力、编程能力等都有显著提升。

相比于此前国内陆续开源的7B和13B规格模型,20B量级模型具备更强大的综合能力,复杂推理和反思能力尤为突出,能为实际应用场景提供更有力的性能支持;同时,20B量级模型可在单卡上进行推理,经过低比特量化后,可运行在单块消费级GPU上,因而在实际应用中更为便捷。

相比于此前的开源模型,InternLM-20B拥有几大优势:一、优异的综合性能。不仅全面领先相近量级的开源模型,且以不足1/3的参数量,测评成绩达到了Llama2-70B的水平。二、强大的工具调用能力。支持数十类插件,上万个API功能,还具备代码解释和反思修正能力,为智能体(Agent)的构建提供了良好的技术基础。三、更长的语境。实现了对长文理解、长文生成和超长对话的有效支持,同时支持 16K 语境长度。四、更安全的价值对齐。在研发训练的过程中,研究团队进行了基于SFT和RLHF两阶段价值对齐,并通过专家红队的对抗训练大幅提高其安全性。

书生·浦语开源工具链也已全新升级,形成更完善的体系,包括预训练框架InternLM-Train、低成本微调框架XTuner、部署推理框架 LMDeploy、评测框架OpenCompass 以及面向场景应用的智能体框架Lagent。书生·浦语工具链将和开源数据平台OpenDataLab构成强大的开源工具及数据体系,为业界提供全链条研发与应用支持。

上海人工智能实验室等开源书生·浦语20B模型,阿里云魔搭社区全球首发

魔搭社区开设了书生·浦语“模型品牌馆”专页,聚合书生·浦语系列所有模型及体验接口,便于开发者一站式查询、下载、使用书生模型;魔搭公众号则推出了最佳实践教程,提前跑通模型的部署、推理和微调流程,供开发者参考。

阿里云魔搭社区是国内规模最大、开发者最活跃的AI模型社区,拥有200多万开发者,聚集了20多家头部人工智能机构贡献的1000多款优质AI模型,为开发者提供一站式的模型体验、下载、推理、调优、定制等服务,社区模型累计下载量已突破7500万次。

“以开源开放促进中国大模型生态繁荣”是书生·浦语大模型体系与魔搭社区携手共建的初衷。上海人工智能实验室坚持通过开源开放,全面赋能AI社区生态的繁荣发展,支撑学术研究与产业发展。阿里云则把促进中国大模型生态的繁荣作为首要目标,牵头建设中国最大的AI模型开源社区魔搭,并为大模型企业和开发者提供全方位云服务。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

理想的「套娃式造车」:首个5座SUV,L7能实现「月销1.5万」的小目标吗?

理想的「套娃式造车」:首个5座SUV,L7能实现「月销1.5万」的小目标吗?

理想汽车历史上第一辆5座SUV来了。 2月8日晚8点,理想汽车迎来L7的正式发布会 。今天并非这款车的第一次面世,早在去年理想提前发布L8的...

重要里程碑!高通展示全面开放式RAN商用强劲发展劲头

重要里程碑!高通展示全面开放式RAN商用强劲发展劲头

要点: • 目前,部分客户和合作伙伴正在测试并验证高通®X100 5G RAN加速卡和高通®QRU100 5G RAN平台,两款产品将助力开启...

英特尔CPU最新漏洞无法修复,大量CPU需更换!

英特尔CPU最新漏洞无法修复,大量CPU需更换!

自2018年以来,英特尔处理器暴露在 “幽灵”、“熔断”、Lazy LP 以及 Management Engine 等漏洞 下。到目前为止,...

360安全卫士极速版推出新一代体验清理Pro版 全面满足四大清理场景

360安全卫士极速版推出新一代体验清理Pro版 全面满足四大清理场景

近日,360安全卫士极速版发布了基于用户场景化需求的新一代电脑清理产品“体验清理Pro”,以“一键扫描”+“四大场景清理”的创新性功能,为系统...

读完李彦宏的33条语录,我终于把大模型搞明白了

读完李彦宏的33条语录,我终于把大模型搞明白了

在大模型掀起国内科技热潮后,所有人都想知道产业的下一步将如何发展。对此,恐怕没人比百度李彦宏更有资格做出判断。 百度是在3月发布的文心一言,成...

肺炎疫情将推动机器人行业发展!

肺炎疫情将推动机器人行业发展!

3月16日,在武汉大学人民医院门诊大厅,医务人员使用平板电脑控制智能消毒机器人。新华社 图 机器人可以成为对抗新冠肺炎的有效工...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。