清华第二代60亿参数ChatGLM2开源!中文榜居首,碾压GPT-4,推理提速42%

sxkk20081年前智能百科72
ChatGLM-6B 自从三月份问世之后,引起了 AI 社区的轰动,至今已在 GitHub 上收获了 29.8k 颗星。然而,现在第二代的 ChatGLM 已经悄然而至!清华大学知识工程与数据挖掘小组(THUDM)最近发布了一款中英双语对话模型——ChatGLM2-6B。

ChatGLM-6B 自从三月份问世之后,引起了 AI 社区的轰动,至今已在 GitHub 上收获了 29.8k 颗星。然而,现在第二代的 ChatGLM 已经悄然而至!清华大学知识工程与数据挖掘小组(THUDM)最近发布了一款中英双语对话模型——ChatGLM2-6B。

值得一提的是,在中文评估榜单 C-Eval 中,ChatGLM2 以突出的 71.1 分位居榜首,轻松超越 GPT-4。而最新版本的 ChatGLM2-6B 更是以 51.7 分的优异成绩登上了第六名的宝座。


清华第二代 60 亿参数 ChatGLM2 开源!中文榜居首,碾压 GPT-4,推理提速 42%

ChatGLM-6B 的第二代版本,在继承了初代模型流畅对话和低门槛部署等许多优秀特性的基础上,引入了许多令人振奋的新特性:


1. 超强的性能


基于初代模型的开发经验,ChatGLM2-6B 的基座模型经过全面升级。ChatGLM2-6B 使用了混合目标函数的 GLM,经过了 1.4T 中英标识符的预训练并与人类偏好进行对齐训练。


评测结果表明,与初代模型相比,ChatGLM2-6B 在 MMLU(增长 23%)、 CEval(增长 33%)、 GSM8K(增长 571%)和 BBH(增长 60%)等数据集上取得了巨大的性能提升,在同尺寸的开源模型中具有强大的竞争力。

2. 更广泛的上下文


基于 FlashAttention 技术,研究人员将基座模型的上下文长度从 ChatGLM-6B 的 2K 扩展到了 32K,并且在对话阶段使用 8K 的上下文长度进行训练,使得更多轮的对话成为可能。然而,目前版本的 ChatGLM2-6B 对于单轮超长文档的理解能力还有限,这将在后续的迭代升级中进行重点优化。


3. 更高效的推理


基于 Multi-Query Attention 技术,ChatGLM2-6B 具有更高效的推理速度和更低的显存占用。在官方模型实现下,推理速度相比初代提升了 42%,在 INT4 量化下,可以支持的对话长度从 1K 提升到了 8K,仅使用了 6G 的显存。

4. 更开放的授权协议


ChatGLM2-6B 权重完全对学术研究开放,并允许商业使用,前提是获得官方的书面许可。

与初代模型相比,ChatGLM2-6B 在多个方面的能力都取得了巨大的提升。


与此同时,研究团队选取了部分中英文典型数据集进行评测并发布了 ChatGLM2-6B 模型在 MMLU(英文)、 C-Eval(中文)、 GSM8K(数学)、 BBH(英文) 上的测评结果。此外,该团队还对比了生成 2000 个字符的平均速度,其效果如下图所示:

清华第二代 60 亿参数 ChatGLM2 开源!中文榜居首,碾压 GPT-4,推理提速 42%


清华大学发布了第二代规模达 60 亿参数的 ChatGLM2,该模型在中文领域表现出众,远超过了 GPT-4,推理速度提高了 42%。ChatGLM2-6B 采用 Multi-Query Attention 技术,极大地提升了生成速度,同时还有效降低了生成过程中 KV Cache 的显存占用。

除此之外,ChatGLM2-6B 采用了 Causal Mask 技术进行对话训练,使连续对话时能够重复利用之前轮次的 KV Cache,进一步优化了显存占用。


因此,使用 6GB 显存的显卡进行 INT4 量化的推理时,一代的 ChatGLM-6B 模型最多能够生成 1119 个字符就会提示显存耗尽,而 ChatGLM2-6B 能够至少生成 8192 个字符。研究团队还对量化对模型性能的影响进行了测试,结果显示量化对模型性能的影响在可接受范围内。


项目地址:https://github.com/ THUDM / ChatGLM2-6B

HuggingFace:https://huggingface.co/THUDM/chatglm2-6b

相关文章

从“墙面依赖”到“智慧掌控”,三翼鸟携手沃棣家居,焕新家居生活新篇章

从“墙面依赖”到“智慧掌控”,三翼鸟携手沃棣家居,焕新家居生活新篇章

随着科技的不断进步,家居生活也正在经历一场前所未有的变革。在2024年7月8日开幕的广州建博会上,三翼鸟携旗下品牌沃棣家居,为我们呈现了一场智能家居的盛宴。 沃棣家居此次推出的全场景智慧...

持续发力AIOT智能物联智慧电梯细分领域,卓越技术市场占有率超15%

持续发力AIOT智能物联智慧电梯细分领域,卓越技术市场占有率超15%

当前,5G、云计算、物联网、人工智能等新一代技术正深刻改变着城市的信息结构,链接城市中每一个数据节点,使庞大的数据量高效流动起来,构筑起了智慧、高效的城市体系。作为一家专注于人工智能+特种...

海信激光电视2024德国柏林消费电子展“炫技”连连,超百吋巨幕体验值爆表

海信激光电视2024德国柏林消费电子展“炫技”连连,超百吋巨幕体验值爆表

当地时间9月6日,IFA2024如期而至,各种新奇的产品上演了一场技术大秀。作为激光显示赛道的创领者,海信激光电视一出场便“炸场”,带来了全球首款8K屏幕发声激光电...

ChatGPT热潮未退:京东推出产业版ChatGPT?

ChatGPT热潮未退:京东推出产业版ChatGPT?

ChatGPT,一款由开放 AI 实验室推出的一款中文语言模型,可应用于智能写作、智能客服、智能问答等多个领域,它被外界冠以人工智能技术里程碑式的进展,其惊艳表现早已引发各界的热烈讨论和关注。 早在...

贝壳“高考服务站”暖心护航,助杭城学子考场逐梦

贝壳“高考服务站”暖心护航,助杭城学子考场逐梦

6月7日-10日,在粽香浓郁的端午夏日,杭州数万莘莘学子迈入高考考场,开启他们的逐梦之战。在这个影响千万家庭的重要时刻,场内场外都有人为他们竭力守护。 今年高考期间,贝壳杭州站再度联合杭...

微软必应聊天将解锁 AI 炒股功能:免费提供,可预判股价未来走势

微软必应聊天将解锁 AI 炒股功能:免费提供,可预判股价未来走势

随着人工智能技术的不断进步和发展,机器学习在量化投资领域的应用越来越普遍。“生成式 AI”的横空出世,不免让人们引发了对于“AI 炒股”的深入讨论。随着人工智能技术的不断进步和发展,机器学习在量化投资...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。