“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

访客9个月前AI生活109

历经持续一年多的百模大战后,市场竞争逐渐深化,如何更快、更好地推进大模型的落地应用,开始成为各大大模型公司思考的焦点所在。

3月18日,澜舟科技在中关村国家自主创新示范区展示中心隆重举行了“创新落地,生态共赢”大模型技术和产品发布会。

会上,澜舟科技展示了澜舟科技的大模型的最新进展和大模型技术的实际应用落地、生态构建的成果,更体现了其对未来发展的深度思考和战略布局。

现场,创新工场董事长、零一万物CEO李开复博士分享了对于AI 2.0 平台变革进行式的见解。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

创新工场董事长、零一万物CEO李开复博士正在演讲

他认为, AI 2.0 模型能力突飞猛进,通识理解已经超越人类专家。AI 2.0 通过图灵测试并趋于成熟,揭示下一个平台级变革 。新一代创新应用需要新的技术平台,基于强大的底层技术搭建出高效的开发工具, 从而节约开发生态做创新产品的成本,促进包括新产品、新业态、新的商业模式的全新应用生态。

周明博士提出大模型落地九字法则

发布会上,澜舟科技创始人&CEO周明博士回顾了澜舟科技的发展历程,他强调在数字化浪潮中,以大模型为代表的人工智能正在重塑人类的未来。2024年将是大模型落地元年,如何利用大模型技术助力企业成长已成为业界关注的焦点。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

澜舟科技科技创始人&CEO周明博士在演讲

去年年初,ChatGPT横空出世,引爆了AI大模型创业热潮。但与大多数初创企业不同的是,澜舟科技成立于2021年6月, 彼时大模型的浪潮还没有来临。

据了解,其实早在2020年年底,周明博士就隐约感知到大模型的未来发展趋势,彼时他正在微软就职,意识到这一点后,便离职创业,成立了澜舟科技,致力于自主研发大模型技术和行业应用。

2023年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)正式对公众开放。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

当前,关于大模型的发展,技术信仰和市场信仰派争论不休,而周明博士强调,澜舟科技注重技术和应用双轮驱动,即在积极研究和掌握前沿技术的同时,公司也致力于确保这些技术的有效应用。在每一个关键技术发展的时期,澜舟科技都会携手客户及合作伙伴,如传神、数说故事、华为云、华夏基金、同花顺、中金公司等,共同开展深入合作。

通过深入应用场景、精准把握用户需求,澜舟科技不断推动技术和产品的迭代升级,力求在激烈的市场竞争中保持领先地位。

周明博士表示,过去一年大模型得到了迅速发展,而2024年将是大模型落地元年, 各界热切期盼大模型能结合不同行业的场景应用,实现规模化效用。政府工作报告新鲜出炉,特别强调以人工智能+,驱动各行各业的转型升级。他认为要把握好这个历史契机,通过落地,创造价值,拉动创新。

而要做好大模型落地,周明博士认为互联网的七字法则仍然适用:专注、极致、口碑和快,还要再加上成本,形成大模型落地九字法则。

周明博士强调,大模型ToB应用要解决四个大问题:训练和部署成本、行业适配性、幻象、数据安全,并解释了澜舟科技在这四个方面所作的努力。

“一横N纵”孟子大模型系列及产品发布

此次发布会的核心为”一横N纵”体系,其中的“一横”即为孟子大模型技术,而“N纵”是基于孟子大模型的面向ToB应用最重要的技术和产品。

澜舟科技希望通过“一横N纵”,彻底贯彻大模型落地九字法则:专注、极致、口碑、快、成本。

周明博士首先介绍了从预训练,到SFT,到强化学习,安全,降低幻觉的完备的孟子大模型训练体系。孟子大模型离不开背后的高质量的数据集—Mengzi-3数据集,总规模为3T tokens,包含了网页、代码、书籍、论文等高质量数据来源。

最后,在Mengzi-3语料数据的加持下,澜舟团队在近期完成了Mengzi3-13B的大模型训练,在常见公开数据集,如MMLU,Chinese-MMLU,GSM8K,HUMAN-EVAL等评估模型效果来看,该模型在各项基准测试中与相仿参数量大模型相比,中英文语言能力成绩领先。

针对大模型训练和部署的成本高的问题,澜舟科技专注把ToB场景使用最多的LLM模型(参数量7B、13B、40B最高到100B)做到最佳并大幅度提升大模型的推理效率。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

3月30日Mengzi3-13B的模型将在GitHub、HuggingFace、魔搭和始智AI社区开源。

针对大模型的行业落地适配问题,周明博士再次重申了L1-L2-L3-L4的层次化分级服务体系, 基于L1-通用大模型,在此基础上加入行业数据训练出L2-行业/垂直大模型,如金融、编程大模型。针对重要场景,在L1或者L2模型基础上finetune,实现L3大模型。最后Agents可以调用L1-L2-L3任何一层的模型形成完整的一个特定任务。

针对大模型的幻象问题和用户数据安全问题,孟子大模型提出了改进的RAG能力。通过孟子大模型理解用户意图,可分别经过大模型自身,或者通过RAG查找用户知识库,甚至通过Web搜索,最后多路召回搜索结果,经过排序输出最可信结果。

在总结阶段,周明博士强调大模型创业所需要的生态环境非常重要, 澜舟一方面聚焦自己擅长的能力和场景,另外一方面会注重与开源社区、与客户和合作伙伴携手共进,共同拓展更广阔的市场空间,实现互惠共赢的局面。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”

在孟子通用大模型这“一横”之上,澜舟科技合伙人、首席产品官李京梅向与会观众详细介绍和发布了“一横N纵”的应用能力型产品,包括AI文档理解、文档问答、文档辅助写作、机器翻译、澜舟智会、AI搜索。

“创新落地,生态共赢”,澜舟科技提出大模型落地应用“九字诀”小编获悉,“澜舟AI搜索”已经在澜舟官网上线,用户可以上官网试用。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

美国打击华为芯片,阻止台积电等晶圆代工厂商向华为出货!

美国打击华为芯片,阻止台积电等晶圆代工厂商向华为出货!

美国对华为的施压还在继续。 2 月 18 日消息,据路透社报道,美国特朗普政府正在考虑制定一项政策,以完全切断全球主要芯片供应商向华为...

阿里巴巴国际站推出跨境外贸纾困十条

阿里巴巴国际站推出跨境外贸纾困十条

5月20日,记者获悉,为了帮助中小外贸商家应对全球新一轮疫情带来的阶段性困难,阿里巴巴国际站正式推出跨境外贸纾困十条,包括确定性商机保障、确定...

新生态,控无界 | 美控亮相中国国际智能建筑展览会

新生态,控无界 | 美控亮相中国国际智能建筑展览会

4月16日至18日,2023第六届中国国际智能建筑展览会在北京国家会议中心成功举行。作为国际级的智慧城市和智能建筑专业展会,此次展览会吸引了...

安思疆助力云象清洁消杀机器人安心抗疫

安思疆助力云象清洁消杀机器人安心抗疫

 新冠病毒奥密克戎变异株仍在全球快速蔓延,面对具有超强传播性的毒株,众多科技企业一同参与了这场守护人民生命健康的抗疫“硬仗”。2022年4月,云象商用机器清洁消杀机器人在杭州白马湖...

首销登顶!一加 Ace 2 斩获2022-2023安卓手机首销日销量冠军

首销登顶!一加 Ace 2 斩获2022-2023安卓手机首销日销量冠军

2月14日,一加中国区总裁李杰公布了一加Ace2首销成绩。一加 Ace 2 在京东天猫双平台首销日销量,超友商A+友商B日销量2倍,达到友...

百度地图发布五一景区热度排行:淄博八大局早市打败一众景点遥遥领先

百度地图发布五一景区热度排行:淄博八大局早市打败一众景点遥遥领先

五一假期,全国文旅全面复苏,势头火爆。根据百度地图发布的《五一景区热门排行榜》首日数据,本土景点包揽前十。爆红的“淄博烧烤”大本营——淄博张店...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。