大模型落地的故事,离「千行百业」又近了一点
当科技的脚步踏入人工智能时代,一项技术创新带来的变革能够深入千行百业,离不开其底层的通用性、能实现自动化生产的能力。过去半年中,由 ChatGPT、GPT-4 等为代表掀起的浪潮中,大模型在解决多项任务中的通用能力,让人们看到了智能时代 AI 大规模落地的可行性。
据不完全统计,当前国内已发布超过 80个大模型产品,对应不同行业、不同应用场景,各个大厂和研究机构纷纷加入资源竞赛的大模型游戏,“百模大战”正如火如荼地进行。
而现实的情况是,训练成本高的基础大模型在满足细分场景下的特定需求上正显示出“牛刀小用”的短板,同时,在专业领域问题的表现上、甚至会出现模型“一本正经地胡说八道”的幻觉。有业内人士就指出,ChatGPT 给出的结果正确与否、需要交由专业的人去判断。
业界对大模型的应用需求井喷,但面对基础大模型在生产环节的准确率相对较低、能力表现不匹配等情况,为 AI 的“iPhone 时刻”而沸腾的从业者们也不得不被迫“降温”。
在大模型落地的讨论中,几个重要的问题亟需获得解答:AI 的通用性是否被高估?什么样的大模型,才能称得上智能生产力?行业需要怎样的大模型和服务?
下一轮竞赛的决胜手
2002 年诺贝尔经济学奖得主 Daniel Kahneman 在其书《Thinking Fast And Slow》中,提出人类的两种思考模式,第一种是以直觉判断为主的“快思考”,第二种是“慢思考”,需要进行大量的推理和计算。
大模型与以往人工智能技术的不同之处,就在于它采用了第二种“慢思考”的模式,在与人类的交互中不断学习,进而获得更好解决问题的能力。
由此,过去四个多月里,国内也出现了一批追赶 ChatGPT 热潮的对话交互类大模型,以满足 C 端用户娱乐、创作等基础需求,应用在如聊天、语句优化、文案创作等通识属性较强的场景上。
当我们将大模型能力迁移到需求更大的产业领域中,不可避免地会遇到更低频、长尾的复杂场景和大规模协同的需求。这些场景由于样本少、数据分布不均,也意味着在相应的研发上要支付更高昂的成本,通用大模型的优势由此显现。
然而事实上,尽管大模型落地的呼声高涨,但在解决专业知识领域的问题表现上仍有不足之处,关于 AI 通用能力是否被高估的讨论重回焦点。
一位从事数据结构化模型研发负责人告诉AI 科技评论,具备知识图谱、能对行业知识和数据进行提炼的小模型,在专业领域中的能力一定会超过大模型。
以银行场景中的基金对账单托管业务为例,通用大模型可以对结构化信息进行提取和一定的推理,但由于市场中基金公司众多,往往每家公司的账单样式都不相同,加之复杂的表格和图文呈现方式,因此,模型的通用能力在解决特定信息、非结构化数据的抽取需求上,效果也会大打折扣。
再比如煤矿开采流程,煤矿井下重视生产安全,不便于异常样本的人工制造 ,只能在过往案例中去学习,因此也就存在不够精准的问题。专业人士指出,“大模型在专业知识领域大概只能做到百分之六七十的准确率,外行人看着可能觉得效果不错,但在内行人看来是无法使用的。”
在行业生产环节中,95% 是一个标准,企业对模型容忍度低、精度和效率要求更高,通用大模型的局限性问题愈加显现。
这决定了行业 Know-How 在生成内容中所起到的关键性作用。
人类从生活和工作中积累经验、凝结出智慧,将行业领域知识注入模型当中,提升模型对知识的记忆和推理能力,可以有效填补基础模型和场景之间的认知鸿沟。
“知识增强型”行业大模型已成为产业共识,是更接近人类大脑、释放智能生产力的 AI 落地范式。
中国工程院院士邬贺铨也表示,Chat类的大模型引发新一轮热潮,但对话、写诗、作画绝不是大模型的全部。“我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的大价值,去真正意义大规模服务社会。”
一个形象的比喻是,通用大模型更像大学,但它不会统治一切,行业大模型是不同科目培养出来的千千万万个大学生,它们所做的事情是怎么“学以致用”,与实体产业深度融合。
也即是说,行业大模型是构建在基础大模型的能力之上,具备一定的通用能力、能覆盖多任务使用场景,还结合了行业 Know- How 或引入知识图谱、有解决专业领域问题能力。
正如上述银行场景,一个理想的设想是,不具备模型构建能力的企业既能以调用通用大模型对话、生成等全部能力,也可以结合自身需求和特定场景,将有 OCR 专业知识和数据的产品应用在解决智能文档识别与处理的各类垂直难题上。
目前,业内一个普遍的看法是,未来业内只会有两三家大模型独大,与产业更近的行业大模型才是主流方向。行业人士预测,接下来几个月内,行业大模型也将迎来一波密集的发布热潮。
据陆奇在 6 月奇绩创坛春季创业路演上分享的项目数据显示,创业营最终录取的 60 个项目中,大模型项目共 39 个,占比高达 65%,绝大部分都是围绕行业大模型应用展开。
可以看到,行业大模型的故事才刚刚开始,但各路玩家们已经对其寄予了不小的期待。
向行业更深处
据 2022 年工信部发布的《国家人工智能创新应用先导区“智赋百景”》通知显示,在公共安全、交通运输等九大 AI 落地领域中,制造、农业、能源、金融、医疗作为我国重要经济支柱,虽然贡献多、但尚属于 AI 落地未开发领域,场景渗透率较低。
例如在铁路领域中,当前,我国铁路营业里程 15.5 万公里,铁路货车超过 100 万辆,为了保障货车运行的安全性,货车运行故障动态图像检测系统(TFDS、Trouble of moving Freight car Detection System)被广泛应用。但受制于技术发展,TFDS 仍采用人工方式进行故障识别。
假设货运列车通常编组为 60-100 辆一组,每套 TFDS 对应 5 个拍摄点位,每辆车/每节车厢拍摄约 80 张图片。以平均每列车 50 辆车厢计算,每列车拍摄图片就多达 4000 张,并且需要检测人员在 10 分钟左右时间看完,不仅人力成本高,人力劳动强度也很大,这种重复性、高强度的判断工作极其导致疲劳监测情况的发生,进而导致误判。
大模型的产业化尚任重道远,但行业对落地的诉求已十分迫切。
华为云人工智能领域首席科学家田奇在4月高峰论坛上作《AI for Industries,赋能千行百业智能升级》演讲
中国工程院院士李伯虎近日也明确指出,制造业是国民经济的主体,特别期望AI大模型能加强制造业“技术、产业、应用”的进一步融合,研发面向制造业的AI大模型技术,为我国制造业的数字化转型与智能化升级,进而为实现我国迈入制造强国的伟大战略目标做出新的重大贡献。
在这一背景下,自带场景、数据和用户的行业、产业客户成为了大模型公司相互争夺的资源,而对深入实体产业当中的企业来说,选择与具有自研能力的厂商合作,也省去了他们大量研发模型的资源和时间成本。
目前,面向大模型的行业和产业客户,市场上所提供的合作方案主要有以下几类:一是提供算力服务;二是提供通用大模型的底层设施,企业可以在平台上使用自己的垂类数据训练行业大模型;三是定制化服务的行业大模型;此外还有其他的配套服务,如云计算、AI 框架等。
总体来说,就是从最底层的算力存储和网络、到上层的机器学习平台、再到配套模型与服务,将每一个需求和反馈都顺畅地传递到大模型技术及应用的每个环节,提供一套完整的解决方案。
而站在企业的视角上,能够深入行业、进入生产环节的大模型还需要考虑两个问题。首先是私有数据的安全问题,行业大模型想要效果表现好,离不开企业提供足量、质量够高的数据来支撑模型训练要求,这也是为什么多数企业通常选择私有化部署的原因;第二则是成本可控,企业购买大模型服务远不止模型前期的训练和微调成本,还包括了框架、算力等整套服务以及后期运维等。
如今,市面上大模型产品众多,企业也亟需从大模型的商业化狂潮中回归冷静,用性价比最优的方式选择最佳的合作对象。
华为云盘古大模型将至
能否带来新惊喜?
7 月 7 日,华为开发者大会2023(Cloud)将在东莞拉开帷幕。据此前公布的主题演讲议程来看,华为云盘古大模型将迎来重大升级,明确定位“为行业而生”;其中,华为常务董事、华为云 CEO 张平安就“一切皆服务,AI重塑千行百业”进行主题演讲,华为云人工智能领域首席科学家田奇、华为诺亚方舟实验室主任姚骏也将首次揭秘盘古基础大模型的全栈创新、以及行业大模型的“炼成术”。
自四五月份以来,各大厂商和创业公司的大模型层出不穷,相较之下,华为却显得颇为低调,对外几乎没有透露任何关于盘古大模型升级的消息。在 4 月人工智能大模型技术高峰论坛(下称“高峰论坛”)上,田奇现身会场,对备受瞩目的类 GPT 模型未提及过多细节,更多聚焦在大模型的应用范例介绍,这也令外界颇感不及预期。
华为入场越晚,用户审视的目光也会越挑剔。但当我们开始探究华为“姗姗来迟”背后的原因时却发现,华为在大模型的探索并非刚刚开始,相反,早于 ChatGPT 和大模型火起来之前,华为已经组建起以田奇为核心的大模型人才团队。
2020 年 9 月,盘古大模型立项,彼时确定了三个核心设计原则:一是模型要大、能吸收海量数据,二是网络结构要强、从而真正发挥出模型的性能,三是要具备优秀的泛化能力、能落地到各行各业的工作场景中。
到了 2021 年 4 月,在华为云盘古视觉(CV)大模型对外公布的同一时间,结合行业数据打造系列 CV 行业大模型已经实现了在医疗影像检测、工业缺陷检测和遥感影像分析等多场景中应用,通过模型蒸馏、抽取实现行业场景的适配。
可以说,华为是国内最早加入大模型竞赛、并已经将行业大模型落地的厂商之一。
据田奇在高峰论坛的演讲中提到,华为云将盘古大模型分为了三级:
- L0,基础模型,例如GPT-3、GPT-4等这类无法直接应用,需要同相应的行业和场景数据结合训练的行业大模型
- L1,行业模型,这类模型可直接在具体细分场景中进行部署
- L2,细分场景模型
田奇表示,如何从行业大模型 L1 中快速生产高质量的部署模型(细分场景模型)L2 并部署到端、边、云侧就成了一个重要课题。
MaaS(模型即服务)时代,传统产业和企业在大模型的冲击下正迎来变革性的升级再造,“云智一体”成为共识,集齐资金、人才、数据等优势,向上对接研发和算法工程师、个人开发者等,向下为底层软硬件厂商提供服务。
对华为云来说,这也意味着,基于 AI 与云的深度融合,云服务为盘古大模型提供计算资源,企业客户也有了更多 AI 大模型和集成服务的选择,甚至是自上而下全套的 AI 解决方案。
此外,大模型要走向工业大生产,AI 芯片、框架、机器学习平台以及数据、应用等等,都缺一不可。
2022 年 8 月,美国政府签署《2022年芯片和科学法案》,在半导体领域对中国发起的限制日渐升级;而伴随着大模型推升了对算力的狂热需求,公开数据显示,近 5 个月以来,英伟达芯片价格累计涨幅已高达 37.5%, GPU 交货周期也被拉长,需要3个月甚至更长时间。对此,华为在近日也宣布,将于7月份发布面向 AI 大模型的新款存储产品。
经过多年的发展,华为已积累了大模型走向行业落地的全栈技术,包括 AI 芯片、AI 框架Mindspore、以及全流程支持 MLOps 的 AI 平台 ModelArts 等,一应具全。
同时,华为也积累了丰富的大模型行业实践。例如,在复杂、危险性较高的煤矿生产工作中,华为云去年推出了盘古矿山大模型,只需导入海量无标注的矿山场景数据,即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务流程下的 1000 多个细分场景。
煤矿行业中存在着场景需求多、矿山间复制难、场景落地难、AI人才不足等挑战,目前 300 米井下仍需大量人员现场作业,面对这一紧迫的需求,如何用 AI 实现“少人无人”的安全高效作业成为煤矿智能化追求的重要目标。
例如,主运系统是煤矿生产的生命线,一旦发生故障,将直接导致停工停产,每天减产几万吨。过去,主运系统十分依赖人工巡检,矿工需要每天走 10 到 20 公里巡检,皮带距离长,周围环境也很恶劣,工作量极大。
但在引入盘古矿山大模型后,AI 代替人成为了主运智能监测系统的眼睛,能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%;同时,全时段的巡检也能进一步帮助工作人员及时地发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。
此外,在掘进场景中,基于盘古矿山大模型的掘进作业序列智能监测可用于替代不确定的人工流程,动作规范识别准确率超过95%,以保障井下作业安全。
可以看到,华为的行业大模型已经勾勒出未来工业化智能生产时代的雏形,在水面之下,是基于大模型底层技术体系、深入行业领域知识向更多产业层面的延伸和探索。
那么,在这次华为开发者大会上,华为云能带来哪些盘古大模型的新升级,值得期待。
基于新的技术底座,在国际人工智能竞争愈发激烈的当下,大模型浪潮带动产品、服务、行业等多方位变革已是不争的事实。接下来的竞赛,不再是局限于大模型技术的追逐,在 AI 深入产业的视野中,千行百业也正迎来巨大的想象空间。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!