为创意插上羽翼百度文心大模型产业落地加速

2022-04-26 14:30 中国发展网王晓涛

百度深度学习算法 AI技术自主创新

摘要：百度集团副总裁吴甜在接受媒体记者采访时预言：“今年将是文心大模型产业落地关键年。”她说，大模型已成为AI发展的新方向，百度文心大模型源于产业、服务于产业，是真正的产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展，打造了自主创新的AI底座，真正发挥大模型驱动AI规模化应用的产业价值。

中国经济导报、中国发展网讯记者王晓涛报道 “海鸥掠过蔚蓝的天空它告诉我这个夏季有一种思念无法释怀”，透过《海浪的呼吸》的歌词，你能在空旷的恬静中隐约感到夹杂着一丝幽伤。不过，歌词的作者并非是人，而是百度文心大模型基于“海滩”“闺蜜”“欢乐”三个词自动生成的。

随着数据井喷、算法进步和算力突破，效果好、泛化能力强、通用性强的预训练大模型(以下简称“大模型”），成为人工智能（AI）发展的关键方向与AI产业应用的基础底座。4月16日，2021百度认知AI创意赛“AI创意派”决赛正式举行，这是业内首次将先进的AI大模型能力开放给公众使用。

当天，在位于北京市海淀区的百度科技园，百度集团副总裁吴甜在接受媒体记者采访时预言：“今年将是文心大模型产业落地关键年。”她说，大模型已成为AI发展的新方向，百度文心大模型源于产业、服务于产业，是真正的产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展，打造了自主创新的AI底座，真正发挥大模型驱动AI规模化应用的产业价值。

大模型助力创意应用让更多人发挥创造力

元宇宙虚拟人生、AI版“反诈App”、续写一本小说、神奇植物都有啥……这些趣味DEMO（演示）和落地方案，均是由AI创意派参赛选手基于百度飞桨文心大模型开发创造的。据统计，本次AI创意赛共吸引了全国各地近2000名不同年龄、不同技术基础的选手参与其中，收集超过300份创意方案，作品覆盖教育、医疗、金融、娱乐、科技、心理健康等多个领域。最终，开发创意组9组选手脱颖而出闯入决赛，最终“说文”“图言”“AI起论文标题”等项目摘得大奖。

“创意在民间。AI和大模型要面向公众开放，只有门槛低到了所有人都可方便地用起来，才能真正大规模爆发出各种创意。这是文心大模型的努力方向。”吴甜在比赛现场表示，文心源于产业实践，也将在产业中广泛落地。本次创意赛中，选手展现了基于文心大模型的丰富创意，让我们看到了大模型广泛应用的前景。

11_副本

大模型相当于解决AI模型的通识教育。以前的模型训练需要标注数据，由于AI落地场景很多，每个场景都要采数据、标数据，在标注的数量和质量上，存在很大的瓶颈问题。吴甜认为，有了大模型的机制之后，很多无标注数据都可以用来学习，模型学习的数据越来越多，同时模型也越来越大。

吴甜强调，现在AI落地，已经不再局限于只是面向一些技术人员和开发人员，而是要面向公众了。她解释说：“世界上有技术背景的人开发人员只是少数，AI跟场景结合空间巨大，各个场景的相关人群非常广泛。创意在民间，只有技术门槛低到了所有的人都可以用，创意才会真正大规模爆发出来，这是必然趋势。”

攀登技术新高地深耕产业级大模型

近年来，国内外科技巨头如谷歌、微软、英伟达、百度等，相继在AI大模型领域展开探索。大模型的重要性在于——AI要真正发挥对产业升级转型的驱动力，需要与各行各业的特异性场景深度融合，而大模型正是支持AI低门槛应用于不同场景的通用力量。

大模型的出现，大幅降低了人工智能的应用门槛。其通过集中提供通用算法模型，打造技术底座，让大多数企业能够“站在巨人的肩膀上”，使标注数据更少、开发效率更高、应用成本更低。

据了解，负责百度AI技术平台与生态建设的吴甜，同时兼任深度学习技术及应用国家工程实验室副主任，实验室主任则是百度首席技术官王海峰。这个由百度公司牵头的实验室，2017年初由国家发展和改革委正式批复。去年7月，实验室通过了专家验收。

资料显示，百度自2019年开始深耕预训练模型研发。同年3月，百度率先发布中国首个正式开放的预训练模型ERNIE1.0，并持续投入于大模型的研发升级；2021年12月，ERNIE 3.0升级为全球首个知识增强千亿大模型——鹏城-百度·文心。目前，百度已成功打造文心大模型家族，多个大模型达到世界领先水平。

超大规模模型的训练和推理，给深度学习框架带来很大考验。依托百度飞桨平台，文心大模型解决了大模型训练过程中多个世界性难题，使大模型训练速度提升、模型效果更优。

基于百度飞桨平台与百舸集群，文心大模型在算法、框架、算力层面实现完全自主创新，百度通过大模型与国产深度学习框架融合发展，为中国产业智能化转型打造AI大底座。

大幅降低应用门槛助力产业规模化应用

随着大模型的价值凸显，由国内外科技巨头主导开发的大模型正在大量涌现。吴甜认为，大模型未来的发展趋势，一方面会继续出现技术创新，另一方面会在产业实用上有更多价值产生。

文心大模型作为产业级知识增强大模型，核心价值在于驱动AI的规模化应用。而对于其产业级的定位，吴甜解释说：“这有两重含义：一方面是模型产生的过程，跟产业应用紧密相关；另一方面是模型使用的时候，要有面向产业应用的配套工具和平台。”据介绍，为进一步降低AI应用难度，文心大模型为开发者提供了工具平台，配套易上手的大模型开发、轻量化、部署工具，通过降低门槛，让各行各业的开发者都能实现AI的应用。

文心大模型坚持一边做技术创新，一边做落地应用。目前，文心大模型已大规模应用于百度内部的各类产品，包括搜索、信息流、小度智能屏、百度地图等，显著提升了产品智能化体验。基于文心的开放能力，对外的日调量也超过了5000万次。

吴甜阐释了百度推进企业AI商业化的基本思路，即三个“赋能”：平台赋能、场景赋能和人才赋能。例如，在百度AI开放平台上，现在已经有近1400项AI能力开放给中小企业使用。以飞桨为代表的平台积累了大量的案例和示范，可以帮助企业进行场景挖掘。

据了解，文心大模型已通过飞桨开源开放平台、百度智能云等赋能工业、能源、金融、通信、媒体、教育等行业，个人、企业开发者数量超过6万。在保险领域应用中，文心大模型的智能解析能力，能使文本处理效率提升30倍；在人力资源领域应用中，文心大模型能实现候选人信息智能分类，模型识别准确率达到99%；在医疗领域应用中，文心大模型将每份病历的检查时间，从30分钟缩短到了秒级别。

而对于智能制造，吴甜表示大模型应用的场景主要有两大类：一是视觉场景，二是自然语言处理场景。前者主要是以计算机视觉技术为主的质检、巡检场景应用，后者主要是在数据积累和设备运维场景中要用到对语义的理解。

最后，吴甜表示，从AI核心技术到AI基础平台，百度将继续坚持技术创新及开放生态，不断降低AI技术开发和应用的门槛，并通过云平台、AI框架、大模型的融合发展，为各行各业的数字化、智能化转型打造厚实的基础设施。

责任编辑：王晓涛

为创意插上羽翼百度文心大模型产业落地加速

相关新闻

百度Apollo park全体验冬奥汽车机器人火炬手揭开神秘面纱

2021年我国航天发射次数居世界第一

全球前十最创新公司榜单公布，华为腾讯百度等中国科技企业入选

百度CTO王海峰：AI大生产平台再升级助力中国科技自立自强

李彦宏：中国迎来AI黄金十年，百度与超400万开发者共创AI工具箱

为创意插上羽翼 百度文心大模型产业落地加速

相关新闻

百度Apollo park全体验 冬奥汽车机器人火炬手揭开神秘面纱

2021年我国航天发射次数居世界第一

全球前十最创新公司榜单公布，华为腾讯百度等中国科技企业入选

百度CTO王海峰：AI大生产平台再升级 助力中国科技自立自强

李彦宏：中国迎来AI黄金十年，百度与超400万开发者共创AI工具箱

为创意插上羽翼百度文心大模型产业落地加速

百度Apollo park全体验冬奥汽车机器人火炬手揭开神秘面纱

百度CTO王海峰：AI大生产平台再升级助力中国科技自立自强