百度CTO王海峰：知识增强大语言模型具备人工智能的四项基础能力-电子发烧友网

9月21日，由科学技术部、中国工程院、清华大学共同发起主办的长城工程科技会议“人工智能赋能高质量发展”主题大会在清华大学召开。科技部党组书记、部长王志刚、清华大学党委书记邱勇致辞，中国工程院潘云鹤院士、中国科学院张钹院士等多位学术界、产业界专家围绕人工智能技术前沿与产业发展分享了真知灼见。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以《人工智能技术生态与产业模式》为题作主旨报告。会上，王海峰表示，人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的核心基础能力，这四项能力越强，越接近通用人工智能，而大语言模型具备了这四项能力，为发展通用人工智能带来曙光。

早在2019年，王海峰就曾提出，深度学习具有很强的通用性，并具备标准化、自动化和模块化的工业大生产特征，推动人工智能进入工业大生产阶段。四年来，深度学习技术和应用的发展充分验证了这一观点。深度学习技术的通用性越来越强，深度学习平台的标准化、自动化和模块化特征越来越显著，而预训练大模型的兴起，使得人工智能应用的深度和广度进一步拓展，技术生态更加完善。人工智能已进入工业大生产阶段。

标准化方面，框架和模型联合优化，多硬件统一适配，应用模式简洁高效，大幅降低人工智能应用门槛；自动化方面，从训练、适配，到推理部署，提升人工智能研发全流程效率；模块化方面，丰富的产业级模型库，支撑人工智能在广泛场景的便捷应用。

据了解，得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进，贯通了深度学习全产业链，飞桨生态愈加繁荣，已凝聚800万开发者，服务22万家企事业单位，基于飞桨创建了80万个模型。伴随大模型的发展，百度推出了星河大模型社区，寓意“文心加飞桨，翩然赴星河”，与开发者共享共创大模型生态。

王海峰表示，人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的核心基础能力，这四项能力越强，越接近通用人工智能，而大语言模型具备了这四项能力，为发展通用人工智能带来曙光。

具体而言，人工智能的典型能力如创作、编程、解题、规划等都依赖于理解、生成、逻辑、记忆等核心基础能力，依赖程度有所不同。以解题为例，从读懂题目、解答题目到最后写出答案，需要理解、记忆、逻辑及生成能力的综合运用。

知识增强大语言模型文心一言充分验证了这一点。在训练数据规模和参数规模相同的情况下，纯中文模型比多语言模型生成能力强，理解和逻辑能力弱。文心一言首先从数万亿数据和数千亿知识中融合学习得到预训练大模型，在此基础上采用有监督精调、人类反馈的强化学习和提示等技术，并具备知识增强、检索增强和对话增强等技术优势。在检索增强和知识增强的基础上，通过知识点增强，提升对世界知识的掌握和运用；通过逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络，提升逻辑推理能力。进一步地，通过多种策略优化数据源及数据分布、基础模型长文建模、多类型多阶段有监督精调、多任务自适应有监督精调、多层次多粒度奖励模型等技术创新，全面提升基础通用能力。

效率方面，通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化，文心大模型训练速度达到原来的3倍，推理速度达到原来的30多倍。根据人民数据、新华网等多个公开测评，文心大模型3.5支持下的文心一言综合能力超过ChatGPT，遥遥领先于国内其他大模型。IDC《AI大模型技术能力评估报告，2023》显示，文心大模型3.5拿下12项指标的7个满分，得到“综合评分第一，算法模型第一，行业覆盖第一”三个绝对第一。

IDC《AI大模型技术能力评估报告，2023》：百度获算法模型、行业覆盖唯一满分

应用方面，通过数据驱动、提示构建，以及插件增强进行场景适配，协同优化。文心一言已上线百度搜索、览卷文档、E言易图、说图解画、一镜流影等原生插件，使模型具备生成实时准确信息、长文本摘要和问答、数据洞察和图表制作、基于图片的创作和问答、文生视频等能力。插件机制扩展了大模型能力边界，更适应场景需要。

数据显示，文心一言在8月31日率先面向全社会开放服务，首日回答了网友3342万个问题，细分应用场景丰富，包括文案创意、教育咨询、代码生成等，目前已有15万企业和2万多插件开发者申请接入。

面对大模型产业化的挑战，王海峰表示，类似芯片代工厂，可以采用“集约化生产，平台化应用”的模式，即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务。这一产业化路径已在文心大模型产业实践中得到验证，百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型。以文心一言等大语言模型为代表的人工智能正在深入千行百业，加速产业升级和经济增长。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47183

浏览量
238257
语言模型

语言模型

+关注

关注
0

文章
520

浏览量
10268
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121111

原文标题：百度CTO王海峰：知识增强大语言模型具备人工智能的四项基础能力

文章出处：【微信号：baidu_2000，微信公众号：百度】欢迎添加关注！文章转载请注明出处。

李彦宏宣布：百度文心大模型日调用量超15亿

在百度世界2024大会上，百度公司创始人李彦宏宣布了一项令人瞩目的数据：百度文心大模型的日调用量已经超过15亿次。这一数据不仅彰显了

发表于 11-12 10:40 •201次阅读

百度小度将发布AI智能眼镜

近日，有知情人士透露，百度旗下的人工智能品牌小度计划在即将举行的百度世界大会上推出一款全新的AI智能眼镜。这款眼镜将内置先进的

发表于 11-11 14:50 •406次阅读

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

在科技飞速发展的今天，人工智能（AI）技术已成为推动社会进步的重要力量。6月28日，百度公司再次站在了AI技术的前沿，其首席技术官、深度学习技术及应用国家工程研究中心主任王海峰，在WA

发表于 06-29 16:03 •627次阅读

百度WAVE SUMMIT深度学习开发者大会,文心大模型4.0 Turbo震撼发布

及应用国家工程研究中心主任王海峰正式发布了文心大模型4.0 Turbo，标志着百度在人工智能领域的又一重大突破。

发表于 06-28 16:30 •472次阅读

百度智能云升级3款大模型应用：面向三类场景打造企业“超级员工”

6月25日，“AI Cloud Day：百度智能云大模型应用产品发布会”在北京举行。会上，百度智能云面向

发表于 06-25 19:22 •1086次阅读

百度智能云推出“千帆行业增强版”

在近日于北京举办的2024智能经济论坛上，百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度在人工智

发表于 05-30 09:30 •574次阅读

【大语言模型：原理与工程实践】揭开大语言模型的面纱

丰富的常识知识，能够基于常识进行推理，填补信息空白，并作出合理推断。随着训练规模和参数量的增加，大语言模型的推理能力将持续提升，为解决实际问题和推动

发表于 05-04 23:55

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》

《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言

发表于 04-30 15:35

百度王海峰：百度人工智能专利申请量、授权量国内第一

2024年4月25日，在第24个世界知识产权日来临之际，百度举办“专利运用赋能AI产业高质量发展”论坛。

发表于 04-26 09:32 •401次阅读

王云鹏发布全员信，重塑百度智能驾驶核心战略

将致力于四项重要任务——建立可应用的自动驾驶基础模型、实现萝卜快跑盈利并探索商业模式、提升智驾智舱产品的用户体验和性价比优势、以及推动百度地图在差异化竞争中的市场份额增长。

发表于 04-19 10:11 •435次阅读

百度首席技术官王海峰解读文心大模型的关键技术和最新进展

4月16日，以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基，星河璀璨”为题，发表演讲，解读了

发表于 04-18 09:20 •691次阅读

东莞与百度签署战略合作协议，推动人工智能的全场景应用落地

3月22日，东莞市人民政府与百度签署战略合作协议，双方将紧密围绕人工智能产业发展，充分发挥百度在 AI 算法、云计算、大数据、自动驾驶技术等方面的优势，推动人工智能的全场景应用落地。

发表于 03-25 10:05 •843次阅读

【有奖】百度智能云度目推出首款多模态 AI 模组，应用场景有奖征集！

他来了，他来了大模型时代悄然到来百度首款大模型落地的硬件产品度目多模态AI模组LUCA系列正式亮相度目LUCA深度集成

发表于 02-26 15:19 •537次阅读

百度起诉“文心一言”公司涉嫌商标侵权，不正当竞争纠纷即将开庭

公告中指责对方涉嫌商标侵权，引发了一场涉及人工智能领域的法律大战。据了解，百度公司推出的“文心一言”是一款知识增强大语言

发表于 02-06 11:44 •1643次阅读

百度搜索推出AI拜年新能力

随着人工智能技术的迅猛发展，百度搜索始终站在技术前沿，致力于为用户提供更加智能化、便捷的服务。百度搜索重磅推出了AI拜年新能力，在春节期间，

发表于 02-05 10:54 •6104次阅读

搜索历史

百度CTO王海峰：知识增强大语言模型具备人工智能的四项基础能力

评论

李彦宏宣布：百度文心大模型日调用量超15亿

百度小度将发布AI智能眼镜

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

百度WAVE SUMMIT深度学习开发者大会,文心大模型4.0 Turbo震撼发布

百度智能云升级3款大模型应用：面向三类场景打造企业“超级员工”

百度智能云推出“千帆行业增强版”

【大语言模型：原理与工程实践】揭开大语言模型的面纱

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》

百度王海峰：百度人工智能专利申请量、授权量国内第一

王云鹏发布全员信，重塑百度智能驾驶核心战略

百度首席技术官王海峰解读文心大模型的关键技术和最新进展

东莞与百度签署战略合作协议，推动人工智能的全场景应用落地

【有奖】百度智能云度目推出首款多模态 AI 模组，应用场景有奖征集！

百度起诉“文心一言”公司涉嫌商标侵权，不正当竞争纠纷即将开庭

百度搜索推出AI拜年新能力