李彦宏：开发大模型，百度踩了无数坑，交了高昂学费

文/侯煜

编辑/吴妍

今日，Create 2024百度AI开发者大会在粤港澳大湾区举办。面对现场来了5000多位开发者和科技爱好者。百度集团创始人李彦宏跟创业者、开发者交流，分享了自己对大模型和生成式AI的洞见。

大模型和生成式AI，将彻底改变开发者

李彦宏认为，过去，开发者用代码改变世界；未来，自然语言将成为新的通用编程语言，你只要会说话，就可以成为一名开发者，用自己的创造力改变世界。

“这一天并不遥远，我们看到，因为有了强大的基础大模型，有了很多低门槛，甚至零门槛的开发工具，开发者的生产力大大提高了”。

李彦宏举例，基于文心大模型的智能代码助手Comate，不仅支持100多种语言和所有主流IDE平台，可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案，还可以深度解读代码库、关联私域知识生成新的代码。上岗一年多，Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业，生成的代码采纳率达到了46%，百度每天新增的代码中，已经有27%是由Comate生成的。

李彦宏对开发者说：“今天，你不会写代码，也可以做出一个AI应用；不用编程，也可以做出一个智能体。AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。”

基于大模型，百度开发各种应用工具

作为一家技术公司，百度的角色定位，就是尽可能地为大家提供所需的开发工具。具体来说，就是提供1个强大的基础模型系列，就是文心大模型系列，这包括旗舰版的ERNIE3.5， ERNIE4.0，也包括轻量版的ERNIE Speed、Lite、Tiny等等。

李彦宏介绍，百度还提供基于大模型来开发各种应用的工具，包括：

Ø 智能体开发工具AgentBuilder，

Ø AI原生应用开发工具AppBuilder，

Ø 各种尺寸的模型定制工具ModelBuilder。

以上这三个工具，都代表了先进生产力。

文心一言用户突破2亿

文心一言从去年3月16日发布，到今天是一年零一个月的时间。其用户数突破了2亿，API日均调用量也突破了2亿，服务的客户数达到了8.5万，利用千帆平台开发的AI原生应用数超过了19万。（详见：《文心一言毁誉参半，却成为百度业绩增长新杠杆》）

李彦宏指出，文心一言正在改变更多人的工作和生活。

支撑文心一言的基座模型，就是文心大模型。过去一年，文心一言经历了从3.0版本到3.5，再到4.0版本的进化。文心4.0在理解、生成、逻辑、记忆四大能力方面，均达到了业界领军水平。

近几个月来，文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升，达到国际领先水平。

今天，我们正式发布文心大模型4.0的工具版，现在，大家可以在工具版上，体验代码解释器功能，通过自然语言交互，就能实现对复杂数据和文件的处理与分析，还可以生成图表或文件，能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。

不仅如此，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。

也就是说，客户原来一天调用1万次，同样成本现在可以调用100万次。媒体可能不会因为成本下降99%而兴奋。但是企业也好，开发者也好，一旦用起来，最关注的就是效果和成本。

我们能在提升性能的同时，把推理成本降到1%，正是因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局，通过端到端优化，不断地把成本打下来，让更多人都可以高效、低价地用大模型来做AI应用。

李彦宏特别强调，大模型本身并不直接创造价值，基于大模型开发出来的AI应用才能满足真实的市场需求。百度在过去一年大模型的实践中，踩了无数的坑，交了高昂的学费。（详见：《敢打仗的景鲲离场，百度硬件生态战略该叫停！》）之后李彦宏向开发者分享了基于大模型开发AI原生应用的具体思路和工具。

Ø 第一是MoE。未来大型的AI原生应用基本都是MoE架构，这里所说的MoE不是一般的学术概念，而是大小模型的混用，不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型，这都是有技术含量的，要针对应用的不同场景做匹配。

Ø 第二是小模型。小模型推理成本低，响应速度快，在一些特定场景中，经过SFT精调后的小模型，它的使用效果可以媲美大模型。百度Speed，Lite、Tiny三个轻量模型的原因。

Ø 第三是智能体。智能体是当下很热的一个话题，随着智能体能力的提升，会不断催生出大量新的应用。智能体机制，包括理解、规划、反思和进化，它让机器像人一样思考和行动，可以自主完成复杂任务，在环境中持续学习、实现自我迭代和进化。在一些复杂系统中，我们还可以让不同的智能体互动，相互协作，更高质量地完成任务。这些智能体能力，我们已经开发出来了，并且向开发者全面开放。

在MoE、小模型、智能体这三个方向上，百度都已经给大家做好了“开箱即用”的工具。分别是：智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

Apollo视觉感知大模型应用到了制图领域

李彦宏介绍，基于超过1亿公里的、中国复杂城市道路测试里程数据，百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。

百度地图也率先将视觉感知大模型应用到了制图领域。现在，全球最大规模的车道级地图数据，已经上线全国360座城市。只要百度地图导航能去的地方，智驾就都能开。（详见：《四维图新诉百度侵权案落锤，地图生意单打独斗有多难？》）