9月26“筑基 开放 燎原”为主题的2025人工智能计算大会(AICC 2025召开。百度首席技术官王海峰出席大会主论坛,现场解读大模型技术及产业应用。

百度首席技术官王海峰

王海峰指出,从技术角度,通用人工智能的曙光,可以从人工智能技术的通用性能力的全面性来理解技术的通用性方面,大模型在解决不同任务、语言、模态、场景的通用性都变得越来越好;能力的全面性方面,理解、生成、逻辑、记忆是人工智能的四项基础能力,其他各项人工智能的典型能力基本上都是这四项基础能力的综合运用。这四项能力越强,越接近通用人工智能。

以文心大模型为例,自2019年3月发布文心大模型1.0版本以来,现已升级到文心大模型4.5 Turbo。9月初,百度还发布了文心大模型X1.1深度思考模型,并开源文心思考模型ERNIE-4.5-21B-A3B-Thinking。

大会现场,王海峰介绍到,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习同时提升通用任务和智能体任务的效果另一方面通过自蒸馏数据迭代式生产训练不断提升模型整体效果。相比文心X1X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%

公开资料显示,多个权威基准评测中,文心X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势同时,与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。ERNIE-4.5-21B-A3B-Thinking在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近SOTA的智能表现。HuggingFace官网数据,文心思考模型ERNIE-4.5-21B-A3B-Thinking开源后,即在HuggingFace全球模型总趋势榜和文本模型趋势榜均排名第一。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。据了解,飞桨支撑超大规模自适应分布式深度学习训练,万卡集群上大模型有效训练时间占比达到98%,通过大模型压缩、推理、服务部署全链条协同优化,实现低时延、高吞吐的大模型推理。此外,飞桨持续积极开展硬件统一适配,已支持超过60个系列芯片,为算力的多元化提供了有力保障

现场,王海峰分享了基于文心大模型的最佳实践——剧本驱动多模协同的数字人技术。文心大模型4.5系列支持多模态能力,以剧本驱动,语言、语音与视觉协同,实现超拟真数字人生成。通过大语言模型生成剧本,再驱动语音与视觉输出,数字人可自然播报台词、表现表情和动作。百度基于剧本驱动的多模协同技术,实现了语言、声音和形象的高度协调,为数字人及虚拟内容创作提供了强大支撑。

早前有公开报道显示,在百度数字人应用实践中,数字人直播线上表现超过了真人。罗永浩数字人直播首秀GMV更是突破行业新纪录,部分核心品类带货量超过真人直播。

在产业应用面,百度文心大模型与飞桨深度学习平台已在多个关键场景落地并取得成效。以智能翻译为例,百度翻译自2011年上线以来,已服务全球用户十余年,每天翻译字符量超过千亿。借助文心大模型,翻译能力全面升级,除了支持200多种语言的互译外,还新增了审校、润色、术语查证等功能,并在论文翻译等专业领域表现突出,进一步拓展了翻译的应用价值在智能代码辅助方面,百度每日新增代码量中已有超过45%由大模型生成,大幅提升了研发效率。文心大模型不仅能够生成高质量代码,还可在规划、调试、测试等全流程中发挥作用,并已应用于多智能体的自主协同开发,为工程师提供全方位助力。

飞桨平台也在智能工业设计电力行业等多个场景展现价值。智能工业设计领域,高铁外形仿真设计周期由“天级”缩短至“秒级”;在电力行业,飞桨文心大模型昆仑芯助力南方电网实现全栈自主可控的新型电力系统,打造我国首个自主可控电力大模型,覆盖输电、配电、客服、规划等十余个领域百余个应用场景,支撑智能巡检、智能客服与负荷预测,推动行业智能化升级。

随着技术的不断演进和生态的日益完善,人工智能将在更多领域释放潜力,推动产业智能化迈向更深、更广的发展阶段。文心与飞桨所代表的人工智能技术,已经在工业、农业、能源、金融、通信、教育等多个行业广泛落地,展现出切实价值,也为产业升级提供了坚实支撑。最新数据显示,飞桨文心生态开发者达到2333万,服务企业达到76万家。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐