杨立昆团队将世界模型塞进了代码生成，AI也能一边写一边“调试”代码了

FAIR发布了全球首个代码世界模型（CWM），把“世界模型”（World Model）用在了代码生成上。Meta旗下的人工智能研究部门FAIR（Facebook AI Research）发布了全球首个代码世界模型（CWM），把“世界模型”（World Model）用在了代码生成上。传统的代码模型，通过看海量的代码，学到的是“别人一般这么写”。而CWM的思路，是通过模拟代码运行时内部发生的一切，预测

普通网友

281人浏览 · 2025-09-29 17:20:04

普通网友 · 2025-09-29 17:20:04 发布

FAIR发布了全球首个代码世界模型（CWM），把“世界模型”（World Model）用在了代码生成上。

Meta旗下的人工智能研究部门FAIR（Facebook AI Research）发布了全球首个代码世界模型（CWM），把“世界模型”（World Model）用在了代码生成上。

传统的代码模型，通过看海量的代码，学到的是“别人一般这么写”。

而CWM的思路，是通过模拟代码运行时内部发生的一切，预测每一行指令下去，程序的状态会变成什么样。这样一来，模型在写代码的时候，脑子里就像有个小型沙盒在不断预演“调试”代码。它会一边写，一边想，“我下一步这么写，那个变量会变成啥？会不会崩？”，从而动态调整，写出更靠谱的代码。

这模型是怎么炼成的

要让模型有这种“预判”能力，光靠“读万卷码”是不够的，还得“行万里路”，亲眼看代码是怎么跑的。

Meta给CWM设计了一套三段式的训练流程。

“预训练”（Pre-training）找了8万亿（8T）个tokens的通用代码和自然语言资料，先让模型把基础打好，学会认字、组词、造句，对代码有个基本的理解。

“中段训练”（Mid-training），模型不再是简单地看静态代码了，而是开始大规模观摩代码的“现场直播”。Meta准备了超过3万个可执行的Docker容器镜像，这玩意可以理解为一个个打包好的、真实的软件运行环境。然后，他们让超过2亿条Python程序在这些环境里跑起来。

跑的时候，CWM全程在旁边盯着。它记录下程序内存里发生的一切，形成所谓的“内存轨迹”（memory traces）。比如一个变量被赋值了，一个函数被调用了，一个列表的元素被修改了，甚至程序抛出了一个异常，这些细节全都被CWM看在眼里，记在心里。

这就像让一个医学生不光背诵理论，还直接把他扔到手术室里，观摩成千上万台手术，看主刀医生怎么处理各种状况，看病人的生命体征如何变化。

训练数据里还包括300万条模拟的智能体交互轨迹。在这些轨迹里，模型需要自己尝试和文件系统、解释器这些计算环境打交道，完成一个个小任务，在一次次交互和试错中，学习行为和结果之间的因果关系。

经过这个阶段5万亿tokens数据的“熏陶”，CWM逐渐就有了“代码感”，也就是对代码执行动态的理解能力。

“后训练”（Post-training）阶段则包含监督微调（SFT）和强化学习（RL）。监督微调主要是教模型如何更好地理解和遵循人类的指令。而强化学习则更有意思，它不是靠人来打分（RLHF），而是靠环境来反馈。

比如，让CWM去修复一个bug，修复成功了，单元测试通过了，环境就给它一个“奖励”；修复失败了，就给个“惩罚”。让它去证明一道数学题，证明对了，奖励；证错了，惩罚。这种来自环境的、可验证的奖励信号，比人的主观判断要客观、高效得多，也更容易规模化。

通过这种方式，CWM的各项专业技能被进一步打磨，最终成型。

它的身体构造有何不同

CWM是一个拥有320亿（32B）参数的“大块头”，属于稠密（dense）架构模型。

它最长能处理131,072个tokens的上下文，这意味着它可以一口气读完一个非常非常长的代码文件，理解里面的来龙去脉，这对于处理复杂的现代软件项目至关重要。

在最核心的注意力机制上，CWM也玩了点新花样。它没有一视同仁，而是创新地把局部注意力和全局注意力结合起来用，并且按3:1的比例交替进行。

局部注意力的“视野”是8192个tokens，负责精读一小段代码里的细节。全局注意力的“视野”则拉满到131,072个tokens，负责鸟瞰整个代码文件的宏观结构。

这种设计很聪明，就像我们读一本书，既要仔细看懂当前这一页的字句，也要时不时抬头想想这一章和前后章节的联系。这样既能高效处理局部逻辑，又不会丢失长距离的依赖关系，比如一个在文件开头定义的函数，在文件末尾被调用了，模型也能捕捉到。

为了在保持高性能的同时省点力气，CWM还用了分组查询注意力（Grouped-Query Attention, GQA）技术，算是一种在效果和计算开销之间的精明平衡。

CWM的实战能力如何

Meta用一系列业界公认的基准测试，把它和同期的一些顶尖模型放在一起比了比。

注：GPT-5与gpt-oss-20B使用自定义477问题子集，CWM使用完整500问题集评估。

LiveCodeBench（LCB）这个榜单，衡量的是模型在真实编程任务里的表现。CWM在v5和v6两个版本上分别拿到了68.6%和63.5%的成绩。

Math-500是数学推理测试，CWM考了96.6%的高分，和Qwen3-32B的97.2%几乎持平。这显示出它在逻辑严密的数学证明和推理这类任务上，能力非常强。

AIME（美国数学邀请赛）是更难的数学竞赛题。CWM的表现也还不错，但在这一项上比Magistral-small和Qwen3-32B稍微逊色一些。

真正的亮点在SWE-bench Verified这个榜单上。这是一个衡量模型解决真实世界软件工程问题的基准，比如修复GitHub上的bug、给开源项目加新功能等。CWM的基础版拿到了53.9%的成绩，已经很不错了。如果再给它加上一个叫“测试时扩展”（test-time scaling, tts）的辅助技术，成绩直接飙到65.8%，把榜单上其他几个模型都甩在了身后。

说明CWM凭借其对代码执行的理解能力，在处理复杂、真实的软件工程任务时，确实比其他模型更有优势。

开源：非商业研究许可

Meta把CWM的模型权重开源了，并且一次性放出了三个版本：

cwm指令微调版，开箱即用，适合绝大多数通用代码任务。cwm-sft监督微调版，只完成了基础指令跟随训练，还没经过强化学习的“打磨”。cwm-pretrain预训练版，最原始的“毛坯房”，供研究者们进行更深度的二次开发。

遵循的是FAIR非商业研究许可。

CWM的发布，在AI圈和开发者社区里激起了不小的浪花。

Yann LeCun（杨立昆）亲自下场解释，他说CWM的核心价值就在于“生成代码时，通过提前预测即将生成的代码指令可能产生的效果，来更好地规划出能够满足人类期望达成的效果的代码”。

标志着代码生成模型开始从一个只会“模仿”的复读机，向一个懂得“思考”和“规划”的智能体进化。

它就像是给代码AI装上了一双能看透程序内部状态的眼睛，让它在敲下每一个字符之前，都能先在脑子里过一遍“如果我这么写，会发生什么”。

这种能力的价值，将在自动化软件工程、智能代码调试、复杂算法生成等领域，逐渐显现出来。

AI大模型学习福利

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获

四、AI大模型商业化落地方案

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量

技术共进，成长同行——讯飞AI开发者社区

更多推荐

什么是 MCPo？

它通过标准化 RESTful API 接口，让复杂的工具变得易于使用，并支持与大语言模型（LLM）代理和应用程序的无缝交互。MCPo 的核心在于其代理功能，它能够动态发现 MCP 工具并生成 REST API 端点，同时提供人性化的 OpenAPI 文档。随着人工智能工具需求的增长，MCPo 有望成为连接 AI 工具与标准化接口的重要桥梁，为开发者提供更高效、更安全的解决方案。图像内容支持：现在可

讯飞AI开发者社区

深圳的GEO优化源头推荐

讯飞AI开发者社区

告别指令，迎接AI同事！Kimi“OK Computer”模式震撼登场

想象一下，你不再是人工智能的“指挥官”，而是拥有了一个能自主思考、规划，甚至亲自“动手”完成复杂任务的“数字同事”。这听起来像是科幻电影的桥段，但月之暗面（Moonshot AI）的Kimi，正用它全新推出的Agent模式“OK Computer”，将这一愿景带入现实。想象一下，你不再是人工智能的“指挥官”，而是拥有了一个能自主思考、规划，甚至亲自“动手”完成复杂任务的“数字同事”。