
2026/01/22
DeepSeek V4 泄露 - "代码优先"模型改变一切
DeepSeek V4 具有革命性的 Engram 架构和代码优先设计理念
DeepSeek V4 泄露和发布传闻
根据多个泄露和内部消息,DeepSeek 正准备推出其下一代旗舰模型 DeepSeek V4,预计将在农历新年(2月中旬)前后发布。这不被视为简单的版本更新,而是一次基础性的架构转变。
内部测试表明,V4 的目标是成为一个**"代码优先"**模型,在长代码生成、多文件推理和长上下文中保持结构完整性方面,性能可能超越 GPT-4 和 Claude。
核心架构革命:Engram
V4 背后的秘密武器据称是一个名为 "Engram"(通过可扩展查找的条件记忆)的新架构。这种设计通过将动态推理(逻辑/规划)与静态记忆(知识存储)分离来解决传统模型的局限性。
关键特性:
- 混合架构:像"赛博格大脑"一样,系统的一部分处理思考(GPU),而另一部分处理记忆(CPU RAM)
- 零 VRAM 成本:通过将大量知识表存储在 CPU RAM 中并利用 $O(1)$ 查找,这种架构允许模型拥有巨大的知识容量,而 GPU VRAM 成本几乎不增加
- 更快的推理:使推理更快,部署更便宜
双版本策略和 R1 集成
泄露表明 DeepSeek V4 可能会推出两个版本:
- V4 旗舰版:针对长时间、重度编码任务优化
- V4 轻量版:专注于速度和响应性
此外,有强烈信号表明 DeepSeek 将把 R1 的深度推理能力直接集成到 V4 旗舰版中。这意味着该模型不仅擅长编码,还将擅长**"边思考边编码"**,消除了区分通用模型和推理模型的需要。
性能和行业影响
虽然目前基于内部测试和传闻,但技术路径与 DeepSeek 最近发布的 Engram 论文一致。在长上下文基准测试中,新架构在以下方面匹配或超越基准模型:
- 多跳推理
- 符号任务
- 长文档理解
同时使用的计算资源显著减少。
如果 V4 如预期发布并兑现这些承诺,它将迫使 OpenAI、Anthropic 和 Google 等竞争对手做出回应,大幅降低推理成本并提供极致的长程连贯性。

