DeepSeek 泄露 MODEL1 - 新旗舰 AI 震撼行业 | DeepSeek MODEL1 Insight

DeepSeek 的 "Model 1" 泄露和潜在的 V4 发布

新信息表明 DeepSeek 可能即将推出其下一代旗舰 AI 模型。2026年1月21日，开发者注意到 DeepSeek 在 GitHub 上更新了其 Flash MLA 代码中的114个文件。这些更新引入了一个新的标识符 "Model 1"，与现有的 V3.2 并存，暗示这是一个独特的下一代架构，而非小版本更新。

技术变革

代码分析揭示了重大的技术变化，包括：

重新设计的 KV 缓存布局：内存效率的基础架构改进
稀疏性处理的差异：增强的性能优化
显式支持 FP8 解码：专注于极致效率和规模

推测这可能是 DeepSeek V4，预计将在农历新年（2月中旬）前后发布。新模型预计还将整合最新研究成果，如修改的分层连接（MHC）和 Engram 记忆模块。

Zhipu AI 发布 GLM-4.7 Flash

智谱 AI（Z.A.I）发布了 GLM-4.7 Flash，这是一个新的 31B 参数混合专家（MoE）模型，专为高性能本地部署而设计。该模型支持 128,000 token 的上下文窗口，并针对编码、推理和代理工作流等严肃任务进行了优化。

智谱 AI 将其定位为轻量级、潜在免费层选项，同时保持与更大模型的竞争力。基准测试显示，它在与 Qwen-32B 等竞争对手的对比中表现强劲，使其成为需要最先进编码和推理能力而无需大规模 GPU 集群的用户的可行选择。

计算情感 AI 的突破

来自日本（NAIST 和大阪大学）的研究人员基于构建情感理论发表了一项关于情感计算的研究。与传统 AI 简单地分类表情不同，该系统将情感建模为结合内部身体信号（内感受）和外部感官输入的过程。

使用名为多层多模态潜在狄利克雷分配（MMLDA）的模型，AI 从未标记的数据（包括心率、视觉输入和语言）中学习识别情感类别，与人类自我报告的情感有 75% 的一致性。这项技术可能通过使 AI 能够理解情感的形成，彻底改变心理健康支持和人机交互。

Nous Research 推出 NousCoder-14B

Nous Research 发布了 NousCoder-14B，这是一个专门用于竞技编程的模型。基于 Qwen-3 14B 构建，它使用强化学习（RL）进行训练，其中代码在沙箱环境中执行。

该模型仅在代码通过所有隐藏测试时获得奖励，而在失败、严格的时间限制或内存过度使用时受到惩罚。这种"适者生存"的训练使 NousCoder-14B 在 LiveCodeBench 上实现了 67.87% 的 Pass@1 分数，比基础模型显著提高了 7 个百分点以上。它展示了可验证奖励和基于执行的训练对于复杂推理任务的力量。