
DeepSeek 泄露 MODEL1 - 新旗舰 AI 震撼行业
DeepSeek 的 "Model 1" 泄露和潜在的 V4 版本发布,带来重大技术变革和 AI 技术突破
DeepSeek 的 "Model 1" 泄露和潜在的 V4 发布
新信息表明 DeepSeek 可能即将推出其下一代旗舰 AI 模型。2026年1月21日,开发者注意到 DeepSeek 在 GitHub 上更新了其 Flash MLA 代码中的114个文件。这些更新引入了一个新的标识符 "Model 1",与现有的 V3.2 并存,暗示这是一个独特的下一代架构,而非小版本更新。
技术变革
代码分析揭示了重大的技术变化,包括:
- 重新设计的 KV 缓存布局:内存效率的基础架构改进
- 稀疏性处理的差异:增强的性能优化
- 显式支持 FP8 解码:专注于极致效率和规模
推测这可能是 DeepSeek V4,预计将在农历新年(2月中旬)前后发布。新模型预计还将整合最新研究成果,如修改的分层连接(MHC)和 Engram 记忆模块。
Zhipu AI 发布 GLM-4.7 Flash
智谱 AI(Z.A.I)发布了 GLM-4.7 Flash,这是一个新的 31B 参数混合专家(MoE)模型,专为高性能本地部署而设计。该模型支持 128,000 token 的上下文窗口,并针对编码、推理和代理工作流等严肃任务进行了优化。
智谱 AI 将其定位为轻量级、潜在免费层选项,同时保持与更大模型的竞争力。基准测试显示,它在与 Qwen-32B 等竞争对手的对比中表现强劲,使其成为需要最先进编码和推理能力而无需大规模 GPU 集群的用户的可行选择。
计算情感 AI 的突破
来自日本(NAIST 和大阪大学)的研究人员基于构建情感理论发表了一项关于情感计算的研究。与传统 AI 简单地分类表情不同,该系统将情感建模为结合内部身体信号(内感受)和外部感官输入的过程。
使用名为多层多模态潜在狄利克雷分配(MMLDA)的模型,AI 从未标记的数据(包括心率、视觉输入和语言)中学习识别情感类别,与人类自我报告的情感有 75% 的一致性。这项技术可能通过使 AI 能够理解情感的形成,彻底改变心理健康支持和人机交互。
Nous Research 推出 NousCoder-14B
Nous Research 发布了 NousCoder-14B,这是一个专门用于竞技编程的模型。基于 Qwen-3 14B 构建,它使用强化学习(RL)进行训练,其中代码在沙箱环境中执行。
该模型仅在代码通过所有隐藏测试时获得奖励,而在失败、严格的时间限制或内存过度使用时受到惩罚。这种"适者生存"的训练使 NousCoder-14B 在 LiveCodeBench 上实现了 67.87% 的 Pass@1 分数,比基础模型显著提高了 7 个百分点以上。它展示了可验证奖励和基于执行的训练对于复杂推理任务的力量。

