LogoDeepSeek Model1 Insight
  • 首页
  • 什么是 MODEL1
  • 模型对比
  • 博客
  • 关于本站
DeepSeek 泄露 MODEL1 - 新旗舰 AI 震撼行业
2026/01/21

DeepSeek 泄露 MODEL1 - 新旗舰 AI 震撼行业

DeepSeek 的 "Model 1" 泄露和潜在的 V4 版本发布,带来重大技术变革和 AI 技术突破

DeepSeek 的 "Model 1" 泄露和潜在的 V4 发布

新信息表明 DeepSeek 可能即将推出其下一代旗舰 AI 模型。2026年1月21日,开发者注意到 DeepSeek 在 GitHub 上更新了其 Flash MLA 代码中的114个文件。这些更新引入了一个新的标识符 "Model 1",与现有的 V3.2 并存,暗示这是一个独特的下一代架构,而非小版本更新。

技术变革

代码分析揭示了重大的技术变化,包括:

  • 重新设计的 KV 缓存布局:内存效率的基础架构改进
  • 稀疏性处理的差异:增强的性能优化
  • 显式支持 FP8 解码:专注于极致效率和规模

推测这可能是 DeepSeek V4,预计将在农历新年(2月中旬)前后发布。新模型预计还将整合最新研究成果,如修改的分层连接(MHC)和 Engram 记忆模块。

Zhipu AI 发布 GLM-4.7 Flash

智谱 AI(Z.A.I)发布了 GLM-4.7 Flash,这是一个新的 31B 参数混合专家(MoE)模型,专为高性能本地部署而设计。该模型支持 128,000 token 的上下文窗口,并针对编码、推理和代理工作流等严肃任务进行了优化。

智谱 AI 将其定位为轻量级、潜在免费层选项,同时保持与更大模型的竞争力。基准测试显示,它在与 Qwen-32B 等竞争对手的对比中表现强劲,使其成为需要最先进编码和推理能力而无需大规模 GPU 集群的用户的可行选择。

计算情感 AI 的突破

来自日本(NAIST 和大阪大学)的研究人员基于构建情感理论发表了一项关于情感计算的研究。与传统 AI 简单地分类表情不同,该系统将情感建模为结合内部身体信号(内感受)和外部感官输入的过程。

使用名为多层多模态潜在狄利克雷分配(MMLDA)的模型,AI 从未标记的数据(包括心率、视觉输入和语言)中学习识别情感类别,与人类自我报告的情感有 75% 的一致性。这项技术可能通过使 AI 能够理解情感的形成,彻底改变心理健康支持和人机交互。

Nous Research 推出 NousCoder-14B

Nous Research 发布了 NousCoder-14B,这是一个专门用于竞技编程的模型。基于 Qwen-3 14B 构建,它使用强化学习(RL)进行训练,其中代码在沙箱环境中执行。

该模型仅在代码通过所有隐藏测试时获得奖励,而在失败、严格的时间限制或内存过度使用时受到惩罚。这种"适者生存"的训练使 NousCoder-14B 在 LiveCodeBench 上实现了 67.87% 的 Pass@1 分数,比基础模型显著提高了 7 个百分点以上。它展示了可验证奖励和基于执行的训练对于复杂推理任务的力量。

全部文章

分类

  • 新闻
  • 产品
DeepSeek 的 "Model 1" 泄露和潜在的 V4 发布技术变革Zhipu AI 发布 GLM-4.7 Flash计算情感 AI 的突破Nous Research 推出 NousCoder-14B

更多文章

DeepSeek V4 - 新旗舰有望在编码方面超越 OpenAI
新闻产品

DeepSeek V4 - 新旗舰有望在编码方面超越 OpenAI

DeepSeek V4 编码强者以及 V 系列和 R 系列模型的区别

2026/01/23
DeepSeek V4 泄露 - "代码优先"模型改变一切
新闻产品

DeepSeek V4 泄露 - "代码优先"模型改变一切

DeepSeek V4 具有革命性的 Engram 架构和代码优先设计理念

2026/01/22
LogoDeepSeek Model1 Insight

本站为独立信息与分析站点,与 DeepSeek 官方不存在任何隶属或合作关系。

产品
  • 功能
  • 价格
  • 常见问题
资源
  • 更新日志
  • 路线图
公司
  • 关于我们
  • 联系我们
  • 邮件列表
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 DeepSeek Model1 Insight. 版权所有最后更新: 2026-03-08