DeepSeek 开源新模型 DeepSeekMath-V2 斩获 IMO 金牌成首个奥数冠军级开源 AI

近日，国产 AI 企业 DeepSeek 正式开源数学推理新模型 DeepSeekMath-V2，该模型在 2025 年国际数学奥林匹克竞赛（IMO 2025）中破解 6 道难题中的 5 道，达到金牌水平，成为全球首个拿下奥数冠军级成绩的开源模型，标志着开源 AI 在复杂逻辑推理领域实现重大突破。

跨赛事横扫顶级成绩，碾压同类模型

DeepSeekMath-V2 的实力在多项权威赛事中得到验证。除 IMO 2025 金牌外，它在中国数学奥林匹克竞赛（CMO 2024）中同样达到金牌水平，在普特南大学生数学竞赛（Putnam 2024）中斩获 118 分（满分 120 分），大幅超越人类参赛者 90 分的最高纪录。

在专业评测基准中，该模型表现尤为亮眼：在 ProofBench-Basic 测试中以近 99% 的高分碾压谷歌金牌模型 Gemini DeepThink（89%），在几何领域得分几乎是 Gemini 2.5-Pro 的三倍，即便在更难的 ProofBench-Advanced 子集上也仅略逊于谷歌模型，展现出全领域均衡的推理能力。

核心突破：自验证技术实现 “自我反思”

模型的卓越表现源于创新的自验证（Self-Verification）训练框架。DeepSeek 团队专门训练了 LLM 验证器作为奖励函数，让模型在生成证明后自主检查推理严谨性，通过 “生成 - 验证 - 修正” 的闭环持续优化，有效弥合了生成与验证之间的差距。

这种训练方式不仅奖励正确答案，更注重严谨的 “自我找茬” 过程。通过提升验证器算力标注复杂证明，模型的元验证质量分数从 0.85 提升至 0.96，在连续修正实验中能从 32 个解法中精准筛选最优方案，推理准确性大幅提升。

开源开放打破壁垒，推动行业普惠

与谷歌、OpenAI 的闭源金牌模型不同，DeepSeekMath-V2 基于 Apache 2.0 许可证完全开源，模型权重已在 Hugging Face 等平台公开，开发者可自由下载、商用和二次开发。

这一举措彻底降低了尖端数学推理 AI 的使用门槛，让中小企业、科研机构和开发者无需高昂成本即可接入顶级能力，将加速 AI 在教育辅导、科学研究、工程计算等领域的落地，同时为开源社区提供了可复用的复杂推理技术方案。

上一篇：英国掷1.21亿英镑加码量子竞赛政府牵头启动国家商业化计划

下一篇：台积电大揭秘--定制 HBM 内存的核心规划

TOP

DeepSeek 开源新模型 DeepSeekMath-V2 斩获 IMO 金牌 成首个奥数冠军级开源 AI

跨赛事横扫顶级成绩，碾压同类模型

核心突破：自验证技术实现 “自我反思”

开源开放打破壁垒，推动行业普惠

DeepSeek 开源新模型 DeepSeekMath-V2 斩获 IMO 金牌成首个奥数冠军级开源 AI