奥数冠军-deepseek
栏目:新闻资讯 发布时间:2025-11-28
DeepSeek 开源新模型 DeepSeekMath-V2 斩获 IMO 金牌 成首个奥数冠军级开源 AI近日,国产 AI 企业 DeepSeek 正式开源数

DeepSeek 开源新模型 DeepSeekMath-V2 斩获 IMO 金牌 成首个奥数冠军级开源 AI

近日,国产 AI 企业 DeepSeek 正式开源数学推理新模型 DeepSeekMath-V2,该模型在 2025 年国际数学奥林匹克竞赛(IMO 2025)中破解 6 道难题中的 5 道,达到金牌水平,成为全球首个拿下奥数冠军级成绩的开源模型,标志着开源 AI 在复杂逻辑推理领域实现重大突破。

跨赛事横扫顶级成绩,碾压同类模型

DeepSeekMath-V2 的实力在多项权威赛事中得到验证。除 IMO 2025 金牌外,它在中国数学奥林匹克竞赛(CMO 2024)中同样达到金牌水平,在普特南大学生数学竞赛(Putnam 2024)中斩获 118 分(满分 120 分),大幅超越人类参赛者 90 分的最高纪录。
在专业评测基准中,该模型表现尤为亮眼:在 ProofBench-Basic 测试中以近 99% 的高分碾压谷歌金牌模型 Gemini DeepThink(89%),在几何领域得分几乎是 Gemini 2.5-Pro 的三倍,即便在更难的 ProofBench-Advanced 子集上也仅略逊于谷歌模型,展现出全领域均衡的推理能力。

核心突破:自验证技术实现 “自我反思”

模型的卓越表现源于创新的自验证(Self-Verification)训练框架。DeepSeek 团队专门训练了 LLM 验证器作为奖励函数,让模型在生成证明后自主检查推理严谨性,通过 “生成 - 验证 - 修正” 的闭环持续优化,有效弥合了生成与验证之间的差距。
这种训练方式不仅奖励正确答案,更注重严谨的 “自我找茬” 过程。通过提升验证器算力标注复杂证明,模型的元验证质量分数从 0.85 提升至 0.96,在连续修正实验中能从 32 个解法中精准筛选最优方案,推理准确性大幅提升。

开源开放打破壁垒,推动行业普惠

与谷歌、OpenAI 的闭源金牌模型不同,DeepSeekMath-V2 基于 Apache 2.0 许可证完全开源,模型权重已在 Hugging Face 等平台公开,开发者可自由下载、商用和二次开发。
这一举措彻底降低了尖端数学推理 AI 的使用门槛,让中小企业、科研机构和开发者无需高昂成本即可接入顶级能力,将加速 AI 在教育辅导、科学研究、工程计算等领域的落地,同时为开源社区提供了可复用的复杂推理技术方案。

2-25112Q1011U26.png

" />