DeepSeek-Prover-V2:通过强化学习子目标分解推进形式化数学推理
DeepSeek-Prover-V2 在 Lean 4 形式化定理证明上达到当前最高水平(SOTA),通过强化学习和子目标分解策略在 MinF2F 测试集达到 88.9% 的 pass ratio。模型能够将复杂的数学证明任务分解为可管理的子目标,逐步构建严密的证明链条。这一突破标志着 AI 在形式化数学证明领域的重要进展。