← 首页 | 导读 | 详细解读

DeepSeek-Math: Pushing the Frontiers of Math Reasoning by Open Language Models

DeepSeek-Math:通过开源语言模型拓展数学推理前沿

📄 arXiv: 2402.03300📅 2024-02-05英文 PDF中文 PDF
翻译进度 81 / 81 段 (100%)

中文摘要

DeepSeek-Math 通过多阶段数学强化学习显著提升数学推理能力。采用知识蒸馏、指令微调和强化学习三阶段训练策略,在 GSM8K、MATH 等数学基准测试上达到领先水平。该模型证明开源模型在数学推理领域可以达到与闭源模型相当的性能。

阅读模式

左侧英文原版 · 右侧中文 PDF(A4 双栏排版)· 可分别滚动对照

English Original
中文翻译 PDF