DeepSeek-Coder:让代码自我编写
DeepSeek-Coder 代码模型在 HumanEval 和 MBPP 等编程基准上超越同期开源模型。该模型采用大规模代码数据预训练,支持代码补全、代码生成、代码翻译、代码解释等多种编程任务。在多项代码智能 benchmark 上达到当时开源模型的最佳水平。
DeepSeek-Coder surpasses open-source models on HumanEval and MBPP benchmarks, supporting code completion, generation, translation, and explanation.
| 架构 | 大规模代码数据预训练 |
|---|---|
| 核心创新 | 大规模代码语料 + 多任务训练 |
| 基准成绩 | HumanEval、MBPP 超越同期开源模型 |
| 应用场景 | 代码补全、代码生成、代码翻译、代码解释 |
DeepSeek 代码方向的入门论文。重点理解大规模代码语料的构建和训练策略。