← 首页 | 导读 | 详细解读

DeepSeek LLM: Scaling Open-Source Language Models with Long-termism

DeepSeek LLM:以长期主义拓展开源语言模型

📄 arXiv: 2401.02954📅 2024-01-04英文 PDF中文 PDF
翻译进度 80 / 80 段 (100%)

中文摘要

DeepSeek 开源语言模型家族的技术报告,包括 7B/1.3B 模型,采用多阶段训练策略,在多项基准测试中表现优异。这是 DeepSeek 首次大规模开源语言模型,采用 Long-termism(长期主义)的训练哲学,通过大量高质量数据的精心筛选和多阶段训练,实现了与同类闭源模型相当的性能。该系列模型的开源推动了全球 AI 研究的快速发展。

阅读模式

左侧英文原版 · 右侧中文 PDF(A4 双栏排版)· 可分别滚动对照

English Original
中文翻译 PDF
← 返回首页详细解读