← 首页 | 导读 | 详细解读

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

DeepSeek-V3.2:拓展开源大语言模型前沿

📄 arXiv: 2512.02556📅 2025-12-02英文 PDF中文 PDF
翻译进度 33 / 33 段 (100%)

中文摘要

DeepSeek-V3.2 引入 DeepSeek Sparse Attention(DSA)稀疏注意力机制和大规模强化学习框架,在推理和 Agent 能力上实现大幅超越。DSA 通过动态选择关键 token 进行注意力计算,在保持精度的同时显著降低计算复杂度。结合改进的 MoE 路由策略,V3.2 在多项基准测试中刷新开源模型记录。

阅读模式

左侧英文原版 · 右侧中文 PDF(A4 双栏排版)· 可分别滚动对照

English Original
中文翻译 PDF
← 返回首页详细解读