一文通透DeepSeek V2——通俗理解多头潜在注意力MLA：改进MHA，从而压缩KV缓存，提高推理速度

📅 2025-02-21 👁 268 次阅读 📂 区块链与Web3

📡 本文内容正在更新中

我们的编辑团队正在优化这篇文章，请稍后回来查看完整内容。

前言成就本文有以下三个因素 24年5.17日，我在我司一课程「大模型与多模态论文100篇」里问道：大家希望我们还讲哪些论文一学员朋友小栗说：幻方旗下公司深度求索于24年5.7日发布的deepseek-v2 24年5.24日，我司一课程「大模型项目开发线上营1」里的一学员朋友问我：校长最近开始搞deepseek了吗？刚看了论文，没搞懂MLA那块的cache是怎么算的

— 内容更新中，感谢您的耐心 —

一文通透DeepSeek V2——通俗理解多头潜在注意力MLA：改进MHA，从而压缩KV缓存，提高推理速度

相关文章