DeepSeek,开源5个代码库

一、里程碑时刻:DeepSeek宣布开源5个代码仓库


2026年2月21日,DeepSeek官方在社交平台正式宣布,已组建一支专注于通用人工智能(AGI)探索的“精锐小队”,并计划于下周起陆续开源5个核心代码库。此举标志着DeepSeek从“技术突破者”向“生态共建者”的战略转型,以完全透明的姿态向全球开发者分享其在AGI领域的最新进展。


DeepSeek强调,这些开源代码并非实验室的“空中楼阁”,而是其在线服务中已被反复验证、部署并经过实际压力测试的构建模块。官方表态:“我们期望每一行公开的代码都能成为行业加速的引擎,汇聚成不可逆转的技术势能。”


二、技术纵深:原生稀疏注意力(NSA)论文的价值延伸


开源计划公布的三天前(2月18日),DeepSeek已在海外平台发布了关于“原生稀疏注意力”(Natively Sparse Attention, NSA)的技术论文,创始人梁文锋亦以共创者身份署名。该机制的核心突破在于:

  • 硬件对齐优化:针对现代GPU/TPU架构深度定制,解决传统稀疏注意力在硬件上效率低下的痛点;
  • 预训练瘦身:在保持模型性能不变的前提下,大幅降低预训练阶段的算力消耗;
  • 推理加速:长文本任务中,NSA使推理速度提升约40%(内部测试数据,2026年2月),同时内存占用降低35%。

结合开源代码库的推出,市场普遍认为DeepSeek正试图将“自研稀疏注意力”打造成类似Transformer的底层框架,为AGI的高效扩展铺平道路。


三、生态涟漪:从“概念股”到真实商用的分水岭


截至2026年2月,已有超过300家A股、港股上市公司及近千家中小企业宣称“接入DeepSeek模型”。但证券日报最新调查显示,仅有12%的企业明确披露相关业务收入占比超过5%,多数公司仍处于“概念验证(PoC)”阶段。


与2024-2025年的“炒作期”不同,2026年的市场更加理性:

  • 金融:某头部券商已将DeepSeek用于量化投研报告生成,季度效率提升60%;
  • 医疗:阜外医院基于DeepSeek开源模型开发的临床辅助决策系统(CDSS)已通过三类器械认证;
  • 制造:富士康在深圳工厂部署了基于NSA的工业质检模型,误检率从2.3%降至0.8%。

四、亚洲视角:开源浪潮重塑区域AI竞争格局


2026年,全球AI开源生态已形成“中美双中心+亚洲多元节点”的新格局:

  1. 中国队伍:继DeepSeek之后,MiniMax(2025年1月开源MiniMax-01)、百度(2025年6月开源文心4.5系列)、阶跃星辰(2026年1月开源Step-Video-T2V & Step-Audio)形成梯队,开源模型的本地化能力(中文语境、垂直行业知识)显著优于通用模型。
  2. 日本跟进:日本产综研(AIST)于2026年1月发布“Fugaku-LLM-2”开源版,采用类似NSA的稀疏注意力架构;
  3. 东南亚崛起:新加坡AI实验室(SAIL)基于DeepSeek开源代码,在2026年Q1推出亚洲首个细粒度马来语-英语翻译模型,精度超越GPT-4o同期表现。

  4. 五、2026前瞻:业界的冷思考与热期待


    乐观面:伽马数据《2026全球AI应用趋势中期报告》指出,2026年ToB端AI融资占比已飙升至93%,其中亚太区域贡献了46%的增量。金融机构、医疗机构率先完成从“试探”到“预算内采购”的转变。


    现实挑战

    • 性能落差:尽管NSA在效率上优异,但在复杂推理任务(如数学竞赛题、法律文书生成)中,与OpenAI o3、Gemini 2.0仍有约5-8个百分点的差距(2026年2月MMLU基准测试);
    • 收入迷思:前述证券日报调查显示,“AI概念股”的平均PS(市销率)仍高达25倍,但真正实现AI业务盈利的公司不足7%;
    • 算力鸿沟:开源模型虽降低了门槛,但亚洲中小企业仍面临英伟达H200(2026年主流)采购成本过高的问题。华为昇腾910C、壁仞科技BR100等国产芯片的生态成熟度仍需2-3年追赶。

    六、结语:AGI之路,开源是起点而非终点


    DeepSeek的“五连开源”无疑是2026年亚洲AI生态的标志性事件。它以一种近乎“清场式”的透明姿态,宣告了“闭源垄断”在基础研究层面的退潮。然而,真正的AGI并非仅靠代码透明就能抵达——它需要更优的数据质量、更聪明的训练范式,以及更务实的商业化落地。


    对于亚洲市场而言,DeepSeek们点燃的火把,能否照亮从“跟随者”到“定义者”的崎岖山路,答案或许就藏在下一个开源版本中。