image
20251002楊晴安/綜合報導

DeepSeek新模型 陸企秒上線

 大陸AI企業深度求索(DeepSeek)9月29日發表新一代大語言模型DeepSeek-V3.2-Exp,透過自研DeepSeek Sparse Attention(DSA)稀疏注意力機制,突破長文本處理效率。大陸本土算力廠商華為雲、寒武紀、海光信息等火速宣布完成適配並上線,進一步加速大陸AI產業發展。

 財聯社引述DeepSeek指出,得益新模型服務成本的大幅降低,官方API價格也相應下調,新價格即刻生效。新價格政策下,開發者調用DeepSeek API成本將降低50%以上。大陸國產晶片深度協同有望全面受益,「晶片-架構-模型」的協同創新,打破傳統AI生態中硬體與軟體的割裂。

 DeepSeek-V3.2-Exp發布後,華為昇騰快速基於vLLM/SGLang等推理架構完成適配部署,實現0day支持,並面向開發者開源。華為雲也完成適配,最大可支援160K長序列上下文長度。目前該模型已正式上架華為雲大模型即服務平台MaaS,為企業及開發者提供模型體驗和API服務。

 寒武紀同步宣布適配,並開源vLLM-MLU推理引擎原始程式碼,依託自研BangC融合運算子與Triton架構達成「計算與通信並行」的極致性能優化。

 此外,海光信息DCU實現無縫適配+深度調優,做到大模型算力「零等待」。海光表示,基於GPGPU架構強大的生態優勢,與程式設計開發軟體棧DTK的特性,新模型在海光DCU上展現出優異的性能,同時驗證海光DCU高通用性、高生態相容度及自主可控的技術優勢。

 分析認為,DeepSeek-V3.2最大的意義在於軟硬協同設計支持大陸國產算力,全新DSA機制加上國產晶片的計算效率,大幅降低長序列場景下的訓推成本,共同為客戶提供極具競爭力的軟硬體解決方案。