20251002・楊晴安／綜合報導

DeepSeek新模型陸企秒上線

　大陸AI企業深度求索（DeepSeek）9月29日發表新一代大語言模型DeepSeek-V3.2-Exp，透過自研DeepSeek Sparse Attention（DSA）稀疏注意力機制，突破長文本處理效率。大陸本土算力廠商華為雲、寒武紀、海光信息等火速宣布完成適配並上線，進一步加速大陸AI產業發展。

　財聯社引述DeepSeek指出，得益新模型服務成本的大幅降低，官方API價格也相應下調，新價格即刻生效。新價格政策下，開發者調用DeepSeek API成本將降低50％以上。大陸國產晶片深度協同有望全面受益，「晶片-架構-模型」的協同創新，打破傳統AI生態中硬體與軟體的割裂。

　DeepSeek-V3.2-Exp發布後，華為昇騰快速基於vLLM／SGLang等推理架構完成適配部署，實現0day支持，並面向開發者開源。華為雲也完成適配，最大可支援160K長序列上下文長度。目前該模型已正式上架華為雲大模型即服務平台MaaS，為企業及開發者提供模型體驗和API服務。

　寒武紀同步宣布適配，並開源vLLM-MLU推理引擎原始程式碼，依託自研BangC融合運算子與Triton架構達成「計算與通信並行」的極致性能優化。

　此外，海光信息DCU實現無縫適配＋深度調優，做到大模型算力「零等待」。海光表示，基於GPGPU架構強大的生態優勢，與程式設計開發軟體棧DTK的特性，新模型在海光DCU上展現出優異的性能，同時驗證海光DCU高通用性、高生態相容度及自主可控的技術優勢。

　分析認為，DeepSeek-V3.2最大的意義在於軟硬協同設計支持大陸國產算力，全新DSA機制加上國產晶片的計算效率，大幅降低長序列場景下的訓推成本，共同為客戶提供極具競爭力的軟硬體解決方案。

DeepSeek新模型 陸企秒上線

DeepSeek新模型陸企秒上線