image
20250813蘇崇愷/綜合報導

DeepSeek-R2傳最快15日亮相

image
市場傳出,大陸競爭對手DeepSeek將於本月中下旬發表新模型DeepSeek-R2。圖/美聯社

 在OpenAI日前發表新一代AI模型GPT-5後,市場傳出,大陸競爭對手DeepSeek將於本月中下旬發表新模型DeepSeek-R2。受此消息激勵,陸股AI概念股12日齊漲,寒武紀、上海合晶都飆出漲停,每日互動則收漲8.5%。

 證券時報報導,DeepSeek-R2原訂於5月推出,但因技術與市場競爭因素而延遲。隨後,發表時間一度傳出延至7月初,如今最新消息指出,其亮相時間點可能落在8月中下旬,雖然尚未獲得官方證實,但已讓市場預期心理飆升。

 快科技報導,市場分析,DeepSeek-R2的最大亮點,在於其採用混合專家模型(MoE),並搭配更先進的門控網路,以優化高負載的推理效能。分析師預估,這款模型的定價可能遠低於OpenAI的同級產品,有望顛覆現有的AI服務定價模式。外傳DeepSeek-R2成本將比GPT-4下降97%,並且是完全在華為昇騰卡上進行訓練,主打全方位、全產業鏈的自主可控。

 在模型規模方面,DeepSeek-R2的總參數量預計將達到1.2兆,相較於前一代DeepSeek-R1的6,710億參數,成長近1倍。

 報導指出,DeepSeek-R2是基於華為昇騰910B(Ascend 910B)晶片集群訓練而成,晶片使用效率為82%。華為實驗室統計,此效能相當於輝達(NVIDIA)上一代A100訓練集群的91%。這些數據的真實性仍有待觀察,但DeepSeek-R2確實展現出更強大、更自主的企圖心。