image
20250430楊晴安/綜合報導

阿里巴巴千問3開源 嗆聲DS-R1

image
阿里通義千問模型Qwen3 小檔案

 大陸科企巨頭阿里巴巴29日凌晨宣布開源新一代通義千問模型Qwen3(下稱千問3),不僅是大陸首個混合推理模型系列,更高調對標今年爆紅的大陸AI巨頭DeepSeek-R1,參數量僅為其三分之一,成本大幅下降。此舉更引來美國富豪馬斯克(Elon Musk)較勁,隨後預告發布Grok 3.5早期測試版。

 澎湃新聞29日報導,阿里最新推出的千問3性能主打全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型,共有8種規格,包含2款參數規模分別為30B和235B的混合專家(MoE)模型,以及大小從0.6B到32B的6款密集模型。

 相比千問2.5,千問3預訓練資料量達36T,且部署成本大幅下降,僅需4張輝達(NVIDIA)H20晶片即可部署千問3滿血版,顯示記憶體占用僅為性能相近模型的三分之一。

 性能方面,千問3對標市場大模型巨頭,在考察代碼能力的LiveCodeBench評測中,千問3的表現超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3的分數超越OpenAI-o1和DeepSeek-R1。

 千問3依舊採用寬鬆的Apache2.0協定開源,首次支援119多種語言。一經發布,市場反應熱烈,兩小時就在GitHub上獲得1.7萬顆星,空降全球開源模型排行榜冠軍。

 另一方面,馬斯克隨即於社群平台X發文預告,旗下AI新創公司xAI將在下周發布Grok 3.5的早期測試版,但僅針對SuperGrok訂閱者發布。Grok 3.5將是第一個能夠準確回答有關火箭引擎或電化學技術問題的AI模型,強調是從第一原理推理並得出互聯網上根本不存在的答案。