image
20250701楊晴安/綜合報導

繼DeepSeek-R1後... 百度、華為 攻開源AI大模型

分別發布文心大模型4.5系列、兩項盤古模型;迎戰西方閉源體系

image
大陸的AI大模型開源競爭進入新階段,繼年初DeepSeek-R1成功後,各家巨頭陸續爭先升級開源模型。百度文心大模型示意圖。圖/新華社
近五年大陸AI大模型市場規模及預測

 大陸的人工智慧(AI)大模型開源競爭進入新階段,繼年初DeepSeek-R1成功後,各家巨頭陸續爭先升級開源模型,推動大模型價格下探60%~80%。6月30日,百度和華為同日宣布開源旗下模型,宣告加入戰局。展望全球市場,已經形成大陸憑藉AI開源戰略,迎戰西方閉源體系的產業格局。

 綜合陸媒報導,百度6月30日正式發布文心大模型4.5系列模型,涵蓋多種參數配置,包括47B、3B啟始參數的混合專家(MoE)模型,與0.3B參數的稠密型模型等十款模型,並且將其完全開源。同時,開源模型API服務也可在百度智慧雲「千帆」大模型平台使用。

 同日下午,華為也宣布,開源「盤古」70億參數稠密模型和盤古Pro MoE 720億參數混合專家模型,同時開放基於昇騰的模型推理技術。這是華為首次將盤古大模型的核心能力對外開源。

 報導指出,相比美國AI巨頭OpenAI旗下的GPT-1至GPT-4為閉源模型,Google和Anthropic也均採閉源模型。大陸AI新創DeepSeek於今年2月啟動「開源周」,一周內每天開源一個代碼庫,以完全透明的方式與全球開發者分享他們的研究進展,該公司強調,希望分享的每一行代碼都會變成強有力的勢能,加速行業發展進程。

 大陸巨頭企業相繼開源,正值本土大模型開源浪潮興起,隨著DeepSeek-R1獲得空前成功,MiniMax、阿里巴巴、月之暗面等業者近月來陸續加入戰局,以此加速應用普及,並瞄準全球市場快速擴張。業內人士表示,DeepSeek開源的代碼庫基本覆蓋AI大模型開發的關鍵核心環節,例如硬體性能高效利用、資料處理提速等,將極大有利於降低技術門檻和成本。

 美國南加大教授任尚表示,每一次有強大模型開源後,都會讓整個產業水平拉高,特別是像OpenAI和Anthropic這些原本閉鎖起來不給人碰的大公司,壓力只會愈來愈大。

 開源平台HuggingFace中國區總經理王鐵震表示,作為一種工具,開源大模型的使用和維護需要一定的技術能力;而閉源模型則作為一種產品,更易於使用,只需調用API即可。