image
20241022蘇崇愷/綜合報導

陸AI企業突圍 壓低大模型成本

 大陸人工智慧(AI)公司受限於美國晶片管制,且預算比西方同業少,因此正壓低成本以成立具備競爭力的模型。零一萬物(01.ai)、深度求索(DeepSeek)等大陸新創企業正透過各種策略來壓低成本,例如訓練AI模型時專注於較小的資料整合,以及雇用低薪但熟練的電腦工程師。

 集微網21日報導,大陸互聯網巨頭阿里巴巴、百度、字節跳動等也大打價格戰,以降低推理成本(即調用大型語言模型生成回應的價格),促使大模型價格下降90%以上。零一萬物表示,透過建構以較少數據量進行訓練、需要較少運算能力的模型,並優化硬體,該公司已降低推理成本。

 AI專家、零一萬物創辦人李開復15日曾在臉書發文指出,零一萬物晉升為全球大型語言模型第三名的公司(註:與億萬富豪Elon Musk旗下公司xAI並列),在評測平台LMSys Chatbot Arena最新排行榜中,僅次於OpenAI、Google。

 李開復表示,Yi-Lightning是一個小的專家混合(MOE)模型,具極高速度且成本低廉,每百萬個token僅需0.14美元,反觀GPT-4o成本為4.4美元。Yi-Lightning性能與xAI的Grok-2相當,但Yi-Lightning是在2,000張H100 GPUs上進行一個月的預訓練,成本僅300萬美元,遠低於Grok-2。

 目前零一萬物、深度求索等許多大陸AI企業,都採用專家混合(MOE)模型方法。研究人員表示,該方法是達到與密集模型相同智慧水準,但運算能力較低的關鍵方法,卻也更容易失敗,主因是工程師必須協調多個「專家」的訓練過程,而不是在一個模型中。

 由於難以獲得穩定供應的高階AI晶片,大陸AI企業在過去一年內爭相開發最高品質的資料整合,以訓練這些「專家」,期盼在競爭中脫穎而出。