中國人工智慧企業DeepSeek此前傳出將於春節過後公布最新模型,但在此前夕,美國再對中國AI企業發難。有美國官員透露,DeepSeek的最新模型秘密使用輝達Blackwell晶片進行訓練,並透過「蒸餾」(distillation)技術利用OpenAI、Anthropic、xAI和Google等美國企業的AI模型訓練自家產品。
路透報導,該官員相信,DeepSeek位於內蒙古的數據中心使用輝達Blackwell晶片,且有能力移除使用美製晶片的痕跡。不過,該官員拒絕說明如何取得上述資訊,也未解釋DeepSeek是如何取得受出口管制的晶片。但他強調,美國現行的政策絕不允許將Blackwell晶片輸往中國。
對此,輝達並未對此置評。而中國駐美大使館則發表聲明稱,北京向來反對劃分意識形態界線、過度延伸國家安全概念、擴大使用出口管制,以及將經濟、貿易與科技問題政治化。
此外,美國AI公司Anthropic也在23日發表文章,指控中國大模型公司DeepSeek、稀宇科技和月之暗面利用上千個虛假帳戶,使用該公司旗下Claude模型進行總計逾1,600萬次交互,試圖「蒸餾」其AI模型結果以增強各自的能力。
Anthropic警告,非法蒸餾的AI模型,缺乏必要的安全保障,恐造成重大國家安全風險。若他國實驗室藉此提取美國的AI模型,可能會將這些技術能力,用於軍事、情報或監控系統。
事實上,這並非DeepSeek首度傳出蒸餾外國AI模型。早在去年6月,DeepSeek推出的推理模型R1-0528中,數學和編程基準測試表現出色,當時就有墨爾本開發者Sam Paech等多位業內人士提出質疑,表示該模型語言模式和推理過程與Gemini 2.5 Pro極為相似,很可能是用蒸餾技術提升效能。