image
20250905黃欣/綜合報導

DeepSeek傳年底前發表AI Agent

 外媒引述知情人士透露,大陸人工智慧(AI)新創企業DeepSeek計畫在年底前正式發表AI智慧體(AI Agent),以搶占下一代人機交互入口商機。據悉,AI智慧體被視為繼大模型之後的AI重點領域,具備自主決策、任務拆解與跨應用協同能力。

 知情人士表示,DeepSeek正在構建的AI模型,希望在極少指示的情況下,代表用戶執行多步驟操作,同時還能根據先前的操作進行學習和改進。該知情透露,DeepSeek創辦人人梁文鋒正督促研發團隊在今年第四季推出新款軟體。

 DeepSeek的R1大模型今年1月橫空出世以來,憑藉著多模態理解能力,加上遠低於美國同業的開發成本,引爆大陸科技行業熱潮。然而,面對中美競爭對手陸續推出新的模型,DeepSeek之後只推出一些小的升級,市場關注的R2大模型卻持續「難產」。

 報導指出,DeepSeek目前正在開發的專注於代理功能的模型,反映出AI領域風向的轉變。OpenAI、Anthropic和微軟近幾個月都推出自己的代理功能軟體,以更流暢地執行個人和專業任務。與許多聊天機器人不同,這種新型服務並非用幾行簡潔的文字來回覆用戶,而是可委以處理更複雜的任務。

 DeepSeek在8月底新推出R1升級版V3.1,相較於R1模型,V3.1能在更短時間內給出答案。此外,通過「後訓練」優化,新模型在工具使用與智慧體任務中的表現有較大提升。

 至於R2大模型遲未公布,外媒稍早報導,DeepSeek R2利用華為昇騰(Ascend)910B晶片負載的訓練失敗,導致R2已二度推遲發表時間,至今未定。