科技發展進入AI時代,但因AI產業鏈之技術密度,形成僅由數家高科技巨擘所把持的現況,包括從半導體設備、晶圓製造、AI加速器晶片、甚至生成式人工智慧模型,始終維持寡占局面,無形中也成為發展終端應用的壁壘。
直至DeepSeek以低成本優勢引起市場討論,雖持憂慮觀點者認為這將打破過往雲端服務供應商(CSP)巨額資本支出趨勢為疑慮,但另一方面則認為其開源模型將刺激科技巨擘如ChatGPT等更加大方跟進開源,期待邊緣AI應用進入大開大闔新局面。
DeepSeek並非今年農曆春節期間發表,早在2023年上半年就開始進行募資與設立,其橫空出世對科技產業影響,主要在二大觀察:第一、AI模型效能與成本將由過去的直線,進入高斜率曲線。以往AI模型必須投入大量資源訓練,也就是說希望增加1%的效能,就必須投入1%的資源,兩者之間存在線型關係,所以AI加速器晶片始終稀缺,帶動輝達、台積電享有高達七成、六成的毛利率,便是來自於爭搶資源的軍備競賽。
但局勢改變,並不代表科技巨擘會減少投資,反可能推動AI技術不斷創新,將節省下來的資源投入更大規模的訓練,以1%的資源,產出超過1%的效能,進而開發出更強的AI模型。
或許有人會提出不同看法,AI企業其實不用這樣做。但實際上觀察AI企業手中默默練功的頂尖模型,其實遠超過市場上所見,AI企業多半先預留技術餘量,等到競爭對手逼迫時才會陸續出手,這也是為何OpenAI 於2月初就能夠立刻推出deep research模型的原因,因此,硬體軍備投資升級成軟體演算競賽,預期未來AI模型的效能與成本曲線斜率應會更加陡升。
第二、就是採取開源模型對業界的刺激。AI模型開源不是由DeepSeek開先例,早在2024年初Meta發布了開源大型語言模型Llama 3,當時也引發業界對AI模型開源趨勢的討論。主要是因為開源模型可以降低了企業採用AI技術的門檻,企業可基於開源模型進行客製化開發,省掉大量不需要的資源與付出,大幅減少了技術研發成本。特別是對中小企業而言,開源模型多提供了一個經濟且合理的AI應用方案選項。
此外,開源也將促進了AI生態圈創新和改進,特別是中國大陸地區的AI發展。開發者社群可共同優化模型性能,加速技術進步,這有助於建立更精準對應消費者所需要的AI生態系統。以DeepSeek開源為例,除了大型語言模型(LLM)、視覺語言模型(VLM),還有文生圖模型(text to image)等近期都在中國大陸出現大爆發趨勢,顯示開源模型確實降低了入門檻。
開發者不需投入大量資源從零開始訓練模型,可以專注於微調和應用開發,此種「站在巨人肩膀上」的方式,確實能大幅降低初期成本,有助於將AI應用由雲端快速轉為邊緣落地,或許大家可以期待AI「華強北時代」即將來臨。
科技始終來自於人性,科技進步目的也是為了服務人類,邊緣AI相較雲端AI更能貼近消費者,勢必成為將來科技趨勢之一。回顧以往中國大陸電子業的發展,IC設計扮演不可或缺的角色,除了因為深圳聚集硬體通路供應、系統整合人才以及大量生產能力的天時地利人和條件外,IC設計企業提供的Turnkey,更是降低開發資源的關鍵,得以快速發展出眾多應用,現階段大陸AI企業啟動開源模型,預期加速AI於邊緣的實踐商機,有望打破由上游寡占的態勢,進入科技產業雨露均霑的新紀元。