image
20250613張珈睿/加州聖荷西報導

軟硬兼施 AMD擁抱開放生態系

 AMD Advancing AI 2025盛大展開,不僅硬體端出大菜、軟體也同樣發力。最新ROCm 7軟體平台滿足生成式AI和高效能運算工作負載不斷增長的需求,並顯著改善開發人員體驗,將使用者從CUDA生態系統解放;在AI網路技術方面,AMD同時透過UALink及UEC,滿足「向上」(Scale-up+)及「向外」(Scale-out)擴展互連標準。再搭配其硬體優勢,共同構建AMD領先的AI基礎設施。

 ROCm為AMD的開源AI軟體平台(AI software stack),提供高效能運算(HPC)和AI Instinct GPU的支援。AMD指出,第7代在相同硬體上,推論與訓練效能提升3到3.5倍。此外,除既有的Linux作業系統外,ROCm現在全面支援Windows作業系統,能在AI PC和工作站等客戶端設備上執行。

 在AI網路(Networking)技術上,AMD擁抱開放生態系;UALink作為AI系統中GPU間Scale-up開放標準互連技術,相對NVLink能支援任何CPU、加速器及交換機(Switch),為客戶提供更高的靈活性和選擇。目前UALink 1.0已可以支援連接高達1,024個GPU。

 在Scale-out擴展方面,AMD則加入UEC(超乙太網路聯盟),透過乙太網將AI叢集(Cluster)擴展到百萬個節點,比傳統的InfiniBand規模大20倍。AMD指出,UEC的開放性標準,實現網路負載平衡、透過如路徑感知擁塞控制和選擇性重傳,將性能提高25%,顯著降低網路成本達16%。

 AMD推出Pensando系列AI NIC(網卡),系列中的Pollara已部署於Oracle等超大規模雲端供應商環境中,預計今年下半年廣泛上市;下一代產品Vulcano,將採用3奈米製程打造,提供達800G的網路吞吐量,並將每個GPU的擴展頻寬提升八倍。

 劍指輝達的NVLink\InfiniBand\Ethernet技術,更開放的生態正在建立。半導體業者直言,儘管輝達在研發投入、生態布局、生產製造以及晶片性能等方面都展現出強大的實力。然而,AMD正在積極地做出改變和追趕、並非毫無機會,硬體透過在與台積電先進製程搶占先機外,軟體同步持續優化,未來AI晶片市場將呈現何種競爭格局,尚難預料。