AI晶片龍頭輝達(NVIDIA)9日在AI基礎設施高峰會,發布採用Rubin架構打造的新AI晶片Rubin CPX,這是一款專為處理超長上下文推理任務而設計的晶片,適合用於影片製作和軟體開發等複雜應用,預計2026年底上市。
該款為晶片採台積電N3P製程,CoWoS封裝,並採用128 GB經濟實惠的GDDR7記憶體設計為主,日月光有望搶搭Rubin供應鏈列車。
輝達9日發表的新一代繪圖處理器(GPU)Rubin CPX,是專為處理大型推理任務設計,能讓AI系統更快且更有效率地處理數百萬個token的軟體編碼和生成式影片。
Rubin CPX提供高達每秒30千萬億次浮點運算能力(NVFP4精度),配備128GB GDDR7記憶體。與輝達目前主流的GB300 NVL72系統相比,新平台的注意力能力提高3倍。Rubin CPX採取卡片式設計,可整合至現有伺服器架構,也能作為獨立運算單元部署於資料中心。
輝達在2024年發布Rubin GPU晶片架構,以發現暗物質(Dark Matter)的女天文學家魯賓(Vera Rubin)命名。
輝達執行長黃仁勳在8月旋風式來台,在機場受訪時便大談新一代晶片架構Rubin,並表示輝達有6款全新晶片與台積電合作,包括新款CPU、GPU、NVLink交換器晶片、網通晶片、網路交換器和矽光子晶片。
黃仁勳在發布會上指出,「Vera Rubin平台將是AI運算前沿另一次跳躍,不僅引進下一代Rubin GPU,還有新款名為CPX的處理器。一如RTX徹底改變了繪圖和物理AI,Rubin CPX是首款專為大規模上下文AI打造的CUDA GPU,能支持模型同時推理數百萬個知識token。」
輝達指出,Rubin CPX將視訊解碼、編碼和長上下文推論處理整合至單一晶片,提升處理效率。
輝達透露,代碼生成公司Cursor、生成式AI公司Runway,以及AI研究公司Magic,皆在探索Rubin CPX如何加速他們的應用。