Computex主題演講》Arm資深副總裁:AI推論正在改寫運算架構,從雲端延伸到終端

Arm資深副總裁暨終端產品事業部總經理Chris Bergey。(魏鑫陽攝)

AI正在重塑全球運算版圖,從雲端資料中心到終端裝置,全都進入「推論驅動」的全新時代。安謀(Arm)資深副總裁暨終端產品事業部總經理Chris Bergey於2025年Computex主題演講中指出,「AI推論的效能與效率將成為AI商業化的核心」,並強調為了支撐多模態AI模型的快速擴張,運算架構正面臨全面升級,Arm也因其橫跨雲端到邊緣的技術優勢,躍居為AI時代關鍵的基礎運算平台。

Bergey並預告,至2025年底,出貨給超大規模資料中心(hyperscalers)的新伺服器晶片中,將有近5成採用Arm架構。在行動與PC市場,Arm平台也正驅動AI PC與智慧型手機走向全天續航、高能效與即時推論的新標準。結合KleidiAI軟體函式庫與超過2200萬名開發者的生態支持,Arm正積極引領AI運算從雲端延伸至每一個終端。

AI推論需求驅動平台進化,Arm成AI時代關鍵基礎

「我們正站在科技史上最關鍵的時刻,這場AI革命的規模遠超過網際網路與智慧型手機。」Bergey在演講開場指出,AI技術已從雲端訓練快速延伸至終端推論,這不僅關乎軟體發展,更深刻地重塑了運算平台的設計邏輯。「現在每一個硬體設計決策,都是AI決策。」

過去18個月內,已有超過150種大型基礎模型(foundation models)問世,多數準確率超過90%,展現AI能力正快速從單一模態邁向多模態演進,應用橫跨語音、影像、文字與即時感知。「模型的進化不只是迭代,而是加速爆發。」

Bergey指出,在這波AI革新中,「AI推論」將是實現商業規模化應用的核心。相較於訓練階段消耗大量運算與能量,推論才是AI服務實際發生與創造價值的階段,因此需要強大的平台支援從雲端、邊緣到終端的部署能力。他以Ray-Ban推出的智慧眼鏡、搭載AI助手的個人裝置為例,說明AI已走出資料中心,進入日常生活中可穿戴、可互動的多元載體。

Arm資深副總裁暨終端產品事業部總經理。(魏鑫陽攝)
Bergey指出,AI技術已從雲端訓練快速延伸至終端推論,這不僅關乎軟體發展,更深刻地重塑了運算平台的設計邏輯。(魏鑫陽攝)

Arm平台滲透到雲端,Graviton晶片與Windows on Arm加速普及

Chris Bergey指出,AI運算需求正快速突破過去的基礎架構限制,尤其資料中心面臨高密度、高能耗的挑戰。Arm在雲端的進展,已從軟體開發平台進一步擴展至伺服器晶片市場。以亞馬遜雲端運算服務(AWS)為例,其採用Arm架構的Graviton平台已成為當前最大宗的新建算力來源,「過去兩年AWS部署的新CPU算力中,有超過50%為Arm架構」。

不僅如此,Microsoft(Cobalt)、Google(Axion)、Oracle與阿里巴巴(倚天/Gintama)等主要雲端服務商皆開發出自有Arm架構晶片,顯示Arm已成為AI時代資料中心設計的主流之一。這些雲端平台皆強調透過Arm架構,可提供高達40%以上的能效優勢(power efficiency),是支撐大規模AI推論的關鍵基礎。 (相關報導: 專訪》兩岸不該仇視,最大敵人是美國?旅美工程師斷言台海終局:中國沒理由打台灣 更多文章

Bergey分析,隨著AI模型日趨龐大,資料中心的電力消耗與散熱負擔呈指數級上升,以台灣為例,數據中心總耗能預估將於未來數年內成長達8倍。他直言:「我們不可能單靠加設更多機櫃來擴展容量,唯有提升每瓦效能與CPU密度,才能真正讓AI基礎設施具備可擴展性。」