輝達(Nvidia)去年年初面臨著一個日益嚴峻的威脅:AI領域正在發生的變化引發了競爭。
隨著數以百萬計的用戶開始使用AI工具,與訓練模型的計算密集型工作相比,運行模型來響應眾多查詢變得更加重要,而前者曾推動輝達在AI熱潮中登頂。許多人預計,這種轉變可能會讓包括Advanced Micro Devices Inc.在內的競爭對手有機會搶佔市場份額。
儘管潮流已從創建模型轉向運行模型(業內稱為「推理」),但輝達已在為適應這種變化做準備,希望在AI競賽中保持領先。
輝達最新AI晶片Blackwell體積更大,擁有更多記憶體,並且在AI計算中使用的數字精度較低。行業研究公司SemiAnalysis的創始人迪倫・巴特爾(Dylan Patel)表示,這些晶片還可以通過超快網路大量連接在一起,從而在推理方面帶來了「突破性進展」。
他說:「輝達Blackwell晶片在推理方面的性能提升遠大於訓練方面。」
輝達上周三公布的最新季度財報在一定程度上反映了該公司在適應行業轉變方面取得的成功。該公司第四財季銷售額和利潤均超分析師預期,而且對當前財季的展望也較為樂觀。
儘管業績強勁,但輝達股價上周四仍大跌8.5%,至120.15美元(約合新台幣3950),創下2018年11月以來業績公布後的最大單日跌幅。由於分析師指出輝達第四財季利潤率收窄,而且市場對其在中國的晶片銷售感到擔憂,投資者變得謹慎起來。
隨著AI向所謂的「推理」模型演變,推理已成為一個越來越受關注的焦點,在這種模型中,數位大腦會分步驟思考用戶查詢的答案。輝達黃仁勳(Jensen Huang)上周三在與分析師的電話會議上表示,這個過程可能需要多達100倍的算力。
他說:「我們今天絕大多數的計算實際上都是推理,而Blackwell將所有這些都提升到了一個新的水準。我們在設計Blackwell時就考慮到了推理模型。」
輝達財務長科萊特・克瑞斯(Colette Kress)補充稱,該公司Blackwell晶片的許多早期部署都指定用於推理工作。她說,這種模式對該公司的新一代晶片來說尚屬首次。
開發推理模型的公司包括OpenAI、Google以及中國新興AI公司DeepSeek。今年1月,DeepSeek的橫空出世給自AI熱潮開始以來一直高歌猛進的輝達帶來了首次重大恐慌。DeepSeek當時表示,該公司所構建的複雜AI模型只需要較少的輝達晶片。
黃仁勳上周三淡化了這種威脅,他將DeepSeek的進步描述為「一項卓越的創新」,世界各地的AI開發者都在從中獲得靈感。
黃仁勳在過去曾推測,隨著AI與人類的行為方式更加一致,推理和訓練最終將會融合。他去年在史丹佛大學(Stanford University)表示,人們不會把吸收和參考新資訊這兩件事分開來做:「你一直都是在一邊學習一邊推理。」 (相關報導: 華爾街日報》被俘北韓士兵講述為俄羅斯作戰:以為對抗的是韓國人 | 更多文章 )
業內人士表示,輝達在推理領域仍然面臨著激烈的競爭。雖然輝達在硬體方面的進步以及對其AI軟體的投資留住了客戶,但來自新創公司和更成熟的晶片製造商的各種新晶片意味著輝達要保持領先地位並非易事。