VIP 專屬文章 張鈞凱專欄:DeepSeek逆襲,中國邏輯顛覆西方軌跡

中國大陸DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發美國矽谷震撼。(美聯社)

中國大陸純血AI模型DeepSeek-V3與DeepSeek-R1接連問世,春節期間幾乎在海內外媒體搶占版面。風險投資家安德瑞森(Marc Andreessen)在社交媒體X上發文,將DeepSeek-R1與川普(Donald Trump)再度入主白宮,並列為本世紀20年代最重要一周的兩大里程碑事件。美國多家AI科技巨頭的態度三變,從震驚到質疑再到合作,說明了他們心裡仍在適應著來自中國的「不可思議」。

DeepSeek並非橫空出世,靠著厚積薄發震撼美國矽谷

事實上,要說DeepSeek是「橫空出世」,不盡然符合事實。一來「深度求索」的母公司幻方量化,是一家2015年即成立的避險基金公司,一路摸索到2023年才創立了DeepSeek團隊,放棄短期商業化,確立致力於發展AGI(通用人工智慧)的戰略目標。

二來DeepSeek去(2024)年12月26日發布V3版本時,已引起科技圈的矚目。台灣的科技AI Podcast節目《科技浪》當時便認為,「美國的晶片禁令,反而激發了中國AI公司的創新潛能」。今(2025)年1月20日發布R1版本後,《科技浪》進一步評價,「DeepSeek之所以有這樣的表現,不是靠作弊,而是實實在在的技術創新」,「這件事對於整個AI產業,甚至是世界未來的走勢,都有極大的影響」。如此發展歷程,說明了DeepSeek之所以能夠匹敵當前最強的ChatGPT o1,而且持續震撼美國矽谷,只能用「厚積薄發」來形容。

在這場「矽谷不眠夜」發生之前的1月21日,川普才宣布了由OpenAI、軟銀和甲骨文共同發起的「星際之門」(Stargate)計畫,打算在未來4年內投資5千億美元,用於建設AI相關的基礎設施,包括資料中心和電力設施,以確保美國在AI領域的領導地位。而OpenAI、Meta、Google在AI發展進程的領先,無論是開源或封閉,背後已完全是商業利益的考量。「星際之門」雖然代表著美國政府力量的介入,但脫離不了資本與技術深度結合的模式。

2025年1月21日,美國總統川普宣布Stargate計畫,軟銀執行長孫正義、OpenAI 執行長阿特曼(Sam Altman)以及甲骨文董事長埃里森(Larry Ellison)出席了該儀式。(美聯社)
2025年1月21日,美國總統川普宣布「星際之門」計畫,軟銀執行長孫正義、OpenAI執行長阿特曼(Sam Altman),以及甲骨文董事長埃里森(Larry Ellison)出席該儀式。(美聯社)

低成本、全開源兩大特性,DeepSeek成為真正的OpenAI

當然,DeepSeek的逆襲,並不表示中國已經成功彎道超車美國,更沒辦法用上遙遙領先來形容。但其縮短中美AI發展的距離,以及帶來了AI應用的顛覆性思維,確實是不爭的事實。 (相關報導: 張鈞凱專欄:小紅書成小洋芋,意外揭露當代「鐵幕」 更多文章

首先,DeepSeek-V3訓練僅花費550餘萬美元,遠低於Meta Llama-3.1的5億美元,以及OpenAI GPT-4的10億美元;DeepSeek-R1成本更只有OpenAI最強模型o1的30分之1。一位Meta公司員工在美國匿名職場論壇TeamBlind上發文指出,「Meta生成式AI部門裡的每位主管的薪資都超過了這個數字」,「而我們卻有幾十位這樣的主管,我根本無法想像該如何向公司高層證明部門目前高額成本的合理性。」換言之,DeepSeek的高性價比,使得DeepSeek-V3在商業應用中更具競爭力,對於中小企業和開發者更為「親民」。