中國大陸純血AI模型DeepSeek-V3與DeepSeek-R1接連問世,春節期間幾乎在海內外媒體搶占版面。風險投資家安德瑞森(Marc Andreessen)在社交媒體X上發文,將DeepSeek-R1與川普(Donald Trump)再度入主白宮,並列為本世紀20年代最重要一周的兩大里程碑事件。美國多家AI科技巨頭的態度三變,從震驚到質疑再到合作,說明了他們心裡仍在適應著來自中國的「不可思議」。
DeepSeek並非橫空出世,靠著厚積薄發震撼美國矽谷
事實上,要說DeepSeek是「橫空出世」,不盡然符合事實。一來「深度求索」的母公司幻方量化,是一家2015年即成立的避險基金公司,一路摸索到2023年才創立了DeepSeek團隊,放棄短期商業化,確立致力於發展AGI(通用人工智慧)的戰略目標。
二來DeepSeek去(2024)年12月26日發布V3版本時,已引起科技圈的矚目。台灣的科技AI Podcast節目《科技浪》當時便認為,「美國的晶片禁令,反而激發了中國AI公司的創新潛能」。今(2025)年1月20日發布R1版本後,《科技浪》進一步評價,「DeepSeek之所以有這樣的表現,不是靠作弊,而是實實在在的技術創新」,「這件事對於整個AI產業,甚至是世界未來的走勢,都有極大的影響」。如此發展歷程,說明了DeepSeek之所以能夠匹敵當前最強的ChatGPT o1,而且持續震撼美國矽谷,只能用「厚積薄發」來形容。
在這場「矽谷不眠夜」發生之前的1月21日,川普才宣布了由OpenAI、軟銀和甲骨文共同發起的「星際之門」(Stargate)計畫,打算在未來4年內投資5千億美元,用於建設AI相關的基礎設施,包括資料中心和電力設施,以確保美國在AI領域的領導地位。而OpenAI、Meta、Google在AI發展進程的領先,無論是開源或封閉,背後已完全是商業利益的考量。「星際之門」雖然代表著美國政府力量的介入,但脫離不了資本與技術深度結合的模式。
2025年1月21日,美國總統川普宣布「星際之門」計畫,軟銀執行長孫正義、OpenAI執行長阿特曼(Sam Altman),以及甲骨文董事長埃里森(Larry Ellison)出席該儀式。(美聯社)
低成本、全開源兩大特性,DeepSeek成為真正的OpenAI
首先,DeepSeek-V3訓練僅花費550餘萬美元,遠低於Meta Llama-3.1的5億美元,以及OpenAI GPT-4的10億美元;DeepSeek-R1成本更只有OpenAI最強模型o1的30分之1。一位Meta公司員工在美國匿名職場論壇TeamBlind上發文指出,「Meta生成式AI部門裡的每位主管的薪資都超過了這個數字」,「而我們卻有幾十位這樣的主管,我根本無法想像該如何向公司高層證明部門目前高額成本的合理性。」換言之,DeepSeek的高性價比,使得DeepSeek-V3在商業應用中更具競爭力,對於中小企業和開發者更為「親民」。
其次,DeepSeek-V3採用完全開源的特性,使其成為全球開發者的重要工具,還允許使用者利用模型輸出、透過模型蒸餾(Distillation)等方式訓練其他模型。如同DeepSeek創辦人梁文鋒所言,其管理邏輯打破了傳統商業組織的慣性,「以好奇心驅動代替利潤導向,以自主創新取代經驗依賴,以開源共享對抗技術壟斷。」
微軟(Microsoft)執行長納德拉(Satya Nadella)便在今年的達沃斯世界經濟論壇上坦言,「(DeepSeek)新模型非常令人印象深刻,他們不僅有效地完成了一個開源模型,實現了推理時間計算,而且計算效率極高。我們應該非常、非常認真地對待中國的發展。」正因為如此,不少網友戲稱DeepSeek才是真正的OpenAI,而拒絕公開模型細節和訓練資料,使得其技術路線變得神秘莫測的OpenAI已名存實亡。
微軟執行長納德拉(見圖)認為,DeepSeek新模型非常令人印象深刻,不僅有效地完成了一個開源模型,實現了推理時間計算,而且計算效率極高。(資料照,美聯社)
AI的「史普尼克時刻」,打破西方金權築起的科技高牆
美國《外交家》(The Diplomat)網站28日發表了題為〈中國的DeepSeek是美國人工智慧的「史普尼克時刻」〉文章,頗為公允中肯地總結了DeepSeek為AI發展帶來的時代意義。文章強調,DeepSeek近來發布的兩個新模型,徹底打破了「美國擅長創新,從0到1;中國擅長商業應用,從1到100」這類科技界的刻板印象。
文章認為,DeepSeek證明了AI競賽不再僅限於擁有大量晶片儲備、資金雄厚的玩家。此外,完全開源讓世界各地的開發人員都可以使用、複製和修改其模型權重和方法,「將會吸引全球更多開發者進入其生態系統,還會激發更多創新」。還有一個重點在於,美國的出口管制不再能制約人工智慧的進步。
《外交家》網站的評價,體現了為何美國和部分西方國家的政治人物,對於DeepSeek新模型採取了極為敵視,乃至於急於封殺禁止的態度。因為站在這些政治菁英背後的科技新貴與資本家,視技術創新為其禁臠,以壟斷和封閉的手段,維持科技成果的高不可攀,藉由其定義的金錢與權力遊戲規則,將常民拒於深鎖高門之外,AI自然亦是其金權玩物之一。
中國大陸國務院總理李強20日主持召開專家、企業家和教科文衛體等領域代表座談會,「深度求索」創辦人梁文鋒(前排中)是9位發言人之一。(截取自央視新聞)
AI「飛入尋常百姓家」,科技進步應為人類幸福服務
網路上流傳著一份DeepSeek生成的梁文鋒講稿,其中一段提到,「深度求索」的初衷之一,是要「讓最偏遠山村的孩童,能和矽谷工程師用上同樣聰明的AI助教」。這段讓許多人動容的話,說明了DeepSeek最大的意義,在於推倒了資本家與政客聯手堆砌出來的科技高牆,使得科技的進步永遠為人類的幸福而服務。
這也是DeepSeek所代表的中國邏輯,在現代化道路上,改寫西方軌跡之處。大語言模型是AI時代的基礎設施建設,和水、電、高鐵、5G通訊一樣,可以讓普通人直接使用,從而令未來各領域的智慧化發展應用奠下基礎。DeepSeek找到了成本更低、效能更好的技術路線,可以預見其所帶來的衝擊,便是以平民負擔得起的「白菜價」,使得AI「飛入尋常百姓家」,加速普及與開放,如同大疆(DJI)、比亞迪(BYD)、寧德時代(CATL)等品牌在各自行業生態中扮演的角色。
(相關報導:
張鈞凱專欄:小紅書成小洋芋,意外揭露當代「鐵幕」
|
更多文章
)
長期以來,一向被西方視為封閉落後的中國,如今卻在AI革命時代,推動全球化向更加開放、包容、普惠的方向發展,轉變成為一個「開源國家」。相對於此,美國卻以築牆壁壘的方式,倒退回故步自封的老路。如今,輝達(Nvidia)、亞馬遜(Amazon)、微軟等美國科技企業龍頭,紛紛宣布接入DeepSeek-R1,可是數發部卻反其道而行,宣布公務機關禁用DeepSeek,為了捍衛「美國優先」的民進黨政府與媒體集體抹黑不攻自破,反映出台灣意識形態先行所造就的認知環境有多麼無知與無良。