一上架就在蘋果商店超越ChatGPT下載量，來自中國的DeepSeek究竟是何方神聖？

就在川普宣布5000億美元投資人工智慧領域之際，中國AI初創公司深度求索（DeepSeek）於本周一（1月27日）推出了兩個新的AI語言模型：DeepSeek-R1-Zero和DeepSeek-R1。據公司透露，這些模型在某些基準測試中的表現卓越，性能直接對標OpenAI的o1正式版。而其價格僅為o1的幾十分之一，且以開源形式向全球開發者開放。

與大多數傳統大型語言模型（LLM）不同，DeepSeek-R1采用了一種被稱為「模擬推理」（simulated reasoning）的方法。模擬了類似人類的思維鏈，采用長鏈推理（Chain-of-Thought， CoT）技術，能夠逐步分解複雜問題，並通過多步驟邏輯推理解決問題。這一過程比典型的語言模型耗時更多，但在處理數學、物理和自然科學領域的任務時，能顯著提高結果的準確性。

訂閱風傳媒VIP會員，享有零廣告閱讀介面

透過<Google新聞>追蹤風傳媒

OpenAI的o1模型是2024年9月推出，是首個采用此種方法的OpenAI模型。

令人矚目的測試成績

DeepSeek通過多種基準測試評估了其模型性能。

在數學測試Aime 2024中，DeepSeek-R1取得了79.8%的成績，略高於OpenAI的79.2%。在Math-500基準測試中，該模型的準確率達到97.3%，超越了所有其他測試系統。在編程能力測試SWE-bench Verified中，DeepSeek-R1的得分為49.2%，展現了專家級的編程能力。

在常識測試MMLU和GPQA Diamond中，該模型的準確率分別為90.8%和71.5%。在寫作和問答基準測試AlpacaEval 2.0中，該模型的勝率達到87.6%。不過，上述測試結果尚未得到獨立驗證，因此必須謹慎解讀。

該模型數據庫使用截至2024年7月的資訊進行訓練。與OpenAI當前的模型類似，DeepSeek 還可以根據需要整合來自網路的更新資訊。但其並不具備生成圖像的功能。

中國新型生成式AI系統「DeepSeek」橫空出世，讓美股相關產業暴跌。（美聯社）

開放許可

與矽谷競爭對手開發的專有大語言模型（LLM）不同，DeepSeek是開源的，這意味著任何人都可以訪問其應用程序代碼，了解其工作原理，並自行進行修改。

其推理模型DeepSeek-R1遵循MIT License開源協議，允許用戶自由使用、修改，包括用於商業目的。

「我們正處於一個由非美國公司保持OpenAI最初使命的時代——真正開放的、前沿的研究，賦與所有人權力。」輝達（Nvidia）高級研究經理Jim Fan在社交平台X上寫道。DeepSeek表示，它「在開源模型中名列前茅」，並且可與全球最先進的閉源模型相媲美。

Scale AI創始人Alexandr Wang在X上寫道，「DeepSeek給美國敲響了警鐘。」

性價比高

DeepSeek-R1的最大版本包含6710億個參數。公司還提供了多個簡化版本，參數範圍從15億到700億不等，其中最小的版本甚至可以在筆記本電腦上運行。（相關報導：華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站，為何成為全球矚目的焦點？｜更多文章）

在商業領域，DeepSeek以極具競爭力的價格進入市場。相比OpenAI的o1版本每生成100萬詞元（token）需支付60美元，DeepSeek僅需2.19美元，價格僅為前者的5%。

（Deepseek官網）

但有限制

然而，DeepSeek-R1在基礎配置上受到中國特有的限制。根據中國對網路服務的規定，人工智慧系統需體現「社會主義核心價值觀」。

這就意味著，與百度的文心一言（Ernie Bot）等其他中國聊天機器人一樣，DeepSeek對政治敏感話題（如天安門事件或台灣獨立國家地位等）有限制。例如，當被問及中國領導人習近平或北京在新疆的政策時，它會建議「談論其他事情」。

測試中，德語版DeepSeek對相關政治敏感問題提供類似ChatGPT的詳細回答。然而，當用英語提問時，AI更傾向於轉移話題。根據ArsTechnica的報道，通過本地部署而非雲端版本運行該系統時，可完全繞過政治過濾功能，這得益於其開源許可模式。

極低的訓練成本

令人驚訝的是，DeepSeek的開發成本遠低於預期。據Jim Fan 稱，DeepSeek用了兩個月時間，花費 558 萬美元訓練了其基礎模型（V3）。與美國科技巨頭在AI領域投入的數十億美元相比，只能算是九牛一毛。

另外，據新浪財經報道，DeepSeek購買了1萬多塊輝達GPU，隨後又擴大到5萬塊。這與OpenAI、谷歌、Anthropic等領先AI實驗室動輒超過50萬塊GPU相比，投入成本低到驚人。而分析人士一直認為，美國在生產高性能晶片上的關鍵優勢，以及阻止中國獲取相關技術的能力，將使其在AI競賽領域佔據上風。

隨著DeepSeek的強勢崛起，美國和日本主要科技公司股價紛紛下跌。

晶片制造巨頭輝達——世界主要人工智慧硬體和軟體供應商——上周五在華爾街收盤時下跌超過3%。而日本軟銀——該公司是川普宣布的一項5000億美元、AI基礎設施建設計劃的主要投資者之一，周一股價下跌超過8%。

川普的親密顧問、風險投資家馬克·安德森（Marc Andreessen）將其稱為“AI的斯普特尼克時刻”（Sputnik moment），指的是當年蘇聯衛星發射引發美蘇太空競賽。

“DeepSeek R1 是我見過的最令人驚嘆和印象深刻的突破之一，” 安德森在社交平台X（前推特）上寫道。

DeepSeek是誰？

DeepSeek是一家位於中國杭州市的人工智慧技術研究初創公司「深度求索」。杭州以科技公司密集而聞名。其開發的程序DeepSeek既可以作為APP使用，也可以在桌面端運行。它能夠完成許多AI助手可以做到的事情，比如編寫歌詞、制定個人發展計劃，甚至根據冰箱裡的食材寫出一份晚餐食譜。它也可以用多種語言進行交流，但DeepSeek向法新社表示，它在英語和中文上的表現最為出色。

然而，無論是編寫複雜的代碼還是解決困難的數學問題，業內人士對DeepSeek的能力與競爭對手的接近程度感到驚訝。Alexandr Wang在接受CNBC采訪時表示：「我們發現，DeepSeek是表現最好的，或者至少與最好的美國模型相當。”」

中美AI領域競爭加劇

DeepSeek R1的發布正值美國政府加強對中國出口AI技術限制之時。OpenAI等企業已警告稱，中國的模型未來可能追趕甚至超越美國。北京領導層已誓言，到2030年成為人工智慧技術的全球領導者，並計劃在未來幾年內投入數百億美元支持該行業。

目前，包括DeepSeek、阿裡巴巴以及Moonshot AI在內的至少三家中國實驗室，已推出據稱可媲美OpenAI o1的模型。而DeepSeek的成功也表明，中國企業已經開始克服阻礙其成功的障礙。

喬治梅森大學（George Mason University）AI研究員迪恩·鮑爾（Dean Ball）認為，這一趨勢表明，中國開發團隊正在迅速接近前沿技術水平。他特別指出，DeepSeek的小型版本R1能夠在普通家庭電腦上運行，這將有助於推動AI應用的普及與民主化。

「DeepSeek小型模型的卓越性能意味著強大的推理系統會迅速傳播，並能在本地硬件上運行——遠離任何集中監管（包括美國的出口管制）的視線。」

（綜合報道）

作者: 德才