一上架就在蘋果商店超越ChatGPT下載量,來自中國的DeepSeek究竟是何方神聖?

中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)

就在川普宣布5000億美元投資人工智慧領域之際,中國AI初創公司深度求索(DeepSeek)於本周一(1月27日)推出了兩個新的AI語言模型:DeepSeek-R1-Zero和DeepSeek-R1。據公司透露,這些模型在某些基準測試中的表現卓越,性能直接對標OpenAI的o1正式版。而其價格僅為o1的幾十分之一,且以開源形式向全球開發者開放。

與大多數傳統大型語言模型(LLM)不同,DeepSeek-R1采用了一種被稱為「模擬推理」(simulated reasoning)的方法。模擬了類似人類的思維鏈,采用長鏈推理(Chain-of-Thought, CoT)技術,能夠逐步分解複雜問題,並通過多步驟邏輯推理解決問題。這一過程比典型的語言模型耗時更多,但在處理數學、物理和自然科學領域的任務時,能顯著提高結果的準確性。

OpenAI的o1模型是2024年9月推出,是首個采用此種方法的OpenAI模型。

 

令人矚目的測試成績

 

DeepSeek通過多種基準測試評估了其模型性能。

在數學測試Aime 2024中,DeepSeek-R1取得了79.8%的成績,略高於OpenAI的79.2%。在Math-500基準測試中,該模型的準確率達到97.3%,超越了所有其他測試系統。在編程能力測試SWE-bench Verified中,DeepSeek-R1的得分為49.2%,展現了專家級的編程能力。

在常識測試MMLU和GPQA Diamond中,該模型的準確率分別為90.8%和71.5%。在寫作和問答基準測試AlpacaEval 2.0中,該模型的勝率達到87.6%。不過,上述測試結果尚未得到獨立驗證,因此必須謹慎解讀。

該模型數據庫使用截至2024年7月的資訊進行訓練。與OpenAI當前的模型類似,DeepSeek 還可以根據需要整合來自網路的更新資訊。但其並不具備生成圖像的功能。

 

中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)
中國新型生成式AI系統「DeepSeek」橫空出世,讓美股相關產業暴跌。(美聯社)

 

開放許可

 

與矽谷競爭對手開發的專有大語言模型(LLM)不同,DeepSeek是開源的,這意味著任何人都可以訪問其應用程序代碼,了解其工作原理,並自行進行修改。

其推理模型DeepSeek-R1遵循MIT License開源協議,允許用戶自由使用、修改,包括用於商業目的。

「我們正處於一個由非美國公司保持OpenAI最初使命的時代——真正開放的、前沿的研究,賦與所有人權力。」輝達(Nvidia)高級研究經理Jim Fan在社交平台X上寫道。DeepSeek表示,它「在開源模型中名列前茅」,並且可與全球最先進的閉源模型相媲美。

Scale AI創始人Alexandr Wang在X上寫道,「DeepSeek給美國敲響了警鐘。」

 

性價比高

 

DeepSeek-R1的最大版本包含6710億個參數。公司還提供了多個簡化版本,參數範圍從15億到700億不等,其中最小的版本甚至可以在筆記本電腦上運行。 (相關報導: 華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點? 更多文章

在商業領域,DeepSeek以極具競爭力的價格進入市場。相比OpenAI的o1版本每生成100萬詞元(token)需支付60美元,DeepSeek僅需2.19美元,價格僅為前者的5%。