DeepSeek-R1公布獲利率,545%創紀錄!陸版AI公開「3大技術支柱」顛覆產業

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發矽谷震撼。(美聯社)

中國人工智能新創公司DeepSeek最近不斷「開源」各種技術,在上週六(1日)帶來了更大的驚喜,全面公開DeepSeek-V3/R1推理系統的秘密。他們不僅分享了核心優化技術,還首次公布了成本獲利率等重要數據,讓整個產業為之震驚。

DeepSeek於上週六在知乎平台發表首篇文章,揭露了模型推理的成本與利潤細節。根據披露的關鍵財務資訊,若所有tokens都按照DeepSeek-R1的價格計算,理論上每天總收入可達56萬2027美元,成本獲利率高達545%,這個數字創下了「全球AI大模型領域的獲利新高」。

什麼是tokens?

在AI大型語言模型中,tokens是指將文字分割的基本單位,可視為AI處理和計費的基礎單元。不同於我們理解的完整句子或段落,AI會將文字切分成更小的處理單位。一個token可能是一個完整的字詞,也可能是字詞的一部分。例如,「hello」可能是一個token,而較長的詞如「unforgettable」可能被分成多個tokens(如「un」、「forget」、「able」)。

對於中文,分詞更為複雜,通常一個中文字或詞組會被視為一個或多個tokens。在商業AI服務中,tokens成為計費的基本單位,就像文章中提到的「輸入1元/百萬token、輸出16元/百萬token」,是按處理的token數量來計費的標準。

技術細節:高效能的基礎設施

官方資料顯示,DeepSeek V3和R1的所有服務都採用H800 GPU,並使用與訓練一致的精度進行運算。這意味著矩陣計算和dispatch傳輸使用與訓練相同的FP8格式,core-attention計算和combine傳輸則採用與訓練相同的BF16,最大限度地確保了服務品質。

在最近24小時(2025年2月27日12:00至28日12:00)的統計期間內,若GPU租賃成本以每小時2美元計算,日均成本為8萬7072美元。而如果所有輸入/輸出token按R1定價(輸入每百萬token 1元、輸出每百萬token 16元)來算,單日收入可高達56萬2027美元(約1865萬台幣),成本獲利率達到了驚人的545%。

專業人士反應:如果在美國是百億美元大企業

MenloVentures的投資人Deedy在檢視上述數據後表示,超過500%的獲利率代表著在美國市場將會是一家價值超過百億美元的企業。

中國矽基流動的創辦人袁進輝也立即分享了他的看法:「DeepSeek官方披露大規模部署成本和收益,再一次顛覆了許多人的認知。」 (相關報導: 【商戰】為什麼DeepSeek比ChatGPT更適合我們?電機博士曲博曝「關鍵在這」! 更多文章

高獲利的技術秘訣:三大技術支柱

DeepSeek的高獲利率得益於其創新的推理系統設計,核心包括三大技術支柱:大規模跨節點專家並行(EP)、計算通信重疊與負載均衡優化。EP技術提高了吞吐量與回應速度,針對模型的稀疏性(每層僅啟動8/256個專家),採用EP策略擴大整體批處理規模,確保每個專家獲得足夠的計算負載,大幅提升GPU使用效率。此外,部署單元可動態調整(如Prefill階段使用4節點、Decode階段使用18節點),平衡資源分配與任務需求。