DeepSeek以其低成本模型震驚了全球科技界,也讓中國迅速發展的人工智慧(AI)市場成為焦點。中國政府已將AI列為國家重點發展領域。
DeepSeek只是眾多開發AI模型和應用的公司之一。以下是中國一些最大的AI企業的概況。
本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。
科技巨頭在做什麼?
阿里巴巴(Alibaba):這家電商巨頭提供對話式聊天機器人服務「通義千問」(Qwen),該服務由多種AI模型支持,其中包括專為更複雜的推理和編碼任務而設計的一些模型。阿里巴巴本周還發布了新AI模型「通義千問2.5-Max」,稱其可與包括DeepSeek在內的全球領先模型相媲美。至於是否也像DeepSeek宣稱的那樣,以低成本和高效率開發出這款模型,阿里巴巴沒有做出說明。
騰訊(Tencent):這家中國最大的遊戲公司開發了多個版本的AI模型「混元」(Hunyuan),稱去年11月份發布的一個版本在性能上堪比Meta Platforms的Llama 3.1。據一些研究人員稱,騰訊訓練該模型所用算力可能只有Meta的十分之一左右。騰訊正將AI功能整合到微信(WeChat)中。微信是中國無處不在的平台,提供從聊天到銀行業務等各種服務。
百度(Baidu):最初以搜尋引擎公司身份出現的百度率先在中國推出了ChatGPT的競品,名為「文心一言」(Ernie Bot)。百度技術長在去年11月份表示,其模型擁有4.3億用戶。
字節跳動(ByteDance):TikTok母公司字節跳動擁有一款名為「豆包」的聊天機器人。據追蹤AI產品的網站Aicpb.com的數據,「豆包」一直是中國下載量最高的聊天機器人應用之一,月活躍用戶約為6,000萬。
新創公司
DeepSeek:DeepSeek本月早些時候表示,已訓練出一些性能卓越、成本低廉且無需尖端晶片的AI模型。這一消息震驚全球科技界。隨後,DeepSeek在周二發布了一款名為Janus Pro的多模態模型,稱其生成的結果與OpenAI的文生圖模型DALL-E 3不相上下。
階躍星辰(StepFun):這家公司估值約為20億美元,其模型的性能目前在Chatbot Arena全球排名前十。該公司由一名微軟(Microsoft)前資深科學家創立,騰訊和上海市政府是其主要投資者。
月之暗面(Moonshot AI):據Aicpb.com數據顯示,月之暗面的聊天機器人Kimi在中國擁有約1,300萬用戶。這家新創公司估值約為33億美元,獲得阿里巴巴和騰訊的投資,其創始人是一位曾在Meta和Google(Google)工作過的年輕中國科學家。月之暗面本月發布了一款名為k1.5的多模態推理模型,稱其在一些主要基準測試中表現優於OpenAI的GPT-4o和Anthropic的Claude3.5 Sonnet等知名模型,其中包括一項數學挑戰。
稀宇科技(MiniMax):稀宇科技是一家總部位於上海的新創公司,估值為30億美元。該公司發明了類似於Character.ai的陪伴聊天機器人Talkie,這款機器人在美國很受歡迎。該公司本月發布了兩款開源模型,聲稱可與OpenAI的GPT-4o和Anthropic的Claude3.5 Sonnet媲美,使用了一種名為Lightning Attention的技術,可實現更快的計算速度。 (相關報導: 華爾街日報》DeepSeek崛起引發大哉問:AI的價值究竟在哪裡? | 更多文章 )
智譜AI (Zhipu):智譜AI在去年12月份的最新一輪融資中估值約為30億美元,該公司發明了一款聊天機器人,以及一款名為「清影」(Ying)的影片生成模型,類似於OpenAI的Sora。智譜AI本月也被列入美國的一份貿易黑名單,原因是該公司開發了可能用於軍事用途的AI系統。智譜AI稱美國此舉毫無根據。