肖涵博士:我認為完全有可能。首先這並不包含試錯成本的,也就是「炮灰成本」。只計算這一次成功花了五百多萬。其次大模型本身的訓練技巧,隨著時間變化,發生了很多演進和升級。像OpenAI這種頂尖公司,發布一項產品需要打磨很久,成品出來可以從發布日期向前倒退3、4個月,而DeepSeek本身不需要做太多PR相關的宣傳,準備大概一個月左右,所以這兩個模型之間差了有小半年,在這個時間差裡,模型的發展是非常迅速的。不管從數學上還是深度學習上會出現很多新知識使得模型訓練更有效。而且就我所知,DeepSeek在2023年就開始做一些非常底層的技術優化,再加上整個開源社區,在過去兩三年之內,會有很多新的一些技巧,使得成本會降得非常低。