本文原先於4月15 日刊登在美國中國科技與政策論壇及Podcast網站《China Talk》,經 Ray Wang 和 Jeffery Su 編譯分析。
──隨著中國對推理與運算能力的需求迅速升溫,搭載 HBM3 的輝達 H20 GPU 已成為最搶手的 AI 加速器。根據先前預測,在新一波禁令實施前,H20 的 2025 整年出貨量曾預估將達 140 萬顆。
──長鑫存儲(CXMT)在高頻寬記憶體(HBM)技術的進展速度超出預期,目前與全球領先廠商的差距已縮小至約 3 到 4 年。公司計畫在 2026 年量產 HBM3,並在 2027年推出 HBM3E,也顯示其 DRAM 技術已大幅進步。
──長鑫存儲(CXMT)仍面臨許多重大障礙,包括:美國對光刻與微影製成設備的出口管制、地緣政治局勢的不穩定、有限的全球市場進入許可權等;屏除上述原因,還有最根本的技術層面,追趕HBM領先公司過程中,技術發展速度仍存在著不確定性。
2024 年 12 月,美國發布出口管制措施,針對中國取得高頻寬記憶體(HBM)以及各類半導體製造設備進行限制,其中包括對高頻寬記憶體(HBM) 製造與封裝至關重要的工具。新規定同時將超過 140 家中國晶片製造商與設備商列入美國商務部(U.S. Department of Commerce)的實體清單(Entity List)。
美國政府希望藉由對高頻寬記憶體(HBM)的關鍵掌控,進一步阻擋中國的人工智慧發展藍圖。高頻寬記憶體(HBM)的全球供應目前主要由三家公司掌握:為SK 海力士(SKHynix)、三星(Samsung)與美光(Micron);另一方面,禁令進一步針對半導體製造設備(Semiconductor Manufacturing Equipments)的限制,也削弱中國自製 HBM 的能力。
HBM可說是現今 AI 加速器訓練大型語言模型的核心關鍵。隨著「推理模型」(reasoningmodels)快速演進、AI 推論技術(inference training)日趨成熟,記憶體的「頻寬」(Bandwidth)與「容量」 (Capacity)變得更加重要,讓 HBM 的地位越來越受重視。
中國其他 GPU 大廠,如壁仞(Biren)、燧原(Enflame)與瀚博半導體(VastaiTech) 等,同樣可能使用來自 SK 海力士或三星的 HBM2 與 HBM2E。以壁仞為例,其 2022 年推出的BR100 GPU 搭載了 4 顆 HBM2E;燧原則在 2021 年底推出的 DTU 使用了 2 顆 HBM2,顯示中國各大AI晶片公司同樣高度依賴 HBM 記憶體。
目前中國在高階推理模型自研風潮的案例眾多,舉凡深度求索(DeepSeek) 的DeepSeek-R1、阿里巴巴(Alibaba)的 QwQ-32B、百度(Baidu)的文心一言 X1、騰訊(Tencent)的混元 T1,以及字節跳動(ByteDance)的豆包 1.5等等;各大科技公司對 AI 推論訓練和運算效能的需求持續升高。其實從今年 1 月下旬開始,這波需求就快速升溫,也帶動市場對高階GPU 的強烈需求,尤其是搭載先進 HBM、專為中國市場打造的輝達 H20 晶片,成為熱銷焦點。
H20 是目前中國能取得最先進的國外 GPU 晶片。儘管華為的 Ascend 910B 能作為國產替代方案,在效能上可以大致與 Nvidia A100 相當;但論及叢集運算(一種高效能運算),其所發揮的效能僅約 H20的40%。
值得一提的是,華為的最新代GPU產品 Ascend 910C,在計算與記憶體效能方面比起Ascend 910B 更具備競爭力。雖然 Ascend 910C 在中國 AI 產業的實際部署規模尚未明朗,但它正確實越來越受到外界關注。
除了純粹的效能指標之外,中國大企業目前仍偏好採用輝達的硬體。主要涵蓋許多原因,包括:中國工程師對其成熟且廣泛採用的軟體生態系非常熟悉,加上在大型叢集環境中的穩定性與效率表現更好,以及整體供應鏈的供貨穩定等等優勢,樹立不可取代的地位。
雖然 H20 的計算效能只有輝達旗艦晶片 H100 的約七分之一,但它擁有更大的記憶體頻寬與容量。因此在推論訓練場景中反而更受青睞,這也是推動中國市場需求的關鍵原因。
近期多家外媒報導指出,輝達 H20 的需求正在上升。作者透過多次供應鏈調查,確認了這一趨勢早發生於今年 2 月初。這與作者先前根據 1 月中旬資料所做的供應鏈調查結果出現轉變——當時的數據顯示 H20 訂單正大幅下滑,原因是對於 H20 未來可能遭禁的擔憂。
作者在 3 月初透過下游供應鏈(如:先進封裝與晶片測試)所進行的估算中,輝達預計在2025 年出貨約 140 萬顆 H20。另一項推算顯示,中國可能在 6 月前取得約 60 萬顆 H20。值得注意的是,自 H20 於 2024 年第二季開始出貨以來,中國已累積取得超過 100 萬顆H20。
然而,H20 已於上週正式遭到美國政府禁售。根據輝達在4月15日向美國證券交易委員會(SEC)提交的最新 8-K 文件中顯示,若要銷售 H20、或任何記憶體頻寬、互連頻寬等級等同於 H20 的晶片,都需從美國商務部產業與安全部取得特別許可。換句話說,輝達因為在無法取得進入中國市場許可權的重重阻礙下,恐無法再對中國出售 H20 或任何效能更強的GPU。
中國記憶體技術的進展中國對輝達H20晶片的強勁需求、HBM 在晶片中扮演的關鍵角色、以及對推理模型與推論訓練日益重視的趨勢,種種跡象凸顯 HBM 在中國 AI 發展中的戰略重要性。
當前中國政府與產業界顯然已充分意識到,面臨日益嚴峻的監管與地緣政治影響,HBM 在運算資源與 AI 硬體中扮演著關鍵角色。正因如此,中國發展國內自給自足的 HBM 不僅具備戰略急迫性,更是擺脫美國限制、提升AI發展的必經之路。
當前美中科技競爭日益激烈,HBM 無疑成為中國發展 AI 的關鍵支撐之一。在這樣的時空背景下,如何清楚掌握中國在 HBM 領域的發展進程,顯得格外重要。
根據現有資料推測以及作者的最佳猜測,儘管面臨出口管制與多重挑戰,中國在 HBM 領域的技術僅落後市場領先者約四年,這一差距比先前估計或普遍預期更小。
2024 年下半年,有報導指出中國DRAM 與記憶體領頭羊長鑫存儲(CXMT),已開始量產HBM2,這使其技術水準大約僅落後市場領導者三個世代。
從 2024 年開始,市場上的主要記憶體三大龍頭,已經開始提供先進的 HBM 產品,如HBM3E 8層(8hi)和 12層(12hi)給 Nvidia、AMD、Google、AWS 等主要的 AI 晶片業者作者曾於 12 月曾對這四家記憶體大廠(三星、美光、SK海力士、長鑫存儲)的 HBM 技術路線圖進行回顧性分析後發現,長鑫存儲(CXMT) 相較另外三間領導品牌仍落後約六至八年技術,多項挑戰需克服。
看到這,原本六到八年的技術差距,對華府決策者與產業領袖而言本該是一項相對「安心」的領先;然而這項假設可能已不再成立,因為產業變化正在驚人的加速。
最新消息指出,中國記憶體製造商的 HBM 技術進展速度快於先前預期。據報導長鑫存儲正著手研發 HBM3,並計劃於2026年實現量產。這使得 長鑫存儲 與其他 HBM 領導者之間的差距縮小至約四年;韓國現代證券(HyundaiSecurities)分析,長鑫存儲更進一步計劃打造自家HBM3E,並推進於 2027 年量產。如此消息若屬實,整體技術落差將從四年進一步縮小為三年。
然而,「中國在記憶體領域的進展卻鮮少被報導」。參與展會的分析師指出,中國的 HBM 技術將在 2025 年會持續加速發展,並點出 HBM3E 已成為國內 HBM 業者的主要研發目標。雖然這並不保證中國將實現 HBM3E 的量產計畫,但國內廠商有志一同朝此方向研發,已顯示出HBM 技術上的實質進展與共識。至少可以確定,中國記憶體產業正瞄準最尖端的 HBM 技術,這與先前對長鑫存儲技術進展的觀察相呼應。
如果長鑫存儲(CXMT)真的能在 2025 年或甚至 2026 年推出 HBM3E,將成為中國推動半導體自給自足的重要里程碑,更可能對全球記憶體產業和政策圈帶來衝擊。雖然目前看來這還有待觀察,但並非完全不可能。知名獨立半導體分析機構 SemiAnalysis 在 2024 年 1 月就曾預測,長鑫存儲的 HBM3E 若應用於 AI 領域,最快有機會在 2025 年中開始出貨。
保守一點來看,即便長鑫存儲僅在 2025 年底或 2026 年推出較為落後的 HBM3,對許多人而言仍是驚人的進展:畢竟該公司僅成立 9 年,HBM2 量產也才剛於去年啟動,同時還面臨多年來一直受到美國出口管制的壓力。
從技術層面來看,長鑫存儲似乎越來越有能力生產用於 HBM2E 與 HBM3 的 DRAM裸晶(die),其基礎來自於該公司在 DRAM 製程上的穩步推進。長鑫存儲目前可在 D1y 與D1z(約 17–13 奈米)製程節點上生產 DRAM,而這些節點正是 HBM2E 與 HBM3 所使用的技術。
另一家知名半導體諮詢機構 TechInsights 在今年 1 月也證實,長鑫存儲已經具備在 D1z 製程節點上生產 DDR5 的能力。它的晶片密度大致達到 2021 年全球領導廠商(美光、三星、SK海力士)的水準,雖然晶粒面積較大、良率也還沒被證實。
此外,長鑫存儲的研發團隊很可能正著手開發更先進的 15 奈米 DRAM 製程節點,特別是D1α 與 D1β(14–13 奈米),這些都是推進至 HBM3E 所需的關鍵節點。儘管缺乏極紫外光微影(EUV)技術,使得開發 D1α 節點可能面臨挑戰,但先前的案例證明這並非完全不可能。
舉例來說,美光在 2021 年即成功在無 EUV 的情況下量產 D1α DRAM,為長鑫存儲提供了一條可行的先例。
綜合所有資訊,作者認為貼近現實的評估是:長鑫存儲(CXMT)正致力於 HBM3 的研發,預計將於 2026 年上半年進入量產階段;至於 HBM3E,目前仍難以做出明確判斷,原因在於長鑫存儲的 DRAM 技術進展與對該規格的現有資訊相當有限。
值得一提的是,就算 長鑫存儲能在預期時間內開發出 HBM3 或 HBM3E產品,整體效能與大型語言模型(LLM)訓練的相容性仍需謹慎評估。以過往經驗來看,即使是同一代的 HBM產品,不同廠牌的質量也可能差異甚大。例如,三星的 HBM3E(8hi 與 12hi)比起SK Hynix同代產品,差異明顯。這從過去兩年三星多次未通過輝達對其高階 GPU 的認證測試可以看出。
在美國禁令實施前,Nvidia 已向中國 AI 業者出售超過 100 萬顆搭載 HBM3(以及後來升級版的搭載 HBM3E 的H20E)的 H20 晶片。短中期內,中國 GPU 廠商仍需與這些產品競爭。因此,長鑫存儲將研發重心放在 HBM3 與 HBM3E 上,不僅合理、更具策略意義——為國產GPU 提供有競爭力的記憶體支援。
從更宏觀的戰略角度來看,若要在 AI 晶片這個快速變動的市場中維持競爭力,長鑫存儲必須採取更激進的發展策略,也就是直接開發對應更先進GPU 需求的記憶體規格。舉例而言,華為的 Ascend 910C 以及預計在今年下半年量產的Ascend 920 幾乎可以確定會從 HBM2E 升級至 HBM3 或 HBM3E,以提升記憶體效能與整體競爭力。
1. 設備禁令持續限制其發展:雖然長鑫存儲已買足夠設備來維持至 2026–2027 年的HBM 與 DRAM 生產,但近期的出口管制(如 2024 年 12 月的新規)仍對進一步擴產與技術升級影響不小,這些禁令涵蓋許多 HBM 製造所需的關鍵設備(如 TSV 穿矽通孔與蝕刻技術)。此外,原先駐點在長鑫存儲的美系設備廠維修人員也已被迫撤出,對其開發造成進一步影響。
2. 缺乏極紫外光微影設備(EUV)帶來的技術瓶頸:儘管作者曾前面提出在無 EUV 情況下開發 sub-15nm 製程仍具可行性(如 Micron 於 2021 年量產 D1α 所示),但畢竟不是長遠之計;若無法導入 EUV,長鑫存儲在未來開發更尖端HBM的過程中,恐將面臨與中芯(SMIC)類似的處境,亦即產能放大困難、良率不足、晶粒面積過大等問題。
3. 國際市場的限制:在未來數年內,長鑫存儲的 HBM 在全球市場的採用率仍將受到限制。即便產品在技術上逐漸成熟,美中地緣政治風險,將使這些外商企業(特別是 AI加速器業者)對使用中國製 HBM 持保留態度。
4. 實體清單(Entity List)將限制企業的商業活動。自 2020 年以來,美國政府已將 768 家中國企業列入實體清單,其中包含產業中的重量級企業如:華為、中國快閃記憶體龍頭長江存儲(YMTC)。
儘管長鑫存儲目前尚未被列入,但據作者了解,自今年 1 月起,華府內部便不斷討論是否將長鑫存儲納入實體清單,這對長鑫存儲未來幾個月甚至幾年內的發展存在極大隱憂。
即便如此,若長鑫存儲能穩定量產中低階 HBM 並壓低售價,即使無法打入高階市場,也足以擾動全球 HBM 市場的毛利結構、取得一定市占率。這對中國半導體產業而言,仍是一個重要的戰略突破。
上述挑戰若同時發酵,勢必將重塑長鑫存儲與國際領先廠商之間的技術差距與競爭格局。然而,若長鑫存儲能持續保持當前的研發動能,其技術進展仍有可能進一步縮小與 HBM 市場領導者的差距。
最後,目前仍不確定長鑫存儲能否像國際大廠一樣,持續不斷地更新產品世代、緊跟市場節奏。
舉例來說,SK 海力士正積極布局:除了在今年推出 HBM4 外,也正規劃推出 HBM4E,以滿足 Nvidia 不斷演進的產品需求。在目前仍存在的技術落差與多重挑戰下,長鑫存儲是否有能力維持競爭節奏、與全球記憶體領導廠商並駕齊驅? 這個問題,作者選擇保留給讀者思考,並交由市場與未來發展來證明。
*作者Ray Wang為駐華府的獨立分析師,Jeffery Su 協助此篇文章的翻譯、研究的撰寫。