[XF 新聞] Alibaba Zhenwu M890 AI 晶片登場 聲稱效能達 NVIDIA H20 三倍搭 144GB HBM3

- 辛尼 - 2026-05-21 - visibility Views

Alibaba 正式發佈最新一代自研 AI 加速晶片「Zhenwu M890」,矛頭直指 NVIDIA Hopper 家族,官方更高調聲稱在特定 Agentic AI 推理場景下,效能可以達到 H20 的三倍,同步推出的新大模型 Qwen3.7-Max 則是為這枚晶片量身打造,主攻長時間、多代理協同工作的 AI 應用。

Zhenwu M890 建基於 Alibaba 自家設計的 PPU(Parallel Processing Unit)框架,內置專門優化 Transformer 的核心引擎,強調可以在單晶片上同時處理訓練與推理工作。 在硬件規格上,它配備 144GB HBM3 記憶體,比上一代 Zhenwu 810E 的 96GB 大幅提升 50%,記憶體互聯頻寬亦由 700GB/s 提升至 800GB/s,並透過 PCIe 5.0 x16 介面連接主機,支援 FP32、FP16、FP8、FP4 等多種精度格式,方便針對不同 AI 工作負載作出取捨。 Alibaba 表示,M890 在 FP16 推理運算上可達約 0.6 PFLOPs,整體推理效能與 NVIDIA A100 相若,但在對比被美國出口限制的 H20 時,則可在特定場景下提供約三倍計算能力,同時較上一代自家晶片的性能提升亦達三倍。

為了讓 Zhenwu M890 真正推出,Alibaba 亦同步展示一套完整基礎設施生態。其一是全新的 ICN Switch 1.0 互聯晶片,提供最高 25.6Tb/s 互聯帶寬,點對點延遲低於 150ns,目標是在單一機櫃內支撐大量代理同時運行。 其二是以倚天處理器為核心的主機平台,以及 Pan 系列網絡卡,全部整合到名為「盤古 AL128 Supernode」的伺服器節點中,單櫃可容納多達 128 顆 AI 加速器,對應超大規模模型訓練與推理需求。 阿里雲透露,目前整個 Zhenwu 系列 AI 晶片已出貨約 560 顆,服務超過 20 個行業、400 多家外部客戶,顯示其自研方案已開始從內部自用走向對外商用。

在產品路線圖方面,Alibaba 亦畫出一條通往 2028 年的升級時間線。官方表示,繼 M890 之後,預計在明年第三季推出代號 V900 的新晶片,聲稱在運算效能上再提升三倍,HBM 容量增至 216GB,記憶體頻寬亦會相應加大,進一步拉高大模型訓練和推理的上限。 到 2028 年第三季,還會有架構更大改版的 Zhenwu J900 上場,標榜在性能與功耗比上都會再有明顯進步,顯示 Alibaba 希望在未來幾年持續追趕乃至在部分場景取代受出口限制的 NVIDIA 解決方案。

配合硬件,Alibaba 同場發佈的大型語言模型 Qwen3.7-Max,主打「代理式 AI」場景,能在程式開發、複雜專案協同以及長時間任務執行上擔任「總控」角色。 官方示例指出,Qwen3.7-Max 可以在多代理架構下持續運行長達 35 小時,期間處理超過 1000 次工具調用而不明顯衰減效能,並已針對多款主流代理框架進行優化,強調在程式碼能力、一般推理以及多語言支援方面已達到業界頂尖水平。 未來,開發者可以透過 Model Studio 平台存取這款模型,結合 M890 晶片打造完整本地化算力方案。

資料來源