[XF 新聞] Alibaba Zhenwu M890 AI 晶片登場　聲稱效能達 NVIDIA H20 三倍搭 144GB HBM3

- 辛尼 - 2026-05-21

Alibaba 正式發佈最新一代自研 AI 加速晶片「Zhenwu M890」，矛頭直指 NVIDIA Hopper 家族，官方更高調聲稱在特定 Agentic AI 推理場景下，效能可以達到 H20 的三倍，同步推出的新大模型 Qwen3.7-Max 則是為這枚晶片量身打造，主攻長時間、多代理協同工作的 AI 應用。

Zhenwu M890 建基於 Alibaba 自家設計的 PPU（Parallel Processing Unit）框架，內置專門優化 Transformer 的核心引擎，強調可以在單晶片上同時處理訓練與推理工作。在硬件規格上，它配備 144GB HBM3 記憶體，比上一代 Zhenwu 810E 的 96GB 大幅提升 50%，記憶體互聯頻寬亦由 700GB/s 提升至 800GB/s，並透過 PCIe 5.0 x16 介面連接主機，支援 FP32、FP16、FP8、FP4 等多種精度格式，方便針對不同 AI 工作負載作出取捨。 Alibaba 表示，M890 在 FP16 推理運算上可達約 0.6 PFLOPs，整體推理效能與 NVIDIA A100 相若，但在對比被美國出口限制的 H20 時，則可在特定場景下提供約三倍計算能力，同時較上一代自家晶片的性能提升亦達三倍。

為了讓 Zhenwu M890 真正推出，Alibaba 亦同步展示一套完整基礎設施生態。其一是全新的 ICN Switch 1.0 互聯晶片，提供最高 25.6Tb/s 互聯帶寬，點對點延遲低於 150ns，目標是在單一機櫃內支撐大量代理同時運行。其二是以倚天處理器為核心的主機平台，以及 Pan 系列網絡卡，全部整合到名為「盤古 AL128 Supernode」的伺服器節點中，單櫃可容納多達 128 顆 AI 加速器，對應超大規模模型訓練與推理需求。阿里雲透露，目前整個 Zhenwu 系列 AI 晶片已出貨約 560 顆，服務超過 20 個行業、400 多家外部客戶，顯示其自研方案已開始從內部自用走向對外商用。

在產品路線圖方面，Alibaba 亦畫出一條通往 2028 年的升級時間線。官方表示，繼 M890 之後，預計在明年第三季推出代號 V900 的新晶片，聲稱在運算效能上再提升三倍，HBM 容量增至 216GB，記憶體頻寬亦會相應加大，進一步拉高大模型訓練和推理的上限。到 2028 年第三季，還會有架構更大改版的 Zhenwu J900 上場，標榜在性能與功耗比上都會再有明顯進步，顯示 Alibaba 希望在未來幾年持續追趕乃至在部分場景取代受出口限制的 NVIDIA 解決方案。

配合硬件，Alibaba 同場發佈的大型語言模型 Qwen3.7-Max，主打「代理式 AI」場景，能在程式開發、複雜專案協同以及長時間任務執行上擔任「總控」角色。官方示例指出，Qwen3.7-Max 可以在多代理架構下持續運行長達 35 小時，期間處理超過 1000 次工具調用而不明顯衰減效能，並已針對多款主流代理框架進行優化，強調在程式碼能力、一般推理以及多語言支援方面已達到業界頂尖水平。未來，開發者可以透過 Model Studio 平台存取這款模型，結合 M890 晶片打造完整本地化算力方案。

資料來源

A100 Alibaba H200 Nvidia XF 新聞 Zhenwu M890

[XF 新聞] Alibaba Zhenwu M890 AI 晶片登場 聲稱效能達 NVIDIA H20 三倍搭 144GB HBM3

最新文章

[XF 新聞] Alibaba Zhenwu M890 AI 晶片登場　聲稱效能達 NVIDIA H20 三倍搭 144GB HBM3