[XF 新聞] Microsoft 推出革命性 BitNet 模型 可以在 CPU 運行的超高效能 AI

- 辛尼 - 2025-04-17 - visibility Views

Microsoft 研究團隊近日宣布,他們成功開發了一款超高效能的人工智慧模型,名為「BitNet b1.58 2B4T」,這也是目前最大規模的 1-bit AI 模型。該模型特別之處在於它可以在僅使用 CPU 的情況下運行,例如 Apple 的 M2 處理器,並且已經以 MIT 授權方式開放源碼。

BitNet 模型的核心技術是將權重量化為僅三個數值:-1、0 和 1,這使得模型在記憶體和計算效能方面大幅提升。其設計目的是讓模型能夠在資源受限的設備上高效運作。BitNet b1.58 2B4T 擁有多達 20 億個參數,並利用包含 4 兆個數據單位的巨大資料集進行訓練,相當於約 3,300 萬本書的內容。

根據 Microsoft 研究人員的測試,BitNet 在多項基準測試中表現卓越,例如 GSM8K 數學問題和 PIQA 物理常識推理測試,甚至超越了 Meta、Google 和阿里巴巴等科技鉅頭的類似模型。值得注意的是,BitNet 在運行速度上比其他同類模型快兩倍,同時使用的記憶體僅為後者的一部分。

然而,BitNet 的高效能依賴於微軟專屬的 bitnet.cpp 框架,該框架目前僅支援特定的硬體,並不包括現今主流的 GPU。這使 BitNet 的應用受到了一定限制,特別是在依賴 GPU 的 AI 基礎設施中。