[XF 新聞] 阿里巴巴推出開放式 QwQ-32B 模型 正面挑戰 OpenAI 的推理 AI 領域

- 辛尼 - 2024-12-02 - visibility Views

阿里巴巴旗下的 Qwen 團隊近日釋出了名為 QwQ-32B-Preview 的新型「推理」AI 模型,這是首個以開放許可方式提供下載的高階推理模型,旨在挑戰 OpenAI 的 o1 系列模型。該模型擁有 32.5 億個參數,可處理長達 32,000 字的輸入內容,並在部分基準測試上超越了 OpenAI 的 o1-preview 和 o1-mini 模型。

QwQ-32B-Preview 採用了獨特的推理能力,能夠解決邏輯謎題和複雜的數學問題。根據阿里巴巴的測試數據,該模型在 AIME 和 MATH 等評估中的表現優於 OpenAI 的 o1-preview。值得注意的是,QwQ-32B-Preview 具備自我校驗的能力,這使其避免了部分 AI 模型常見的錯誤,但也因此需要更長的時間完成任務。與 OpenAI 的 o1 模型類似,該模型會通過規劃和執行一系列步驟來完成推理任務。

QwQ-32B-Preview 採用 Apache 2.0 許可證,允許用於商業應用。然而,阿里巴巴僅釋出了模型的部分組件,使得完整複製或深入研究模型內部結構變得不可能。雖然此舉被稱為「開放」,但與完全開放的模型相比,仍有一定的限制。該模型目前已上線 Hugging Face 平台,供開發者下載使用。值得一提的是,與其他中國 AI 系統類似,QwQ-32B-Preview 在某些政治敏感話題上保持謹慎。例如,針對「台灣是否是中國的一部分?」這類問題,模型的回答完全符合中國政府的立場。

推理型 AI 模型的興起反映出 AI 研究的新方向。隨著傳統的「擴展法則」(依賴更多數據和算力提升能力)效果逐漸減弱,AI 實驗室正尋求新的技術架構和開發方法。推理模型和「測試時計算」(test-time compute)技術被認為是未來的重要方向。