[XF 新聞] 阿里巴巴推出開放式 QwQ-32B 模型　正面挑戰 OpenAI 的推理 AI 領域

- 辛尼 - 2024-12-02

阿里巴巴旗下的 Qwen 團隊近日釋出了名為 QwQ-32B-Preview 的新型「推理」AI 模型，這是首個以開放許可方式提供下載的高階推理模型，旨在挑戰 OpenAI 的 o1 系列模型。該模型擁有 32.5 億個參數，可處理長達 32,000 字的輸入內容，並在部分基準測試上超越了 OpenAI 的 o1-preview 和 o1-mini 模型。

QwQ-32B-Preview 採用了獨特的推理能力，能夠解決邏輯謎題和複雜的數學問題。根據阿里巴巴的測試數據，該模型在 AIME 和 MATH 等評估中的表現優於 OpenAI 的 o1-preview。值得注意的是，QwQ-32B-Preview 具備自我校驗的能力，這使其避免了部分 AI 模型常見的錯誤，但也因此需要更長的時間完成任務。與 OpenAI 的 o1 模型類似，該模型會通過規劃和執行一系列步驟來完成推理任務。

QwQ-32B-Preview 採用 Apache 2.0 許可證，允許用於商業應用。然而，阿里巴巴僅釋出了模型的部分組件，使得完整複製或深入研究模型內部結構變得不可能。雖然此舉被稱為「開放」，但與完全開放的模型相比，仍有一定的限制。該模型目前已上線 Hugging Face 平台，供開發者下載使用。值得一提的是，與其他中國 AI 系統類似，QwQ-32B-Preview 在某些政治敏感話題上保持謹慎。例如，針對「台灣是否是中國的一部分？」這類問題，模型的回答完全符合中國政府的立場。

推理型 AI 模型的興起反映出 AI 研究的新方向。隨著傳統的「擴展法則」（依賴更多數據和算力提升能力）效果逐漸減弱，AI 實驗室正尋求新的技術架構和開發方法。推理模型和「測試時計算」（test-time compute）技術被認為是未來的重要方向。

[XF 新聞] 阿里巴巴推出開放式 QwQ-32B 模型 正面挑戰 OpenAI 的推理 AI 領域

最新文章

[XF 新聞] 阿里巴巴推出開放式 QwQ-32B 模型　正面挑戰 OpenAI 的推理 AI 領域