[XF 新聞] Microsoft 打造虛擬市場　發現 AI 顧客出現「選擇困難症」

- 辛尼 - 2025-11-11

Microsoft 近期與 Arizona State University 合作，開發了一個名為「Magentic Marketplace」的合成模擬平台，用於測試 AI 代理的表現。這項研究揭示了當前 AI 代理模型的潛在弱點，並對其在無人監督的情況下的表現提出了新的疑問。Magentic Marketplace 的主要目的是模擬真實世界的市場環境，讓 AI 代理可以在其中執行任務，例如根據用戶指令為顧客點餐，而不同的餐廳代理則競爭以獲得訂單。

在初步的實驗中，研究團隊測試了 100 個顧客代理與 300 個商家代理的互動。結果顯示，當給顧客代理提供過多選擇時，模型的效率會急劇下降，因為代理無法有效處理過多的選擇。此外，當多個代理需要協作完成共同目標時，模型的表現也不盡如人意，它們表現出角色分配上的混亂。

Microsoft 研究部門 AI Frontiers Lab 總監 Ece Kamar 表示，這類研究對於理解 AI 代理的能力至關重要。「我們希望這些代理能幫助我們處理大量選擇，但目前的模型在面對多選項時顯得不堪重負。」Kamar 認為，提升 AI 代理自發協作的能力是未來研究的重要方向。

這項研究測試了多個領先的 AI 模型，包括 GPT-4o、GPT-5 和 Gemini-2.5-Flash，並發現了商家可以利用某些技術操縱顧客代理的購買決策。研究團隊呼籲進一步改進 AI 代理的協作和決策能力，以實現更可靠的應用。值得注意的是，Magentic Marketplace 的源代碼已開源，其他團隊可以輕鬆採用並複製實驗結果。這項研究為 AI 代理的實際應用提供了寶貴的見解，也突顯了當前技術在實現完全自主行為方面的挑戰。

資料來源

Gemini-2.5-Flash GPT-4o GPT-5 Magentic Marketplace Microsoft XF 新聞

[XF 新聞] Microsoft 打造虛擬市場 發現 AI 顧客出現「選擇困難症」

最新文章

[XF 新聞] Microsoft 打造虛擬市場　發現 AI 顧客出現「選擇困難症」