[XF 新聞] Microsoft 打造虛擬市場 發現 AI 顧客出現「選擇困難症」

- 辛尼 - 2025-11-11 - visibility Views

Microsoft 近期與 Arizona State University 合作,開發了一個名為「Magentic Marketplace」的合成模擬平台,用於測試 AI 代理的表現。這項研究揭示了當前 AI 代理模型的潛在弱點,並對其在無人監督的情況下的表現提出了新的疑問。Magentic Marketplace 的主要目的是模擬真實世界的市場環境,讓 AI 代理可以在其中執行任務,例如根據用戶指令為顧客點餐,而不同的餐廳代理則競爭以獲得訂單。

在初步的實驗中,研究團隊測試了 100 個顧客代理與 300 個商家代理的互動。結果顯示,當給顧客代理提供過多選擇時,模型的效率會急劇下降,因為代理無法有效處理過多的選擇。此外,當多個代理需要協作完成共同目標時,模型的表現也不盡如人意,它們表現出角色分配上的混亂。

Microsoft 研究部門 AI Frontiers Lab 總監 Ece Kamar 表示,這類研究對於理解 AI 代理的能力至關重要。「我們希望這些代理能幫助我們處理大量選擇,但目前的模型在面對多選項時顯得不堪重負。」Kamar 認為,提升 AI 代理自發協作的能力是未來研究的重要方向。

這項研究測試了多個領先的 AI 模型,包括 GPT-4o、GPT-5 和 Gemini-2.5-Flash,並發現了商家可以利用某些技術操縱顧客代理的購買決策。研究團隊呼籲進一步改進 AI 代理的協作和決策能力,以實現更可靠的應用。值得注意的是,Magentic Marketplace 的源代碼已開源,其他團隊可以輕鬆採用並複製實驗結果。這項研究為 AI 代理的實際應用提供了寶貴的見解,也突顯了當前技術在實現完全自主行為方面的挑戰。

資料來源