《經濟學人》2025年AI展望：更聰明的人工智慧來了！為何「AI代理」值得期待

「我猜，到明年年底左右，我們可能就會有比任何人類都更聰明的人工智慧了。」——特斯拉（Tesla）執行長馬斯克（Elon Musk）2024年4月8日時說道。

年末將至，生成式AI大神們早已開始慶祝聖誕節。OpenAI去年12月5日率先展開了為期12天的「Shipmas」活動——每天公佈新產品、新功能或進行產品演示，例如影像生成工具Sora、寫作及編碼程式Canvas等皆正式上線。對手Google也不甘示弱，隨後在11日公布其最新的生成式AI模型Gemini 2.0，並推出兩款基於該模型的高階產品原型Astra和Mariner，象徵著人工智慧正邁入下一階段：AI代理（AI Agent）。

根據OpenAI的分類系統，人工智慧的發展可分為5個階段，分別為：

訂閱風傳媒VIP會員，享有零廣告閱讀介面

透過<Google新聞>追蹤風傳媒

對話（conversational AI）：基礎的AI聊天工具，像是ChatGPT，可以理解和回應人類語言。
推理（reasoners）：能像人類一樣解決問題，具有一般人的邏輯推理能力。
代理（agents，或譯「自主」）：可以正確地採取行動（選擇工具），大大減少人類介入參與的需求。
創新（innovators）：參與創造性和技術性突破，從執行命令的工具進化成發明的積極貢獻者。
組織（organizations）：最高等級的AI，能管理人類組織的運作。

《經濟學人》11日指出，矽谷對AI代理抱持著相當高的期望，人工智慧數據公司「Scale」的創辦人Alex Wang 則表示，AI代理可能成為科技界在2025年最重要的突破之一。

AI代理（AI agents）是指一種能夠自主執行任務的人工智慧，透過設計工作流程並運用現有工具來完成目標。它們不僅具備自然語言處理能力，還可以進行決策、解決問題、與外界互動並執行具體行動。

與傳統「一問一答」型的AI系統不同，AI代理能夠自動規劃目標、分解任務、運用外部數據或工具來補充資訊，並不斷自我修正。此外，AI代理可以根據使用者的需求進行學習與反饋優化，提供更個性化的體驗，這適用於解決更複雜的任務，像是軟體設計和IT自動化等。

《經濟學人》指出，對AI代理的期待已經推動像Salesforce等軟體巨頭的股價上漲。Salesforce在10月推出工作用AI代理「Agentforce」後的一週內，便與超過200個客戶達成合作協議；而Salesforce的競爭對手微軟（Microsoft）也同樣推出了多種類型的AI代理。

AI產品的開發挑戰

從OpenAI和Google的新品發佈可以看出，產品的重要性超越了模型。《經濟學人》表示，雖然致力於大型語言模型（LLMs）的科學家正努力追求技術突破，但開發者卻面臨著市場壓力，需要推出各種產品來證明這些新技術真的有市場需求。

開發生成式AI產品和大多數商品不同，一般而言，產品開發者會從消費者的需求出發，回頭設計產品；但生成式AI發展的速度太快，反而是技術決定了產品型態。OpenAI的產品長魏爾（Kevin Weil）說：「通常我們被教導不要當那種拿著錘子到處找釘子的人，但現在每隔兩個月，電腦就能做出以前從未實現過的事情」。（相關報導：輸入文字讓ChatGPT幫你拍成影片　OpenAI推Sora向Meta、Google正面進攻｜更多文章）

不過這次，OpenAI的新產品卻出現不少問題。公司執行長阿特曼（Sam Altman）表示，由於公司低估需求，因此在產品推出後不久就不得不暫停ChatGPT訂閱用戶對Sora的使用權限。即使有些用戶獲得了使用權，並對Sora的功能印象深刻，但他們發現早期測試版本中出現的問題，現在依舊存在，其中最明顯的問題是Sora無法真實呈現複雜的動作。科技評論YouTuber布朗里（Marques Brownlee）指出，Sora幾乎一定會搞砸任何四足動物的動作，有些物品也會莫名其妙的消失。

《經濟學人》指出，Google 的AI代理技術也還不夠完善。例如，Astra現在只開放給一小部分「受信任的測試者」使用，它可以用多種語言解釋透過手機鏡頭看到的內容，並能存取Google搜尋和地圖等服務。在展示中，Astra能對名畫進行專業講解，但當《經濟學人》詢問哪些城市展出最多原作時，它卻無法回答。Mariner則是另一個新原型，能在瀏覽器上執行任務，例如在線上超市新增商品到購物車裡，但它卻不能完成結帳。

AI代理會遇到哪些阻礙？

《經濟學人》指出3項原因，說明為什麼打造AI代理比開發聊天機器人更困難。一是數據問題。與從網路上抓取資料來回答問題的聊天機器人不同，AI代理需要有關任務執行方式的數據，包括操作順序和行為背後的推理邏輯。舉例而言，像處理客戶訂單這類簡單的例行工作，可能比較容易獲得所需的數據，但在很多情況下，比如讓AI代理參與公司營運的決策等，要找到足夠的數據來訓練就相當困難，

第二個困難是建立信任。《經濟學人》指出，要檢查聊天機器人回答得對不對通常很簡單，但要判斷AI代理是否在你的預算內定了最好的餐廳或旅行，就比較困難了。此外，使用者可能會對於是否要提供敏感的個資有所保留，例如消費紀錄等，但這些資訊可能正是AI代理正常運作所需要的。

最後一個問題是成本。AI代理要能替使用者進行推理、規劃並執行任務，需要用到能處理複雜任務的模型，還需要低延遲、能與像網頁瀏覽器等工具互動的能力，並要有足夠的記憶體來為用戶提供個人化服務。這些技術不僅難以開發，還需要大量運算能力來支持，成本非常高昂。成本壓力已經浮現，OpenAI在5日推出ChatGPT的專業版本——可以無限制地存取其所有的最新功能，每個月要價200美元（折合台幣近6500元），是基本版訂閱價格的10倍。

其他值得關注的趨勢

除了AI代理令人期待外，微軟（Microsoft）在5日還指出，2025年將會有「更省電的AI」。馬斯克（ELon Musk）在今年4月的訪談中提到，AI在過去18個月的發展速度超乎預期，但同時也開始因種種限制而被拖慢步伐：「去年是晶片限制⋯⋯人們無法取得足夠的輝達（Nvidia）晶片。今年則轉向了電壓變壓器的供應。一兩年後，就是供電問題了。」

AI的吃電問題一直是科技巨頭們關心的重點，微軟指出，其正與超微（AMD）、英特爾（Intel）和輝達（Nvidia）等半導體公司合作提升AI硬體的效率，以緩解電力挑戰。微軟表示，這正是為什麼儘管在2020年全球數據中心的工作量大約是2010年的9倍，但電力需求只成長了10%。除此之外，未來幾年內啟動的新數據中心將不會消耗大量的水來冷卻設備，而是採用超高效的冷卻系統，例如冷板。（相關報導：輸入文字讓ChatGPT幫你拍成影片　OpenAI推Sora向Meta、Google正面進攻｜更多文章）

除了硬體升級外，微軟還將繼續投資並使用風能、地熱能、核能和太陽能等無碳能源。該公司正進行長期投資，已將更多無碳電力納入其營運的電網。微軟Azure的技術長Mark Russinovich表示：「到2025年及以後，我們將越來越多地從整體角度看待數據中心、能源和資源，以最大化整個基礎設施的效率」。