《經濟學人》2025年AI展望:更聰明的人工智慧來了!為何「AI代理」值得期待

2025年AI展望。人工智慧即將進入下一發展階段:AI代理。(由Dall-E 生成)。

「我猜,到明年年底左右,我們可能就會有比任何人類都更聰明的人工智慧了。」——特斯拉(Tesla)執行長馬斯克(Elon Musk)2024年4月8日時說道。

年末將至,生成式AI大神們早已開始慶祝聖誕節。OpenAI去年12月5日率先展開了為期12天的「Shipmas」活動——每天公佈新產品、新功能或進行產品演示,例如影像生成工具Sora、寫作及編碼程式Canvas等皆正式上線。對手Google也不甘示弱,隨後在11日公布其最新的生成式AI模型Gemini 2.0,並推出兩款基於該模型的高階產品原型Astra和Mariner,象徵著人工智慧正邁入下一階段:AI代理(AI Agent)

根據OpenAI的分類系統,人工智慧的發展可分為5個階段,分別為:

  • 對話(conversational AI):基礎的AI聊天工具,像是ChatGPT,可以理解和回應人類語言。
  • 推理(reasoners):能像人類一樣解決問題,具有一般人的邏輯推理能力。
  • 代理(agents,或譯「自主」):可以正確地採取行動(選擇工具),大大減少人類介入參與的需求。
  • 創新(innovators):參與創造性和技術性突破,從執行命令的工具進化成發明的積極貢獻者。
  • 組織(organizations):最高等級的AI,能管理人類組織的運作。

《經濟學人》11日指出,矽谷對AI代理抱持著相當高的期望,人工智慧數據公司「Scale」的創辦人Alex Wang 則表示,AI代理可能成為科技界在2025年最重要的突破之一

AI代理(AI agents)是指一種能夠自主執行任務的人工智慧,透過設計工作流程並運用現有工具來完成目標。它們不僅具備自然語言處理能力,還可以進行決策、解決問題、與外界互動並執行具體行動。

與傳統「一問一答」型的AI系統不同,AI代理能夠自動規劃目標、分解任務、運用外部數據或工具來補充資訊,並不斷自我修正。此外,AI代理可以根據使用者的需求進行學習與反饋優化,提供更個性化的體驗,這適用於解決更複雜的任務,像是軟體設計和IT自動化等。

《經濟學人》指出,對AI代理的期待已經推動像Salesforce等軟體巨頭的股價上漲。Salesforce在10月推出工作用AI代理「Agentforce」後的一週內,便與超過200個客戶達成合作協議;而Salesforce的競爭對手微軟(Microsoft)也同樣推出了多種類型的AI代理。

AI產品的開發挑戰

從OpenAI和Google的新品發佈可以看出,產品的重要性超越了模型。《經濟學人》表示,雖然致力於大型語言模型(LLMs)的科學家正努力追求技術突破,但開發者卻面臨著市場壓力,需要推出各種產品來證明這些新技術真的有市場需求。

開發生成式AI產品和大多數商品不同,一般而言,產品開發者會從消費者的需求出發,回頭設計產品;但生成式AI發展的速度太快,反而是技術決定了產品型態。OpenAI的產品長魏爾(Kevin Weil)說:「通常我們被教導不要當那種拿著錘子到處找釘子的人,但現在每隔兩個月,電腦就能做出以前從未實現過的事情」。 (相關報導: 輸入文字讓ChatGPT幫你拍成影片 OpenAI推Sora向Meta、Google正面進攻 更多文章

不過這次,OpenAI的新產品卻出現不少問題。公司執行長阿特曼(Sam Altman)表示,由於公司低估需求,因此在產品推出後不久就不得不暫停ChatGPT訂閱用戶對Sora的使用權限。即使有些用戶獲得了使用權,並對Sora的功能印象深刻,但他們發現早期測試版本中出現的問題,現在依舊存在,其中最明顯的問題是Sora無法真實呈現複雜的動作。科技評論YouTuber布朗里(Marques Brownlee)指出,Sora幾乎一定會搞砸任何四足動物的動作,有些物品也會莫名其妙的消失。