自生成式 AI(Generative AI)於 2022 年 11 月正式與大眾相見以來,在短時間內改變人們在教育和多種工作場域的行為模式,從萬事問 Google 的關鍵字檢索,到現在能用符合人類日常溝通的對話方法,來與生成式 AI 進行互動,過往需要人類花費大量時間才能理解的文本,乃至構思複雜情境的思維架構,如今生成式 AI 都能在掐指之間提供快速的協助,使用者也能根據自身需求,透過適當的提示設計(Prompt Engineering) 引導生成式 AI 往期待的方向成長,使其有能力更準確地回應我們的問題。然而,凡是有操作過生成式 AI 的使用者,都不免遇過其答非所問,即使是提出有確切答案的命題,往往仍會出現不著邊際、胡亂瞎扯的話術式回應。
生成式 AI 的迅速發展為人們帶來了無限想像,期待只要給予大量資料訓練模型,就能在多領域應用中協助決策與解決問題。此大型語言模型(Large Language Models, LLMs)造就出一位堪比愛因斯坦等級的大師,有著高智商(IQ),憑藉著強大的記憶力、分析力、創造力,能夠歸納推理(Inductive Reasoning),舉一反三,甚至移花接木,產出異想不到的創意。然而,為何聰明如此,儘管回答問題時展現了邏輯清晰的脈絡,但實質上卻顯得空泛且重複性高?
過度的期待往往讓人們忽略了一個原則 —「聰明」跟「資訊」是兩件事。古人的智慧『千金難買早知道』、『秀才不出門,難知天下事』,清楚地告訴我們,再聰明的人,也不可能無所不知,無所不能。沒有對當下情況的了解,缺乏適時的情報,生成式 AI回答時就只能空洞的論述而無法產出反映現況的洞察,進而協助人們做出正確的決策。
ai透過大型語言模型訓練展現強大的創造力與推理能力。(圖片由recraft.ai生成)
生成式 AI 萬能,但缺乏數據則萬萬不能
以目前的技術,當你向 Chat GPT 展示了一個人倒臥地上,雙手抱著心臟痛苦的畫面,並詢問發生了什麼事,ChatGPT 能根據過往它所訓練的資料,判斷這個人可能是心臟病發作。生成式 AI 主要透過歸納推理來運作,藉由龐大的運算力與巨量數據的學習,由特定範例進行歸納概率化以生成新內容。它擁有有如人類般辨識與回覆問題的能力,針對一般事物的摘要、論述或判斷是可以提供一定智能水平的滿意度,但也伴隨著不確定性。當要下關鍵決策(Mission-Critical Decisions)時,則往往因為缺乏當下的資訊,無法提供精準可靠的執行計畫,因此對這類的 AI 應用,生成式 AI雖能夠提出參考建議或想法,但終究因沒有具體行動方案,無法作為人們最後的決策依據。
(相關報導:
ASML財報暴雷嚇壞市場!財務長這段話有貓膩 分析師:AI需求恐是假象
|
更多文章
)
以即時數據賦能,成為具有決斷力的 Actionable AI
如果希望生成式 AI 能從目前被動論述的角色轉化成有行動力的 Actionable AI,則需要取得當下的資料,包括背景、相關專業資訊以及即時周遭訊息。這些資料不是用來訓練或再訓練(refine) 模型的,而是用來回應現狀、限縮範圍、引導推理。雖然近來學界、業界提出不少架構,我們以「擷取增強生成」(Retrieval-Augmented Generation,RAG)架構為代表,使其能夠連結外部數據源如向量資料庫(vector database)、知識圖譜(knowledge graph)、搜尋引擎(search engine)等,提供即時數據擷取,當檢索到具體且相關的資訊時,AI會使用這些資訊來做出更精確且符合上下文的決策,將其應用到當下情境中以得出結論,此時AI的回覆會變得具體並具有行動力。
數據和生成式ai藉由擷取增強生成將能夠從目前的被動論述轉化成有行動力的 Actionable AI。(作者提供)
RAG 架構會幫助 AI 從外部數據生態中擷取當前場景相關的數據,做出行動方案,比如這位心臟病病患的附近是否有設有 AED(Automated External/electronic Defibrillator 自動體外心臟去顫器)、是否有警衛或救護車在附近。當這些即時、多元的資訊被整合進來後,AI 就不僅僅是告訴你這個人可能心臟病發作,而是會引導你找到最近的AED,或者告訴你附近有誰能幫忙,包括如何聯繫救護車等,能基於具體的、即時的數據給出可執行的建議,讓使用者能夠在危急時刻做出正確的行動。 從這個意義上說,生成式 AI 是運用歸納推理來創造和概念化,而 RAG 則在檢索過程中,以化繁為簡的方式層層找出特定資訊來完善整體效果,用具體的最新資訊來建立生成過程,以改進和支援 AI 的輸出。這可以說歸納推理(Inductive Reasoning)與演繹推理( Deductive Reasoning)完美結合所發展出真正的智能。
ai未來將能夠用於智慧醫療。(圖片由recraft.ai生成)
另一個例子,目前的生成式 AI 能根據過往的旅遊數據,如消費者瀏覽偏好、歷史旅遊紀錄等,來推薦下一個旅遊目的地、住宿和活動,然而,牽涉旅遊選擇的背後因素五花八門,如果能導入RAG架構,系統便能即時檢索並整合多種與旅遊相關的即時資訊,假設消費者打算安排接下來的聖誕假期,卻不知道可以去哪個城市,RAG 能綜合檢索最新的機票價格,了解哪個城市的航班正在特價;從天氣預報判斷哪個城市適合戶外活動還是室內參觀;該城市哪一家五星級飯店正在進行限時促銷、當地即將舉辦的演唱會票券剩餘情形,以及匯率變動情況,建議消費者在匯率有利時兌換貨幣或調整行程以節省成本,RAG 能將這些方方面面的即時資訊融入推薦系統中,提供消費者更靈活、個性化、考慮周全的旅遊建議。
擷取增強生成(RAG)將進一步顛覆既有的推廣行銷模式。(圖片由recraft.ai生成)
Actionable AI 的前提 — 數據民主化
生成式 AI的不斷精進,使得人們在工作或學習中,無論其技術背景如何,都能輕鬆透過雲端AI 服務使用事先訓練好的模型。「AI for Everyone」是令人期待的願景,只是AI模型再強大,當缺乏即時、可用、有用的資訊時,它就像空有高智商卻無法做出有效決策的大師。隨著物聯網快速發展,龐大且無所不在的數據正不斷的產生,掌握數據,才是有效運用 AI 的關鍵。然而,數據資產、數據隱私與個資保護等議題讓許多數據擁有者不願分享數據,這為數據獲取帶來了層層的障礙。同時,儘管能夠取得數據,如何有時效地準備可用數據仍是實務上的難題,一個又一個的數據孤島缺乏串聯,源源不絕的活數據也讓使用者在清理和整合上遇到極大挑戰。這種封閉的數據環境阻礙了數據的廣泛應用,限制了生成式 AI 的潛能發揮與決策能力。
要讓 AI 從抽象推理轉變成「具行動力的AI」(Actionable AI)並解決實際問題,我們積極推動數據民主化(Data democratization)。這需要建立一個開放、跨領域、跨平台的數據共享生態,讓即時、無所不在的數據變得隨手可得、隨時可用。使用數據應該像使用電腦一樣簡單方便。當多元且高品質的數據能被有效提取、共享和分析,AI 才能根據最新、最相關的資訊,提出真正可行的解決方案。
總結來說,實現具行動力的AI不僅依賴技術創新,更在於數據治理與共享模式的革新。數據民主化賦予了企業和個人靈活使用和應用數據的能力,讓數據成為人人可用的寶貴資源,更成為推動AI賦能未來的關鍵。這不僅能改變個別產業,還促進 AI 在各行各業的深度應用,更推動整體數據生態的進步。