全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

0 評論 1095 瀏覽 0 收藏 8 分鐘

“探秘智能體,解讀未來智能?!?在人工智能的前沿領(lǐng)域,智能體(AI Agent)正逐漸成為焦點。它究竟是如何構(gòu)建的?又具備怎樣的能力?本文將深入解讀前 OpenAI 高管和斯坦福頂尖學(xué)者的綜述,為你揭開智能體的神秘面紗,展現(xiàn)其在模擬人類行為等方面的巨大潛力。

智能體(AI Agent)=大模型(LLM)+記憶(Memory)+規(guī)劃(Planning)+工具使用(Tool Use)

LLM(AI大模型)是Agent的大腦,屬于“中樞”模型,要求有以下3種能力:

planning skills:對問題進行拆解得到解決路徑,既進行任務(wù)規(guī)劃

tool use:評估自己所需的工具,進行工具選擇,并生成調(diào)用工具請求

memory:短期記憶包括工具的返回值,已經(jīng)完成的推理路徑;長期記憶包括可訪問的外部長期存儲,例如知識庫

斯坦福大學(xué)+谷歌頂尖學(xué)者發(fā)布的《Generative Agents: Interactive Simulacra of Human Behavior》中做了一個AI小鎮(zhèn),通過類似《模擬人生》的沙盒環(huán)境中里面內(nèi)置了25個Agent。

用戶可以觀察并干預(yù) Agent 規(guī)劃他們的日常、分享新聞、建立關(guān)系以及協(xié)調(diào)團隊活動。這篇文章要解決的問題是如何創(chuàng)建能夠模擬人類行為的生成Agent,這些Agent可以在交互式應(yīng)用中使用,例如沉浸式環(huán)境、人際交流排練工具和原型設(shè)計工具。

架構(gòu)

這篇論文提出了一種生成代理架構(gòu),用于解決人類行為模擬的問題。具體來說,

記憶流:首先,論文描述了一個長期記憶模塊,稱為記憶流,它以自然語言形式記錄代理的所有經(jīng)歷。記憶對象包括自然語言描述、創(chuàng)建時間戳和最近訪問時間戳。

檢索函數(shù):為了決定代理的下一步行動,論文實現(xiàn)了一個檢索函數(shù),該函數(shù)根據(jù)代理當(dāng)前的情況返回記憶流的一個子集。檢索函數(shù)考慮了三個主要組件:

新穎性:最近訪問的記憶對象得分較高。

重要性:代理認(rèn)為重要的記憶對象得分較高。

相關(guān)性:與當(dāng)前情況相關(guān)的記憶對象得分較高。

反思:其次,論文引入了反思的概念,這是一種更高級別的思維,由代理定期生成。反思通過將最新的記憶記錄作為查詢,并從語言模型中獲取相關(guān)記憶來生成。

規(guī)劃和反應(yīng):最后,論文描述了規(guī)劃和反應(yīng)的過程。規(guī)劃描述了代理未來的行動序列,幫助保持行為的一致性。反應(yīng)則是代理在感知到環(huán)境變化時采取的行動。對話生成則是基于代理之間的記憶來進行的。

實驗

論文通過在一個類似《模擬人生》的沙盒環(huán)境中實現(xiàn)生成代理來驗證其架構(gòu)。具體來說,

環(huán)境:沙盒環(huán)境被稱為Smallville,包含一個小鎮(zhèn),其中有25個獨特的代理。每個代理由一個簡單的精靈頭像表示,初始記憶包括一個自然語言描述的段落。

用戶控制:用戶可以通過自然語言與代理互動,指定一個角色來感知代理。用戶也可以直接命令一個代理,使其更像代理的“內(nèi)心聲音”。

環(huán)境交互:代理在沙盒世界中移動和與環(huán)境中的對象互動。用戶可以改變代理的環(huán)境狀態(tài),例如將廚房爐子從“開啟”改為“燃燒”。結(jié)果

可控評估:在可控評估中,論文通過“采訪”代理來測試其在自我認(rèn)知、記憶、計劃、反應(yīng)和反思方面的能力。結(jié)果表明,完整的生成代理架構(gòu)生成的行為最為可信,而移除某個組件后性能會下降。

端到端評估:在端到端評估中,論文觀察了25個代理在兩天內(nèi)的自發(fā)行為。結(jié)果顯示,代理之間形成了信息傳播、關(guān)系建立和協(xié)調(diào)。具體來說,關(guān)于Sam市長競選的信息傳播范圍從1人(4%)增加到8人(32%),關(guān)于Isabella情人節(jié)派對的信息傳播范圍從1人(4%)增加到13人(52%)。

總結(jié)

智能體(AI Agent)可以比喻為一部高效運作的智能機器人。這部機器人由以下幾個核心部件組成:

大語言模型(LLM):相當(dāng)于機器人的大腦。它負(fù)責(zé)處理和理解語言信息,就像人類大腦處理思考、理解和溝通一樣。大語言模型使得機器人能夠理解指令、回答問題并與人類進行流暢的對話。

記憶(Memory):相當(dāng)于機器人的存儲系統(tǒng)。它允許機器人記住過去的交互和經(jīng)驗,以便在未來的任務(wù)中加以利用。就像人類根據(jù)記憶來做出決策一樣,智能體通過記憶來提高其處理問題的能力。

規(guī)劃(Planning):相當(dāng)于機器人的導(dǎo)航系統(tǒng)。它幫助機器人制定行動方案,以實現(xiàn)既定目標(biāo)。就像我們在旅行前規(guī)劃路線一樣,智能體通過規(guī)劃來確定如何執(zhí)行任務(wù)。

工具使用(Tool Use):相當(dāng)于機器人的雙手。它使得機器人能夠使用各種工具來輔助完成任務(wù)。就像人類使用工具來提高工作效率一樣,智能體通過使用工具來擴展其功能,解決更復(fù)雜的問題。

所以智能體(AI Agent)就像一個具備高級認(rèn)知能力、豐富經(jīng)驗、出色規(guī)劃和實際操作能力的智能機器人,能夠高效地完成各種復(fù)雜任務(wù)。

本文由人人都是產(chǎn)品經(jīng)理作者【陳宇明】,微信公眾號:【碼個蛋】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!