【AI Agent】入門,看這一篇就夠了!
AI Agent技術(shù)正重塑我們的未來工作與生活。本文深入探索了AI Agent構(gòu)建平臺(tái)的奧秘,從概念理解到功能剖析,再到國(guó)內(nèi)外平臺(tái)的全面盤點(diǎn),帶領(lǐng)讀者領(lǐng)略這一變革性技術(shù)的魅力。
一、初識(shí)Agent(由來及現(xiàn)狀淺析)
Agent一詞,在人工智能領(lǐng)域的早期研究中,就已被用來描述能夠執(zhí)行任務(wù)或做出決策的程序或系統(tǒng)。
從2023年下半年開始,Agent這個(gè)詞的熱度便隨RAG,大模型開發(fā)框架等概念推出后一度飆升,至今依舊熱度不減(由下圖「百度指數(shù)」和「谷歌趨勢(shì)」關(guān)于“Agent”關(guān)鍵詞的搜索指數(shù)和趨勢(shì)可以看出)。
圖1-1來自百度指數(shù)(數(shù)據(jù)統(tǒng)計(jì)范圍:2022.11.30~2024.7.17)
圖1-2來自谷歌指數(shù)(數(shù)據(jù)統(tǒng)計(jì)范圍:2023.7.16~2024.7.17)
當(dāng)前Agent,在人工智能領(lǐng)域,通常用來指代“決策、感知、執(zhí)行于一體”的智能系統(tǒng)或智能應(yīng)用,并且進(jìn)行指揮和決策的“大腦”可以由各類LLM或VLM充當(dāng)。
在2023年11月20日,在OpenAI首屆開發(fā)者大會(huì)上推出GPTs以后,各種類GPTs構(gòu)建平臺(tái)便如雨后春筍一樣出現(xiàn),并且功能也越來越豐富。
在AI Agent熱浪下,國(guó)內(nèi)外的AI頭部公司、互聯(lián)網(wǎng)大廠以及原有RPA、企業(yè)辦公(CRM、客服)業(yè)務(wù)的公司,都紛紛推出了Agent相關(guān)產(chǎn)品。比如助力企業(yè)實(shí)現(xiàn)業(yè)務(wù)流程自動(dòng)化的Beam.ai、亞馬遜Bedrock Agent等,面向多種應(yīng)用場(chǎng)景的各類AI Agent構(gòu)建平臺(tái)(字節(jié)扣子、智譜清言智能體中心、百度文心智能體平臺(tái)、阿里百煉平臺(tái)、百度智能客服產(chǎn)品-客悅“Agent0-1構(gòu)建功能”、昆侖萬維的skyAgents等。
這些Agent和GPTs,正在悄然改變?nèi)藗兊墓ぷ鞣绞?,提高工作與生產(chǎn)效率,以及重新定義生產(chǎn)力。據(jù)有關(guān)人士整理,目前單國(guó)內(nèi)外的AI Agent構(gòu)建平臺(tái),至少已經(jīng)超過80個(gè)。
圖1-3 智譜AI-智譜清言-“新建智能體”產(chǎn)品功能截圖
圖1-4 文心一言智能體-產(chǎn)品界面截圖
圖1-5 百度客悅智能對(duì)話平臺(tái)一2024年4月產(chǎn)品界面截圖(1)
圖1-6 百度客悅智能對(duì)話平臺(tái)一2024年4月產(chǎn)品界面截圖(2)
二、AI Agent產(chǎn)品特點(diǎn)、功能模塊、使用場(chǎng)景介紹
前段時(shí)間,吳恩達(dá)教授在紅杉資本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、規(guī)劃(Planning)、多智能體協(xié)作(Multiagent collaboration)四種AI Agent設(shè)計(jì)模式已經(jīng)逐步在一些Agent構(gòu)建平臺(tái)實(shí)現(xiàn),有的平臺(tái)如Coze等已經(jīng)能夠支持全部四種設(shè)計(jì)模式。
圖2-1 字節(jié)AI智能體構(gòu)建平臺(tái)(Coze)-產(chǎn)品主頁(yè)截圖
前面說了那么多,那到底什么是AI Agent構(gòu)建平臺(tái)?AI Agent平臺(tái)有什么特點(diǎn)?有哪些功能模塊?
如若你使用過幾款A(yù)I Agent平臺(tái)(工具)產(chǎn)品,你就會(huì)發(fā)現(xiàn):現(xiàn)在的這些AI Agent構(gòu)建平臺(tái),不論是產(chǎn)品UI界面上,還是產(chǎn)品功能邏輯上,都大差不差,均提供基于LLM通識(shí)能力的對(duì)話機(jī)器人構(gòu)建(簡(jiǎn)單智能體構(gòu)建),和基于LLM、工作流、知識(shí)庫(kù)、API插件于一體的復(fù)雜Agent構(gòu)建兩種。
且在創(chuàng)建Agent應(yīng)用時(shí),用戶只需要輸入一段簡(jiǎn)單的智能體工作&技能相關(guān)描述,后臺(tái)AI便能幫你自動(dòng)生成智能體名稱、頭像、簡(jiǎn)介及系統(tǒng)提示詞等內(nèi)容,非常之快捷、方便,分分鐘即可配好你的智能體。
圖2-2(a) 智譜清言-“新建智能體”-用戶輸入智能體描述
圖2-2(b) 智譜清言-“新建智能體”-系統(tǒng)據(jù)用戶輸入,智能生成的智能體配置信息
p.s.在當(dāng)前時(shí)間節(jié)點(diǎn)(2024年7月17日),字節(jié)Coze、百度文心智能體、智譜AI-智譜清言均早已實(shí)現(xiàn)“一句話描述智能體,AI自動(dòng)生成配置”,而騰訊元器(騰訊的智能體平臺(tái))還暫未實(shí)現(xiàn),還需要用戶手動(dòng)輸入頭像&名稱這些信息,否則無法創(chuàng)建成功。
2.1 基于LLM通識(shí)能力,快速構(gòu)建chatbot
1)適用場(chǎng)景:
適用于僅依照LLM通識(shí)能力,通過設(shè)定好LLM系統(tǒng)提示詞(人設(shè)&工作內(nèi)容&溫度值等參數(shù))就可以實(shí)現(xiàn)業(yè)務(wù)需求的場(chǎng)景,如“美食推薦專家”、“智能溝通專家”、“冷笑話專家”、“知識(shí)百科小助手”等等;
圖2-3 字節(jié)Coze新建智能體(test-bot)
2.2 基于知識(shí)庫(kù)&插件&工作流,構(gòu)建復(fù)雜智能體
1)適用場(chǎng)景:
如果需要訪問企業(yè)/個(gè)人知識(shí)庫(kù)、調(diào)用一些額外的API插件來實(shí)現(xiàn)業(yè)務(wù)需求,則需要配置好相應(yīng)的插件(如網(wǎng)絡(luò)爬蟲、xxx數(shù)據(jù)庫(kù)查詢與數(shù)據(jù)統(tǒng)計(jì)、天氣查詢、航班查詢等等)、知識(shí)庫(kù)數(shù)據(jù)。
另外,若有高階需求,比如需要根據(jù)不同的業(yè)務(wù)觸發(fā)條件執(zhí)行對(duì)應(yīng)的sop,則還需要配置工作流。
——當(dāng)前階段,一般的Agent平臺(tái),均提供“畫布拖拽式”的工作流搭建功能。在你的工作流中,你可以選擇讓LLM參與任務(wù),也可以選擇不參與,此時(shí)LLM就相當(dāng)于一個(gè)組件而已。
圖2-4 字節(jié)Coze-工作流配置頁(yè)面
圖2-5 Dify-工作流配置頁(yè)面
2.3 本節(jié)Q&A:
Q1. AI Agent產(chǎn)品有什么特點(diǎn)?
A1:AI Agent產(chǎn)品,一般具備AI Agent 0-1構(gòu)建的功能,可幫助用戶或企業(yè)零代碼或低代碼,通過“自然語(yǔ)言”的方式,輸入一段智能體描述,即可分分鐘快速搭建一個(gè)chatbot,如美食推薦專家、旅游規(guī)劃專家、情感樹洞、講冷笑話小助手。
此外,AI Agent構(gòu)建平臺(tái)產(chǎn)品,還支持個(gè)人和企業(yè)用戶構(gòu)建復(fù)雜的智能體應(yīng)用,通過提供【插件】、【知識(shí)庫(kù)】、【工作流】、【多智能體協(xié)作】配置相關(guān)功能,實(shí)現(xiàn)這一過程。同時(shí)支持對(duì)智能體【在線調(diào)試】和【發(fā)布】,發(fā)布形式上,支持按API調(diào)用,也支持直接發(fā)布帶前端界面的應(yīng)用(這種應(yīng)用一般以chatbot(對(duì)話機(jī)器人)形式為主,一些AppBuilder產(chǎn)品,還可支持低代碼和無代碼搭建網(wǎng)站等應(yīng)用,如之前火過的釘釘「宜搭」、「輕流」低代碼平臺(tái)。
- 在【LLM】選擇和配置上,平臺(tái)一般均會(huì)提供【自家LLM】和【三方LLM】,供用戶挑選;在LLM配置上,一般支持配置LLM的溫度值、系統(tǒng)提示詞、TOPK等參數(shù);
- 在【工作流】配置功能中,Agent平臺(tái),基本上均實(shí)現(xiàn)了“畫布式”可視化配置方式,用戶可通過拖拽節(jié)點(diǎn)組件{LLM、插件、數(shù)據(jù)庫(kù)、會(huì)話、變量等}來完成工作流配置。
- 在【插件】選擇上,平臺(tái)支持用戶從平臺(tái)整合好的【預(yù)置插件商城】中選擇,也支持用戶【自定義插件】。
- 在【知識(shí)庫(kù)】配置功能中,一般的Agent平臺(tái),均支持導(dǎo)入外部文檔資料(如pdf、excel、word等),功能豐富一些的Agent平臺(tái)不僅支持離線導(dǎo)入文檔,還支持“連接數(shù)據(jù)庫(kù)”(如語(yǔ)聚AI,支持連接飛書文檔,需提前定義好API相關(guān)配置)
——答案來自個(gè)人理解,僅供參考~
Q2. AI Agent用來解決誰(shuí)的什么問題的?
A2:AI Agent平臺(tái),可以幫助個(gè)人用戶和企業(yè),通過“自然語(yǔ)言”、工作流配置等方式,無代碼或低代碼地簡(jiǎn)單高效的搭建一款chatbot應(yīng)用,在對(duì)話和任務(wù)執(zhí)行過程中,用戶可選擇LLM來完成任務(wù),相較于原來的智能對(duì)話機(jī)器人“總是從頭說”、“回答話術(shù)一成不變”、“無法很好理解用戶問題”等問題來說,基于LLM的chatbot更加智能、更加“懂用戶”。
——答案來自個(gè)人理解,僅供參考~
Q3. 目前AI Agent產(chǎn)品有哪幾種設(shè)計(jì)模式?分別有什么特點(diǎn)?
A3:吳恩達(dá)教授在紅杉資本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、規(guī)劃(Planning)、多智能體協(xié)作(Multiagent collaboration)四種AI Agent設(shè)計(jì)模式。
- 反思(Reflection):指的是AI代理在執(zhí)行任務(wù)時(shí)能夠自我評(píng)估和調(diào)整其行為的能力。通過反思,AI可以學(xué)習(xí)從經(jīng)驗(yàn)中獲得教訓(xùn),從而在未來的決策中做出更好的選擇。
- 工具使用(Tool Use):這涉及到AI代理能夠識(shí)別、選擇和使用不同的工具或資源來完成特定的任務(wù)。例如,一個(gè)機(jī)器人可能會(huì)使用不同的工具來修理設(shè)備或完成建筑任務(wù)。
- 規(guī)劃(Planning):這是指AI代理能夠制定和執(zhí)行長(zhǎng)期或復(fù)雜的計(jì)劃。規(guī)劃能力使AI能夠預(yù)見未來的需求和挑戰(zhàn),并提前做出相應(yīng)的安排。
- 多智能體協(xié)作(Multiagent Collaboration):這涉及到多個(gè)AI代理能夠協(xié)同工作,共同完成更復(fù)雜的任務(wù)。這種協(xié)作可以提高效率和效果,尤其是在需要不同技能和資源的情況下。
Q4. AI Agent平臺(tái),一般有哪些功能模塊?
A4:基于LLM的chatbot0-1搭建,包括:【智能體創(chuàng)建】、【智能體配置】、【智能體調(diào)試】、【智能體發(fā)布】功能;以及【智能體商城】功能,支持用戶從平臺(tái)中挑選其感興趣的智能體進(jìn)行應(yīng)用和體驗(yàn);以及多智能體協(xié)作功能。
關(guān)于【智能體配置】功能,包括智能體『基本信息配置』(名稱、頭像、簡(jiǎn)介、LLM模型選擇與參數(shù)配置(工作技能和工作內(nèi)容&流程描述、溫度值等)、『智能體復(fù)雜配置』(工作流配置、插件配置、知識(shí)庫(kù)配置等);
- 在【LLM】選擇和配置上,平臺(tái)一般均會(huì)提供【自家LLM】和【三方LLM】,供用戶挑選;在LLM配置上,一般支持配置LLM的溫度值、系統(tǒng)提示詞、TOPK等參數(shù);
- 在【工作流】配置功能中,Agent平臺(tái),基本上均實(shí)現(xiàn)了“畫布式”可視化配置方式,用戶可通過拖拽節(jié)點(diǎn)組件{LLM、插件、數(shù)據(jù)庫(kù)、會(huì)話、變量等}來完成工作流配置。
- 在【插件】選擇上,平臺(tái)支持用戶從平臺(tái)整合好的【預(yù)置插件商城】中選擇,也支持用戶【自定義插件】。
- 在【知識(shí)庫(kù)】配置功能中,一般的Agent平臺(tái),均支持導(dǎo)入外部文檔資料(如pdf、excel、word等),功能豐富一些的Agent平臺(tái)不僅支持離線導(dǎo)入文檔,還支持“連接數(shù)據(jù)庫(kù)”(如語(yǔ)聚AI,支持連接飛書文檔,需提前定義好API相關(guān)配置)
——答案來自個(gè)人理解,僅供參考~
三、國(guó)內(nèi)外AI Agent產(chǎn)品盤點(diǎn)
下面給出行內(nèi)有關(guān)人士整理(+個(gè)人補(bǔ)充)的海內(nèi)外AI Agent平臺(tái)盤點(diǎn)名單,包括68個(gè)海外AI Agent構(gòu)建平臺(tái)和 21個(gè)國(guó)內(nèi)AI Agent平臺(tái) 產(chǎn)品名稱及介紹,老師們可根據(jù)產(chǎn)品名稱自行搜索體驗(yàn),建議從互聯(lián)網(wǎng)大廠、AI獨(dú)角獸廠商的產(chǎn)品開始使用體驗(yàn)。
3.1 68款 海外AI Agent構(gòu)建平臺(tái)盤點(diǎn)及簡(jiǎn)要介紹
圖3-1 海外AI Agent平臺(tái)構(gòu)建(圖來自網(wǎng)絡(luò),僅做學(xué)習(xí)交流使用,如有侵權(quán)聯(lián)系刪除)
圖3-2 SignalWire Agent平臺(tái)構(gòu)建
3.2 21款 國(guó)內(nèi)AI Agent構(gòu)建平臺(tái)盤點(diǎn)
除此之外,還有百度智能客服-客悅平臺(tái)、簡(jiǎn)易云的語(yǔ)聚AI產(chǎn)品等,也支持AI Agent構(gòu)建。
四、本文參考資料
文章《全球80+AI Agent構(gòu)建平臺(tái)大盤點(diǎn)…》:https://hub.baai.ac.cn/view/37088
本文由 @南方碟道 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
最近對(duì)AI Agent技術(shù)很感興趣,看了很多篇相關(guān)文章,這篇文章寫得很詳細(xì)也很清晰,要學(xué)習(xí)AI的話還是需要付出一定的精力的,這篇文章也算是給我提供了一個(gè)思路了。
最近看了很多篇AI 的文章,平時(shí)圖方便還是國(guó)內(nèi)的AI用的多,個(gè)人認(rèn)為滿足平時(shí)需求的話國(guó)內(nèi)AI就挺夠用的。
嗯嗯 是呢 如果自己使用的話,就對(duì)比幾款,挑那么一兩個(gè)滿足自己使用需要的就好啦