Agent 測評:Manus vs TARS vs Genspark vs Flowith
隨著AI技術(shù)的飛速發(fā)展,AI Agent(智能體)逐漸成為改變生活與工作的重要工具。本文將對四款熱門的AI Agent產(chǎn)品——Manus、TARS、Genspark和Flowith進(jìn)行全面測評,分析它們的核心功能、優(yōu)點與缺點,并探討其在企業(yè)級應(yīng)用中的潛力與挑戰(zhàn)。
2025 年涌現(xiàn)了一大批 Agent 產(chǎn)品,讓 AI 從從簡單的聊天工具進(jìn)化成了能夠改變生活與工作的“AI Agent”。AI Agent是?種能夠感知環(huán)境、做出決策并采取?動以實現(xiàn)特定?標(biāo)的智能系統(tǒng)?,F(xiàn)代基于?語?模型的 AI Agent 通常具備以下” 四件套” 特點:
這四項核心能力相互配合,使 AI Agent 能夠處理各種復(fù)雜任務(wù),從簡單的信息檢索到復(fù)雜的決策分析,甚至是跨領(lǐng)域的創(chuàng)造性工作。與傳統(tǒng)的對話式AI助手相比,AI Agent 具有更強(qiáng)的自主性和目標(biāo)導(dǎo)向性,能夠主動規(guī)劃并執(zhí)行任務(wù),而不僅僅是被動地回應(yīng)用戶請求。
01 Manus
產(chǎn)品介紹
Manus 是由中國團(tuán)隊 Monica.im 開發(fā)的通用型自主AI Agent(智能體),他的工作原理是基于底層 AI 大模型的能力基礎(chǔ),通過自主任務(wù)分解將復(fù)雜任務(wù)拆解為多個子任務(wù),并動態(tài)調(diào)用不同的 Agent 或工具來執(zhí)行每個子任務(wù),最終完成整體任務(wù)。Manus采用Multiple Agent架構(gòu),運行在獨立虛擬機(jī)中,能夠調(diào)用多種工具執(zhí)行任務(wù)。其核心是”知行合一”的理念,不僅能思考,還能直接執(zhí)行任務(wù)并交付結(jié)果。
Manus 在 GAIA Benchmark 上評分高于 openai 的 Deep Research(GAIA Benchmark是由 Meta AI、Hugging face 等機(jī)構(gòu)制定的一個包含 466 道問題的一個通用人工智能助手的基準(zhǔn)測試)
核心功能
- 自主規(guī)劃能力:能夠自主理解任務(wù),拆分為子任務(wù)并規(guī)劃執(zhí)行步驟
- 代碼執(zhí)行:可以編寫和執(zhí)行代碼,解決編程和數(shù)據(jù)分析問題
- 網(wǎng)絡(luò)搜索:能夠自主進(jìn)行網(wǎng)絡(luò)搜索,獲取最新信息
- 數(shù)據(jù)分析與可視化:處理數(shù)據(jù)并生成圖表和報告
- 內(nèi)容創(chuàng)作:撰寫文章、報告和營銷材料等
優(yōu)點
- 自主性極高,能夠獨立完成復(fù)雜任務(wù)
- 工具調(diào)用能力強(qiáng),支持多種外部工具
- 執(zhí)行過程透明,可以通過虛擬機(jī)觀察其每一步的操作流程
- 交付成果質(zhì)量高,接近專業(yè)人員水平
缺點
- 不開源,技術(shù)細(xì)節(jié)不透明
- 缺乏官方API,難以集成到企業(yè)系統(tǒng)
- 多模態(tài)交互能力有待提升
- 任務(wù)執(zhí)行速度較慢
實際使用示例
AI Agent產(chǎn)品對比分析與結(jié)論 – Manus
02 TARS
產(chǎn)品介紹
Agent TARS是字節(jié)跳動開源的多模態(tài)AI Agent框架,基于UI-TARS(視覺語言模型)構(gòu)建,支持通過自然語言控制計算機(jī)。它采用開放架構(gòu),支持模型上下文協(xié)議(MCP),使其具有良好的擴(kuò)展性。
核心功能
- 瀏覽器操作:執(zhí)行深度研究和網(wǎng)頁操作,如表單填寫、點擊等
- 命令行集成:與終端交互,執(zhí)行系統(tǒng)命令
- 文件編輯:創(chuàng)建、修改和管理文件系統(tǒng)中的文檔
- 視覺理解:理解屏幕內(nèi)容,進(jìn)行基于GUI的操作
- 支持MCP:可以靈活切換使用不同的 MCP 工具來提升工作效率。
優(yōu)點
- 完全開源,可自由修改和部署
- 多模態(tài)交互能力強(qiáng),尤其是視覺理解
- 擴(kuò)展性好,支持自定義功能
- 與操作系統(tǒng)深度集成,可控制任何GUI應(yīng)用
缺點
- 穩(wěn)定性和性能不如商業(yè)閉源產(chǎn)品,經(jīng)常出現(xiàn)不執(zhí)行任務(wù)的情況
- 目前很多網(wǎng)頁有反爬機(jī)制,導(dǎo)致其經(jīng)常會卡在真人校驗中
- 最終輸出內(nèi)容質(zhì)量較低,對于復(fù)雜任務(wù)無法直接應(yīng)用
- 需要本地計算資源并且會操控本地電腦,存在一定的合規(guī)風(fēng)險
03 Genspark
產(chǎn)品介紹
GenSpark 是由創(chuàng)始人景鯤打造的一款 Agent 產(chǎn)品。這款產(chǎn)品最初以AI驅(qū)動的搜索工具起家,如今已升級為“全能型AI代理”,目標(biāo)是通過速度、精準(zhǔn)性和用戶可控性,解決從日?,嵤碌綇?fù)雜需求的各種任務(wù)。它不僅能快速響應(yīng)用戶指令,還能主動執(zhí)行現(xiàn)實世界的操作,例如撥打電話預(yù)訂服務(wù),展現(xiàn)出強(qiáng)大的實用性。
Genspark Super Agent采用多智能體混合系統(tǒng)架構(gòu),整合了8個不同規(guī)模的大型語言模型(LLMs),每個模型針對特定任務(wù)進(jìn)行了優(yōu)化。系統(tǒng)還集成了超過80種內(nèi)部工具和多個精選數(shù)據(jù)集,實現(xiàn)了高度自主性。在GAIA基準(zhǔn)測試中表現(xiàn)優(yōu)異,超過了行業(yè)標(biāo)桿Manus。
核心功能
- AI電話功能:這是GenSpark最具創(chuàng)新性的特性之一。它內(nèi)置語音合成技術(shù),能模擬人類與服務(wù)提供商溝通,處理預(yù)訂、查詢甚至退換貨等任務(wù),堪稱“現(xiàn)實世界的代言人”
- 多模態(tài)輸出:GenSpark不僅限于文本生成,還能輸出PPT演示文稿、短視頻甚至南派風(fēng)格的動畫。例如,它可以根據(jù)指令制作一段科技新聞短視頻,配上字幕和配音,直接用于社交媒體發(fā)布
- Sparkpage頁面:類似維基百科的結(jié)構(gòu)化頁面,將零散信息整合為清晰的概覽,方便用戶快速獲取重點
優(yōu)點
- 功能全面,覆蓋從規(guī)劃到執(zhí)行的全流程
- 電話功能是獨特優(yōu)勢,彌補(bǔ)了純文本交互的局限
- 執(zhí)行速度快,效率高
- 相較于其他產(chǎn)品,Genspark可支持更多任務(wù),適應(yīng)不同業(yè)務(wù)需求
缺點
- 自主型較弱,復(fù)雜任務(wù)需要用戶的引導(dǎo)下執(zhí)行
- 文生圖、文生視頻任務(wù)直接調(diào)用第三方接口實現(xiàn),與平臺能力關(guān)聯(lián)性不大
- 開放程度低于完全開源產(chǎn)品
實際使用示例
https://www.genspark.ai/agents?id=e3cce956-6481-43c4-b3dc-1a715e0cba49
04 Flowith
Flowith 是一個畫布式 AI 創(chuàng)作平臺,2024 年初開始布局 agent 方向,2024 年 8 月正式上線了 agent 框架——Flowith Oracle,這比 OpenAI 的 o1 模型還要早。至今,Oracle 已經(jīng)解決了超過 2000 萬次復(fù)雜問題。
Flowith Oracle mode 采用獨特的agenic knowledge management框架。它能自動將用戶上傳的信息拆分為knowledge seed,并實現(xiàn)知識的循環(huán)系統(tǒng)。核心是自主規(guī)劃引擎,支持任務(wù)分解和無限工具調(diào)用。
核心功能
- 任務(wù)自主規(guī)劃與分解:將復(fù)雜需求拆解為有序子任務(wù)(Recipe),設(shè)計系統(tǒng)性工作流
- 無限制工具調(diào)用:調(diào)用豐富工具庫完成子任務(wù)
- 知識花園:構(gòu)建個性化知識庫,管理和應(yīng)用知識(類似 ima)
- 多線程畫布:在一個畫布中與多個AI模型同時交互,用戶可以在Agent運行過程中添加/刪除任務(wù)
優(yōu)點
- 創(chuàng)新的畫布式界面,交互體驗優(yōu)秀
- 知識管理能力強(qiáng),支持知識循環(huán)系統(tǒng)
- 任務(wù)執(zhí)行中可定制化程度極高,適應(yīng)各種創(chuàng)意場景
- 工具調(diào)用能力出色,支持復(fù)雜任務(wù)
缺點
- 運行模式與常規(guī) Agent 產(chǎn)品有差異,新用戶適應(yīng)需要時間
- 多模態(tài)支持相對較弱
- 開放性不如完全開源產(chǎn)品
實際使用示例
05 產(chǎn)品對比
B端應(yīng)用場景分析
在企業(yè)應(yīng)用方面,Agent 有望在以下領(lǐng)域率先落地:
研究表明,AI Agent在B端最有可能率先落地的是部門級應(yīng)用,而非公司級應(yīng)用。這是因為部門級工作相對靈活,存在大量未被固化的業(yè)務(wù)流程,而這恰恰是AI Agent能夠發(fā)揮優(yōu)勢的地方。
落地挑戰(zhàn)與制約因素
盡管Agent在B端市場有巨大潛力,但當(dāng)前仍面臨一系列挑戰(zhàn):
技術(shù)層面
- 幻覺問題:AI生成的內(nèi)容存在事實錯誤的風(fēng)險
- 復(fù)雜任務(wù)處理能力有限,常需人工介入
- 安全與隱私保障機(jī)制不足
- 系統(tǒng)集成困難,與企業(yè)現(xiàn)有系統(tǒng)兼容性問題
非技術(shù)層面
- 缺乏明確的監(jiān)管框架和合規(guī)標(biāo)準(zhǔn)
- 投資回報率(ROI)不明確
- 責(zé)任歸屬不清晰,出錯時責(zé)任界定困難
結(jié)論與建議
1)對Agent市場不要過于FOMO
盡管AI Agent市場展現(xiàn)出強(qiáng)勁的增長潛力和廣闊的應(yīng)用前景,但目前的產(chǎn)品還不足以在B端市場中大規(guī)模應(yīng)用。從技術(shù)成熟度、穩(wěn)定性、安全性以及與現(xiàn)有企業(yè)系統(tǒng)的集成能力來看,當(dāng)前的AI Agent產(chǎn)品仍處于早期階段。
建議企業(yè)保持理性,避免因”錯失恐懼”(FOMO)而倉促決策??梢圆扇≡圏c項目和小規(guī)模實驗的方式,逐步引入Agent技術(shù),評估其在特定業(yè)務(wù)場景下的實際效果,為未來更大規(guī)模的部署積累經(jīng)驗。
2)相信”殼”的力量
即使沒有能力優(yōu)化底層模型算法,企業(yè)也可以通過打造優(yōu)秀的產(chǎn)品”殼”來創(chuàng)造價值。在當(dāng)前階段,基礎(chǔ)大模型能力正在迅速成為通用化服務(wù),真正的差異化競爭優(yōu)勢將來自于:
- 用戶友好的交互界面設(shè)計
- 針對特定場景的工作流程優(yōu)化
- 與企業(yè)現(xiàn)有系統(tǒng)的無縫集成
- 垂直領(lǐng)域的專業(yè)知識積累
- 安全合規(guī)的數(shù)據(jù)處理機(jī)制
企業(yè)應(yīng)將重點放在應(yīng)用層面的創(chuàng)新上,通過深入理解用戶需求,設(shè)計出符合特定場景的AI Agent解決方案,而非過度關(guān)注底層技術(shù)的迭代。
3)AI能力沒有壁壘,方向比技術(shù)更重要
在AI快速發(fā)展的今天,技術(shù)正在以前所未有的速度被開源和共享?;A(chǔ)AI能力不再是核心競爭力,而是找準(zhǔn)方向和應(yīng)用場景的能力變得更為關(guān)鍵。
企業(yè)應(yīng)該培養(yǎng)對市場趨勢的敏感性,找到AI Agent技術(shù)與自身業(yè)務(wù)的最佳結(jié)合點。即使是小團(tuán)隊,只要找準(zhǔn)方向,也有可能開發(fā)出成功的產(chǎn)品。不要被技術(shù)復(fù)雜性而被恐嚇住,關(guān)注解決實際問題的能力。
展望未來
展望未來,我們預(yù)計AI Agent技術(shù)將在以下幾個方向快速發(fā)展:
- 多智能體協(xié)作:從單一Agent向多Agent協(xié)作系統(tǒng)演進(jìn),處理更復(fù)雜的任務(wù)
- 垂直領(lǐng)域?qū)>横槍μ囟ㄐ袠I(yè)的專業(yè)化Agent將出現(xiàn),具備深度專業(yè)知識
- 人機(jī)協(xié)作模式優(yōu)化:更自然、高效的人機(jī)交互方式,提高協(xié)作效率
- 安全與隱私保障機(jī)制完善:更強(qiáng)的安全機(jī)制和隱私保護(hù)功能
- 標(biāo)準(zhǔn)化與互操作性提升:不同Agent系統(tǒng)之間的標(biāo)準(zhǔn)接口和協(xié)作機(jī)制
AI Agent技術(shù)正處于從概念驗證到實際應(yīng)用的關(guān)鍵轉(zhuǎn)折點。企業(yè)需要理性看待其潛力和局限,在保持技術(shù)敏感性的同時,著眼于解決實際業(yè)務(wù)問題,才能真正從這一技術(shù)浪潮中受益。
本文由 @VerTig0 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)
- 目前還沒評論,等你發(fā)揮!