海外科技博主點(diǎn)評(píng)Manus:炒作跑在了技術(shù)創(chuàng)新前面

0 評(píng)論 1085 瀏覽 0 收藏 8 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

Manus作為一款備受矚目的“代理型”人工智能平臺(tái),在推出后迅速引發(fā)了廣泛的關(guān)注和討論。然而,海外科技博主對(duì)其實(shí)際表現(xiàn)提出了質(zhì)疑,認(rèn)為Manus的炒作可能跑在了技術(shù)創(chuàng)新前面。

Manus是一款上周推出預(yù)覽版的“代理型”人工智能平臺(tái),其引發(fā)的關(guān)注度甚至超過(guò)了泰勒·斯威夫特(Taylor Swift)的演唱會(huì)。

Hugging Face的產(chǎn)品負(fù)責(zé)人稱Manus是“我嘗試過(guò)的最令人印象深刻的人工智能工具”。人工智能政策研究員迪安·鮑爾(Dean Ball)將Manus描述為“使用人工智能的最復(fù)雜的計(jì)算機(jī)”。Manus的官方Discord服務(wù)器在短短幾天內(nèi)就吸引了超過(guò)13.8萬(wàn)名成員,其邀請(qǐng)碼在中國(guó)的二手平臺(tái)閑魚上甚至被炒至數(shù)千美元。

然而,這種熱度似乎并不完全合理。

據(jù)社交媒體上的報(bào)道,Manus并非完全從零開始開發(fā)。該平臺(tái)結(jié)合了現(xiàn)有的和經(jīng)過(guò)微調(diào)的人工智能模型,包括Anthropic的Claude和阿里巴巴的Qwen,以執(zhí)行諸如撰寫研究報(bào)告和分析財(cái)務(wù)文件等任務(wù)。

然而,在其網(wǎng)站上,Manus背后的中國(guó)公司“蝴蝶效應(yīng)”(The Butterfly Effect)卻給出了該平臺(tái)能夠?qū)崿F(xiàn)的一些夸張例子,從購(gòu)買房產(chǎn)到開發(fā)電子游戲無(wú)所不包。

在一段在X平臺(tái)上瘋傳的視頻中,Manus的研究負(fù)責(zé)人紀(jì)益超(Yichao “Peak” Ji)暗示,該平臺(tái)優(yōu)于OpenAI的深度研究和操作員等代理型工具。紀(jì)益超聲稱,Manus在一項(xiàng)名為GAIA的通用人工智能助手基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于深度研究,該測(cè)試考察人工智能通過(guò)瀏覽網(wǎng)頁(yè)、使用軟件等方式完成工作的能力。

“Manus不僅僅是一個(gè)聊天機(jī)器人或工作流,”紀(jì)益超在視頻中說(shuō),“它是一個(gè)完全自主的代理,彌合了構(gòu)想與執(zhí)行之間的差距……我們認(rèn)為這是人機(jī)協(xié)作的下一個(gè)范式?!?/p>

然而,一些早期用戶表示,Manus并非萬(wàn)能的解決方案。

人工智能初創(chuàng)公司Pleias的聯(lián)合創(chuàng)始人亞歷山大·多利亞(Alexander Doria)在X平臺(tái)上發(fā)帖稱,他在測(cè)試Manus時(shí)遇到了錯(cuò)誤信息和無(wú)限循環(huán)。其他用戶也指出,Manus在回答事實(shí)性問(wèn)題時(shí)會(huì)出錯(cuò),且并不總是引用其來(lái)源——而且經(jīng)常遺漏一些很容易在網(wǎng)上找到的信息。

“深度研究在不到15分鐘內(nèi)就完成了。不幸的是,Manus AI在第18/20步失敗了,耗時(shí)50分鐘!它表現(xiàn)得相當(dāng)不錯(cuò)——我在查看Manus的輸出結(jié)果時(shí),感覺很不錯(cuò)。然而,第二次運(yùn)行相同的指令時(shí),它花了太長(zhǎng)時(shí)間,這有點(diǎn)令人沮喪!”

我自己使用Manus的經(jīng)歷也并不十分積極。

我讓這個(gè)平臺(tái)幫我處理一個(gè)在我看來(lái)非常簡(jiǎn)單的要求:從我配送范圍內(nèi)的一個(gè)高評(píng)分快餐店訂購(gòu)一份炸雞漢堡。大約10分鐘后,Manus崩潰了。第二次嘗試時(shí),它找到了符合我標(biāo)準(zhǔn)的菜單項(xiàng),但Manus無(wú)法完成訂購(gòu)過(guò)程,甚至無(wú)法提供一個(gè)結(jié)賬鏈接。

嘗試用Manus點(diǎn)炸雞三明治是一種令人沮喪的經(jīng)歷。

當(dāng)我要求Manus預(yù)訂從紐約到日本的航班時(shí),它的表現(xiàn)同樣不盡如人意。

我給出的指令在我看來(lái)并沒(méi)有太多模糊空間(例如“尋找商務(wù)艙航班,優(yōu)先考慮價(jià)格和靈活的日期”),但Manus能做到的最好結(jié)果只是提供了一些航空公司網(wǎng)站和航班搜索平臺(tái)(如Kayak)的機(jī)票鏈接,其中一些鏈接甚至無(wú)法打開。

Manus目前還不能為您預(yù)訂去東京的航班。

懷著對(duì)接下來(lái)的任務(wù)可能會(huì)有更好表現(xiàn)的希望,我讓Manus為我預(yù)訂一張步行距離內(nèi)的餐廳的單人桌,但幾分鐘后它失敗了。隨后,我要求該平臺(tái)開發(fā)一款受《火影忍者》啟發(fā)的格斗游戲,但在半小時(shí)后出現(xiàn)了錯(cuò)誤,這讓我決定放棄。

阿什托什·夏里瓦斯塔瓦(Ashutosh Shrivastava)在3月9日的推文中表示:

“在嘗試Manus AI三天后,我的真實(shí)看法如下,有好有壞。
好的方面:
它在互聯(lián)網(wǎng)上進(jìn)行的研究以及生成的報(bào)告令人難以置信。
它在后臺(tái)運(yùn)行腳本來(lái)執(zhí)行任務(wù)的能力令人印象深刻。
它的計(jì)劃……”

Manus的一位發(fā)言人通過(guò)直接消息向TechCrunch發(fā)送了以下聲明:

“作為一個(gè)小團(tuán)隊(duì),我們的重點(diǎn)是不斷改進(jìn)Manus,打造真正能幫助用戶解決問(wèn)題的人工智能代理……當(dāng)前封閉測(cè)試的主要目標(biāo)是對(duì)系統(tǒng)的各個(gè)部分進(jìn)行壓力測(cè)試并識(shí)別問(wèn)題。我們非常感謝每個(gè)人分享的寶貴見解?!?/p>

因此,如果Manus未能實(shí)現(xiàn)其技術(shù)承諾,為什么它會(huì)引發(fā)如此大的關(guān)注呢?有幾個(gè)因素促成了這一點(diǎn),比如由于邀請(qǐng)碼稀缺而產(chǎn)生的排他性。

中國(guó)媒體迅速將Manus宣傳為一項(xiàng)人工智能突破,《QQ新聞》甚至稱其為“國(guó)內(nèi)產(chǎn)品的驕傲”。與此同時(shí),社交媒體上的人工智能網(wǎng)紅傳播了關(guān)于Manus能力的不實(shí)信息。一個(gè)被廣泛分享的視頻展示了一個(gè)桌面程序(據(jù)稱是Manus)在多個(gè)智能手機(jī)應(yīng)用程序中采取行動(dòng)。但紀(jì)益超確認(rèn),這段視頻實(shí)際上并不是Manus的演示。

X平臺(tái)上的其他有影響力的人工智能賬號(hào)試圖將Manus與中國(guó)的DeepSeek公司進(jìn)行比較——但這些比較并不一定基于事實(shí)。與DeepSeek不同,蝴蝶效應(yīng)并沒(méi)有開發(fā)任何內(nèi)部模型。此外,盡管DeepSeek公開了許多技術(shù),但Manus尚未做到——至少目前還沒(méi)有。

公平地說(shuō),Manus目前仍處于非常早期的訪問(wèn)階段。該公司聲稱正在努力擴(kuò)展計(jì)算能力,并在問(wèn)題被報(bào)告后進(jìn)行修復(fù)。但就目前該平臺(tái)的現(xiàn)狀而言,Manus似乎是一個(gè)技術(shù)炒作跑在技術(shù)創(chuàng)新前面的例子。(TechCrunch)

本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號(hào):【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
13729人已学习13篇文章
用户体验是用户在使用产品过程中建立起来的一种纯主观感受。本专题的文章分享了如何撰写用户体验报告。
专题
18133人已学习13篇文章
AI产品经理的核心目的是通过AI技术创造和优化产品服务,丰富技术知识可以让自己在工作中拥有更多话语权。本专题的文章分享了AI产品经理需要掌握的AI技术。
专题
97150人已学习11篇文章
不管你是产品、运营、设计、还是技术,流程图都是基础技能。
专题
16011人已学习12篇文章
本专题的文章分享了支付风控系统的设计指南
专题
36270人已学习27篇文章
作为AIGC的代表性应用之一,ChatGPT仅仅只用了2个月的时间就已经突破了1亿用户。
专题
15333人已学习12篇文章
虽然大厂们纷纷奔赴Web3.0,但是不少人还是对这个概念及相应生态一知半解。本专题的文章分享了对于web3的看法。