萬億賽道的具身智能,到底是什么?

0 評論 277 瀏覽 0 收藏 15 分鐘

具身智能,作為人工智能領(lǐng)域一顆冉冉升起的新星,正以其獨特的魅力吸引著無數(shù)目光。它究竟是什么?與我們熟知的傳統(tǒng)人工智能有何本質(zhì)區(qū)別?這篇文章將帶你深入了解具身智能的概念內(nèi)核,剖析它在現(xiàn)實中的應(yīng)用場景,探討其目前所處的發(fā)展階段以及未來可能帶來的變革。

周末和朋友聊天,提到具身智能。有諸多觀點,但讓我意外的是,大家都具身智能的理解不太一樣。

有的說,機(jī)械臂在工廠內(nèi)能自動搬運貨物,這是具身智能;有的朋友認(rèn)為,具身智能應(yīng)該像人一樣能走路的機(jī)器人。還有人說,具身智能像大模型一樣,有意識、認(rèn)知。

這些觀點到底哪個是準(zhǔn)確的呢?說實話,我也有點懵;于是,回來后趕緊惡補(bǔ)了這堂課,搞清楚具身智能到底是什么。

什么是具身智能,和傳統(tǒng)人工智能核心區(qū)別是什么?

準(zhǔn)確而言,具身智能(Embodied Intelligence)分為具身(Embodiment)、具身的 (Embodied)、具身智能(Embodied AI)、以及非具身智能(Disembodied AI)四個維度。

具身,指具有支持感覺和運動(sensorimotor)的物理身體。而具身的,強(qiáng)調(diào)智能體,通過身體與環(huán)境交互來實現(xiàn)智能行為,它可交互、具有感知。

比如:

一個掃地機(jī)器人,用攝像頭感知環(huán)境,用輪子移動來探索周圍,再通過傳感器識別障礙物并自動調(diào)整路徑,最終完成清掃任務(wù);這種用身體和環(huán)境的直接交互,來實現(xiàn)功能的過程,就是具身的。

那具身智能呢?可以總結(jié)為,一個一個身體力行的智能體,不僅擁有身體,還支持物理交互,能夠用身體與環(huán)境的交互實現(xiàn)智能行為,像家用服務(wù)機(jī)器人、無人車等非常符合核心特征。

而非具身智能(Disembodied AI)是沒有身體,只有大腦、智能被動接受人類采集、制作好的數(shù)據(jù),像一個紙上談兵、或運籌帷幄的家伙。

寫到這,問題來了:通過概念可以看出,具身的和具身智能很像。到底如何區(qū)別它們呢?

簡單粗暴地說,“具身的”靠身體跟環(huán)境互動,比如:機(jī)械臂抓個東西、搬個貨,干點基礎(chǔ)活兒;而“具身智能”高級多了,不光要動手,還得會動腦,要感知環(huán)境、自己做決定,還能邊干邊學(xué),越干越聰明。

說白了,“具身的”是純體力活,而“具身智能”是“體力+腦力”的結(jié)合體。

這或許,也是宇樹科技創(chuàng)始人王興興在昨天(2025年3月23日)接受《每日經(jīng)濟(jì)新聞》采訪時提到的觀點。

他說,現(xiàn)在人形機(jī)器人最大的坎兒是大模型,尤其多模態(tài)大模型。多模態(tài)搞定了,具身智能離通用人工智能就不遠(yuǎn)了。

所以,王興興那句“具身智能到通用已經(jīng)很快了”,在暗示:大模型一突破,機(jī)器人滿地跑的日子真不遠(yuǎn)了;明白這些,你也就理解了什么是具身智能,它和傳統(tǒng)人工智能的核心區(qū)別是什么。

既然這樣,當(dāng)前具身智能發(fā)展是處于“嬰兒期”還是“青春期”呢?

我覺得還處在嬰兒期。這不是瞎說。大家都這么認(rèn)為。

中國信通院(CAICT)2024年的報告里提到,工業(yè)和服務(wù)領(lǐng)域確實已經(jīng)有一些成熟的案例,但這些應(yīng)用,基本都局限在特定場景,功能有限,離全能型全收還差得很遠(yuǎn)。

其他報告里,也差不多是同一個意思;說白了,要讓具身智能干更復(fù)雜、更廣泛的工作,還要在很多地方下功夫,其中,更根本的是底層能力的不足。

一個最顯眼可見的例子是:減速機(jī)。

什么是減速機(jī)?你可以把它看成機(jī)器人的“關(guān)節(jié)”,連接動力源和執(zhí)行機(jī)構(gòu)的關(guān)鍵部件。咱們國家在核心零部件和材料技術(shù)上進(jìn)步很快,也實現(xiàn)了部分國產(chǎn)化,但和人類關(guān)節(jié)那種靈活自如的能力相比,差距非常明顯。

比如說,工業(yè)機(jī)器人常用的兩種“關(guān)節(jié)”:RV減速器和諧波減速器。RV減速器像健身房里壯漢的膝蓋,能扛起幾百公斤的重物;諧波減速器則像瑜伽達(dá)人的手腕,能靈活轉(zhuǎn)動還不費勁。

國產(chǎn)RV減速器已能替代進(jìn)口(雙環(huán)傳動市占率15%),但要讓機(jī)器人像人類關(guān)節(jié)那樣既能舉啞鈴又能繡花,還差著代際差距。

目前來看,國內(nèi)減速機(jī)領(lǐng)域的領(lǐng)先企業(yè)包括國茂股份、中大力德、綠的諧波、雙環(huán)傳動等,它們的產(chǎn)品主要用在工業(yè)機(jī)器人領(lǐng)域。

雙環(huán)傳動在RV減速器市場中表現(xiàn)突出。它從2013年開始立項研發(fā)RV減速器,經(jīng)過多年的努力,在2017年實現(xiàn)了量產(chǎn),填補(bǔ)了國內(nèi)在這一領(lǐng)域的空白。

2021年,雙環(huán)傳動成功打破了日本納博特斯克長期以來的市場壟斷,其產(chǎn)品在國內(nèi)市場的占有率達(dá)到了15.1%,成為國產(chǎn)品牌第一。

所以,從時間軸上看,我們在核心零部件上已經(jīng)取得不少進(jìn)展,要讓機(jī)器人像人一樣靈活自主,還有很長的路要走。

在調(diào)研時我發(fā)現(xiàn),像減速機(jī)這種關(guān)鍵部件是冰山一角,還有好多地方要突破。最值得一提的是:機(jī)器人的“小腦”,也就是它的運動控制系統(tǒng)。

小腦的組成包括,運動規(guī)劃模塊、動力學(xué)控制模塊、傳感器融合系統(tǒng),以及技能學(xué)習(xí)與分解模塊。這些模塊協(xié)同工作,才能讓機(jī)器人能夠像人類一樣靈活地完成各種動作。

這么說,你也許感觸不大。我舉個例子:

機(jī)器人找到冰箱的位置、避開障礙物走過去,再用合適的力度拉門。難點在于,怎么在復(fù)雜動態(tài)環(huán)境(比如有人突然擋路)中快速規(guī)劃路徑,還要在長時間任務(wù)中保持穩(wěn)定,這得靠規(guī)劃模塊來實現(xiàn)了。

再比如,要協(xié)調(diào)全身關(guān)節(jié)的動作,調(diào)整走路時的重心、控制手臂的力度,目前的挑戰(zhàn)是,怎么讓機(jī)器人像人一樣靈活應(yīng)對突發(fā)情況。比如:被人推一下也不摔倒。

還有,融合把傳感器融合在一塊,也是一大難題。

你想,現(xiàn)在有很多攝像頭、IMU(慣性測量單元)、力覺傳感器,怎么把數(shù)據(jù)捏合到一塊,做到視覺、觸覺同步進(jìn)行呢?最新報告顯示,這些都要進(jìn)一步研究。

另外,技能學(xué)習(xí)和分解模塊也要進(jìn)一步突破。教機(jī)器人開門,要把動作拆解成“接近門、抓把手、旋轉(zhuǎn)、拉門”等基本操作,再通過強(qiáng)化學(xué)習(xí)訓(xùn)練。

但目前這些技能很難在不同場景下復(fù)用。比如:換個門把手形狀就懵了。

這一切表面上看似簡單的動作,背后是一系列復(fù)雜的融合挑戰(zhàn),每一個小進(jìn)步都要在硬件、軟件上持續(xù)投入,才能讓人一樣靈活智能。

如果實現(xiàn)難度這么大,那么,評價具身智能標(biāo)準(zhǔn),到底應(yīng)該以完成任務(wù)為主,還是以環(huán)境適應(yīng)為主呢?

我認(rèn)為,問題的關(guān)鍵在于到底要追求專用性,還是通用性。

專用性是什么?拿工業(yè)機(jī)器人來說,在流水線上,它替代了人,專注地完成焊接、裝配這些固定任務(wù);服務(wù)機(jī)器人也一樣,專注于清潔、搬運。這就是完成任務(wù)的專業(yè)性,它們在特定場景下表現(xiàn)出色,效率高、精度高。

那通用性,或者說環(huán)境適應(yīng)性呢?我再舉個例子:

奧運會上,突然停電了,大家都找不到安全出口。這時候,機(jī)器人該扮演什么角色?它肯定不能像其他人一樣摸黑亂撞,它得是個超級智能體,迅速感知環(huán)境變化,引導(dǎo)人們安全疏散。

這個問題聽起來有點荒誕,卻恰恰戳中了具身智能評價體系的死穴:現(xiàn)在的廠商到底是在比拼誰擰螺絲釘更快,還是誰能應(yīng)對突發(fā)狀況?

所以,環(huán)境適應(yīng)為主的機(jī)器人,顯然是一個更高層次的目標(biāo)。它技術(shù)難度高,短期很難實現(xiàn),但它更貼近人類的本質(zhì)。畢竟,人類之所以被認(rèn)為智能,不僅是因為能完成具體任務(wù),更在于能在環(huán)境中隨機(jī)應(yīng)變。

因此,我認(rèn)為完成任務(wù)更適合目前發(fā)展,它能有效推動具身智能在垂直行業(yè)的落地;而以適應(yīng)環(huán)境為主,則是未來需要突破的方向。

那么,在當(dāng)前技術(shù)條件下,哪些具體技術(shù)突破最有可能推動具身智能從專用性向通用性邁進(jìn)?

最近有一篇論文叫:《Exploring Embodied Multimodal Large Models: Development, Datasets, and Future Directions》,里面重點提到了具身多模態(tài)大模型(EMLMs)技術(shù)。

這篇論文厲害的地方在于,它填補(bǔ)了現(xiàn)有研究中的一個空白。研究團(tuán)隊啃了300多篇文獻(xiàn),從基礎(chǔ)大模型到仿真技術(shù),全都捋了一遍,尤其是像機(jī)器人怎么感知環(huán)境、怎么導(dǎo)航、怎么跟人互動這些關(guān)鍵問題,都講得挺透徹。

具體來說,論文提到了四點:

  1. 跨模態(tài)預(yù)訓(xùn)練和微調(diào)。怎么研究出更聰明的跨模態(tài)預(yù)訓(xùn)練和微調(diào)方法,讓不同模型在任務(wù)中都能表現(xiàn)得很好;
  2. 自監(jiān)督學(xué)習(xí)。怎么讓模型通過沒標(biāo)注的數(shù)據(jù),學(xué)到更豐富的知識,變得更靈活、更實用。
  3. 怎么把多模態(tài)模型跟強(qiáng)化學(xué)習(xí)結(jié)合起來是個好方向;
  4. 端到端的發(fā)展。現(xiàn)在有很多大模型是為不同任務(wù)設(shè)計,但未來,朝著一個大模型包攬所有任務(wù)的方向發(fā)展,會是一個重要的趨勢。

所以,最后得出結(jié)論是:現(xiàn)在最大挑戰(zhàn)是怎么把多模態(tài)感知、推理和行動整合到一起。說白了,核心集中在大腦、小腦上。

另外一個是高精尖的傳感器技術(shù)。為啥是傳感器,不是硬件?

傳感器像一把鑰匙,能把現(xiàn)實中的各種信息,轉(zhuǎn)化成機(jī)器能理解的數(shù)據(jù)。比如溫度、壓力、位置。在國家戰(zhàn)略層面,傳感器是關(guān)鍵的“勝負(fù)手”——它的性能直接決定了重大裝備和戰(zhàn)略產(chǎn)品的質(zhì)量。

舉個例子:

  • 咱們國家的高鐵“和諧號380AL”,一輛列車上有超過1000個傳感器,平均每個零部件都得有個傳感器盯著;這些傳感器干啥用?監(jiān)測列車運行狀態(tài)、檢查軌道有沒有問題、保障列車安全防護(hù)。
  • 再看看醫(yī)療領(lǐng)域,你拍心電圖、量血壓、測血糖靠什么?依然是傳感器。現(xiàn)在的醫(yī)生,很多時候靠傳感器給的數(shù)據(jù)做判斷。
  • 前段時間,宇樹科技G1機(jī)器人火了,能跳舞、完成拍手、扭腰等動作,還能跟著音樂節(jié)奏舞動,甚至能施展揮拳、旋踢等高難度武術(shù)動作,回旋踢完之后,腿可以穩(wěn)穩(wěn)落地而不倒。

這背后靠什么?還是傳感器。

傳感器讓機(jī)器人有了“觸覺”,能感知地面情況,從而靈活調(diào)整動作。換句話說,傳感器不僅提升了機(jī)器人的運動能力,還讓它能夠更好地感知環(huán)境,完成更復(fù)雜的任務(wù)。

宇樹科技這樣的通用機(jī)器人為啥受到國內(nèi)外青睞?不是因為它便宜,是它成了綜合性選手。正是傳感器技術(shù)的發(fā)展,才推動機(jī)器人從“專用型選手”向“通用型高手”邁進(jìn),為未來帶來更廣泛的應(yīng)用可能。

所以,不管是具身多模態(tài)大模型的技術(shù)突破,還是高精尖傳感器的升級換代,都在給具身智能添磚加瓦,讓它從只能干“?;睢钡男」?,變成啥都能干的“全能選手”。

希望以上分析能帶來點新啟發(fā),使你看問題時多幾個新角度。

文:王智遠(yuǎn)

本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】,微信公眾號:【王智遠(yuǎn)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
33590人已学习17篇文章
作为产品经理,你真的懂什么是敏捷开发吗?
专题
20489人已学习15篇文章
商品管理系统属于电商产品中最基础、最核心的系统,是支撑整个电商产品的核心。本专题的文章提供了商品管理设计指南。
专题
32093人已学习19篇文章
一个合格的购物车是怎么设计出来的?
专题
18315人已学习15篇文章
库存管理是管理商品和数量之间的关系。本专题的文章提供了库存管理设计指南。
专题
12853人已学习13篇文章
对数据进行监控,分析异常数据,是数据分析常见的工作内容。本专题的文章分享了如何做好数据异常分析。
专题
91470人已学习30篇文章
想要脱围而出,你必须升级你的技能和思维。