訂閱
糾錯
加入自媒體

具身智能火了,但規(guī)模落地還需時間

作者 | 辰紋

來源 | 洞見新研社

人工智能下一個浪潮是具身智能,即能理解、推理并與物理世界互動的智能系統(tǒng)”, 英偉達(dá)CEO黃仁勛去年在ITF World 2023半導(dǎo)體大會上的預(yù)測正在成為現(xiàn)實(shí)。

5月份,日本橫濱召開的國際頂級機(jī)器人學(xué)術(shù)會議(ICRA2024)上,人形機(jī)器人扎堆亮相。

7月份,上海世界人工智能大會(WAIC 2024)展出人形機(jī)器人“十八金剛”是整個大會“最靚的仔”。

8月份,在北京閉幕的世界機(jī)器人大會中,人形機(jī)器人成為當(dāng)之無愧的“C位”主角,官方表示,這是人形機(jī)器人數(shù)量最多的一屆大會,并且,現(xiàn)場有超過一半的觀眾都集中在人形機(jī)器人公司的展臺。

很顯然,和大模型一樣,作為具身智能最重要的實(shí)體形態(tài),人形機(jī)器人正在走向人工智能的舞臺中央。

以上展出的各類機(jī)器人“能文能武”,會寫字,會洗衣,做家務(wù)更是十項(xiàng)全能;能打詠春,能做拳擊陪練,也能成為貼身保鏢。

從場面上看,很熱鬧,但深入內(nèi)里,這么火的具身智能,亦或是人形機(jī)器人,距離“憑本事吃飯”還有多遠(yuǎn)呢?

01 大模型帶火機(jī)器人

在進(jìn)行我們的討論之前,首先要明確,什么是具身智能?

根據(jù)具身智能的英文翻譯(Embodied artificial intelligence,EAI)可以發(fā)現(xiàn),“本體”和“智能體”是兩個非常重要的構(gòu)成,具有“感知決策、物理實(shí)體、環(huán)境交互”的特征。

直白一點(diǎn)的理解就是,具身智能可以感知并理解周圍環(huán)境,在物理環(huán)境中執(zhí)行具體任務(wù)。

事實(shí)上,早在60多年前,自動化技術(shù)的先驅(qū)者歐姆龍公司就提出了“機(jī)器能做的事情讓機(jī)器去做,人類應(yīng)該從事富有創(chuàng)造性的活動”的觀點(diǎn),但終因技術(shù)尚未成熟,空有美好想法卻難以落地。

從2022年開始,具身智能迎來了新一輪的發(fā)展期,背后的核心變量是大模型的發(fā)展。

8月2日,初創(chuàng)公司Figure AI發(fā)布人形機(jī)器人Figure02,在與OpenAI合作開發(fā)的AI模型的支持下,F(xiàn)igure02的對話交互更具實(shí)時性、常識推理能力也更加到位。

很顯然,大模型技術(shù)為人形機(jī)器人實(shí)現(xiàn)更優(yōu)的感知、決策、交互能力提供了技術(shù)基礎(chǔ),同樣也為機(jī)器人實(shí)現(xiàn)大腦感知決策,小腦運(yùn)動控制的泛化性帶來了非常大的想象空間。

另外一面,人形機(jī)器人的硬件技術(shù)方面也有了長足的進(jìn)步,2023年末特斯拉發(fā)布的Optimus Gen2搭載自研執(zhí)行器,足部采用鉸鏈?zhǔn)竭B接并配備力傳感器,使得Gen2的行走速度較Gen1提升30%并具備更好的平衡性。

更加重要的是,特斯拉發(fā)布Optimus后,帶動公司股價(jià)連續(xù)11個交易日收高,馬斯克的身價(jià)也在這段期間膨脹了約670億美元,進(jìn)一步驗(yàn)證了市場對人形機(jī)器人商業(yè)化的前景,從而將科技圈的關(guān)注焦點(diǎn)又重新拉回到具身智能。

這里主要體現(xiàn)在三個方面。

一是全國各國政府在政策層面的引導(dǎo)。

其中,中國政策的短期目標(biāo)在于實(shí)現(xiàn)核心零部件的技術(shù)突破,長期目標(biāo)在于豐富產(chǎn)業(yè)應(yīng)用和生態(tài);海外的政策更多集中在前沿技術(shù)的攻關(guān)以及重要場景的落地等方面。

中國人形機(jī)器人重要政策梳理  資料來源:各政府網(wǎng)站,中金公司研究部

二是下場的玩家多元,且競爭愈發(fā)激烈。

除了像優(yōu)必選、波士頓動力、傅里葉智能這類以做本體、硬件見長的老牌機(jī)器人公司和一批近期涌現(xiàn)專注機(jī)器人產(chǎn)業(yè)的初創(chuàng)公司,比如智元機(jī)器人、銀河通用機(jī)器人、星動紀(jì)元、逐際動力等之外,還有兩派玩家。

其一是以科大訊飛、百度、騰訊、谷歌等為代表的科技大廠攜帶著感知認(rèn)知的算法優(yōu)勢而來;其二則是以小鵬汽車、小米、追覓、特斯拉這類為代表的跨界廠商,這類玩家往往擁有比較確定的應(yīng)用場景,以及可以共享的產(chǎn)業(yè)鏈。

三是資本對具身智能賽道的熱情,畢竟真金白銀投出去是為了有更多的回報(bào)。

據(jù)不完全統(tǒng)計(jì),2023年國內(nèi)有9家人形機(jī)器人企業(yè)獲得累計(jì)超19億元融資,今年上半年,國內(nèi)有13家人形機(jī)器人企業(yè)融資總金額超25億元,成立僅一年的銀河通用機(jī)器人,在 6 月甚至獲得超7億人民幣天使輪融資,估值達(dá)到數(shù)十億人民幣,被稱為“年度最大天使輪”。

而以“先進(jìn)制造-機(jī)器人”為標(biāo)簽,截至今年8月初,則發(fā)生了135筆融資。

02 機(jī)器人的手和腳,人類都還沒“想”好

雖然行業(yè)很熱鬧,但是在研發(fā)和應(yīng)用層面,人形機(jī)器人還是有諸多問題待解。

首當(dāng)其沖的就是技術(shù)路線的收斂。

北航機(jī)器人研究所名譽(yù)所長,中關(guān)村智友研究院院長王田苗在“2024世界機(jī)器人大會”期間發(fā)表觀點(diǎn)時就表示,“當(dāng)前人形機(jī)器人還面臨兩大難點(diǎn),一是機(jī)器人目前的‘軟’件端,適合機(jī)器人的通用大模型和垂直專業(yè)模型,還在攻堅(jiān)階段;此外,靈巧手目前在技術(shù)和成本上都有需要攻克的難點(diǎn)。”

所謂的“軟件“,指的是將復(fù)雜任務(wù)拆分為無數(shù)個子任務(wù),各種子任務(wù)在現(xiàn)實(shí)的物理空間中相融合,其中就需要大模型技術(shù)的賦能,從而實(shí)現(xiàn)人機(jī)交互。

通俗的說,就是要讓機(jī)器人擁有泛化能力,比如,家庭服務(wù)機(jī)器人,不用主人發(fā)號指令,就能主動安排自己的工作,將房屋清掃、做飯炒菜、物品收納等家務(wù)能夠按照輕重緩急的順序逐一完成。

行業(yè)普遍認(rèn)為,人形機(jī)器人在硬件上不存在壁壘,雖然目前不同廠商之間機(jī)器人在移動速度、負(fù)載能力等機(jī)械性能上存在不小的差距,但是這些差距并非不可逾越,時間和成本最終會抹平一切。

最終決定人形機(jī)器人能力高低的還是以軟件為基礎(chǔ)的泛化能力,只有擁有強(qiáng)大的泛化能力,人形機(jī)器人才能適應(yīng)各種任務(wù)場景,才具備真正的“可用性“。

由機(jī)器人的泛化能力進(jìn)行延伸,機(jī)器人的本體形態(tài),末端執(zhí)行器的選擇,也就是人形機(jī)器人的腳和手的技術(shù)方向,行業(yè)的技術(shù)路線尚未有比較統(tǒng)一的共識。

關(guān)于機(jī)器人的移動能力,行業(yè)的主要分歧為雙足和非雙足的區(qū)分。

如果執(zhí)著于具身智能所強(qiáng)調(diào)的“人形“,雙足是不二之選,可是在當(dāng)前的技術(shù)條件下,雙足機(jī)器人的實(shí)用性、穩(wěn)定性和開發(fā)成本等方面都要弱于輪式底盤為主的非雙足方案。

兩種方案都有各自的簇?fù),前者認(rèn)為,就像L4級自動駕駛一樣,雙足就是人形機(jī)器人的最終形態(tài),從長遠(yuǎn)來看,雙足的算法研究意義重大;后者認(rèn)為,從商業(yè)化落地的視角來看,非雙足方案的適用性更強(qiáng),也符合“沿途下蛋“的思維。

相于腳的選擇,手指方案的選擇就更多了。

有的企業(yè)選擇“一步到位“,對照著人類在機(jī)器人身上也安上了五根手指,如戴盟機(jī)器人的 Sparky 1 配備基于光學(xué)觸覺傳感器的五指靈巧手。

有的企業(yè)則先從二指夾爪、三指手出發(fā),如星塵智能S1的雙機(jī)械臂搭配二指夾爪,銀河通用G1采用右夾爪和左吸盤組合,以及 UniX AI 家庭場景機(jī)器人 Wanda 的三指手。

技術(shù)路線之所以會出現(xiàn)百花齊放的現(xiàn)象,很大一個原因就是在沒有形成統(tǒng)一標(biāo)準(zhǔn)之前,廠商們都想自己來定義這項(xiàng)技術(shù)。

事實(shí)上,相比手和腳的選擇,更讓人形機(jī)器人廠商們頭疼的是數(shù)據(jù)的收集問題。

提升機(jī)器人的“軟件”泛化能力,是需要訓(xùn)練數(shù)據(jù)的。

自動駕駛采集數(shù)據(jù),只需在測試車輛上安裝傳感器就好了,機(jī)器人的訓(xùn)練數(shù)據(jù),更多要采集人類的行為數(shù)據(jù),這也是說,需要在從事具體工作的人類身上或者工作場景中安裝傳感器,當(dāng)需要人類參與到數(shù)據(jù)收集時,這個事情就變得復(fù)雜了。

智元機(jī)器人公布了公司的數(shù)據(jù)采集計(jì)劃,預(yù)計(jì)9月底建成一個有100臺左右機(jī)器人的采樣廠,對應(yīng)150個工人,其目標(biāo)是一個工人生產(chǎn)1000條數(shù)據(jù)/天,將數(shù)據(jù)采集的效率如何放在一旁先不談,這種數(shù)據(jù)采集的模式是否可行,還有待后續(xù)觀察。

03 人形機(jī)器人如何賺錢?

一個值得關(guān)注的細(xì)節(jié),目前很多人形機(jī)器人企業(yè)已經(jīng)進(jìn)入到小批量量產(chǎn)階段,部分產(chǎn)品的價(jià)格也被廠商們打到了10萬以內(nèi)。

例如,宇樹科技G1人形機(jī)器人自5月發(fā)布以來,9.9萬元定價(jià)引發(fā)熱議。在2024世界機(jī)器人大會上,宇樹科技宣布G1迎來量產(chǎn)版,設(shè)計(jì)更適應(yīng)大規(guī)模生產(chǎn)。

智元機(jī)器人合伙人兼營銷服副總裁姜青松在接受媒體采訪時表示,智元雙足人形機(jī)器人今年10月份開始量產(chǎn),后期預(yù)計(jì)一個月生產(chǎn)100臺,今年預(yù)計(jì)出貨量200臺左右,輪式機(jī)器人預(yù)計(jì)出貨100臺左右。

此外,EX機(jī)器人CEO李博陽向媒體透露,公司已實(shí)現(xiàn)量產(chǎn)盈利,今年內(nèi)會有500臺左右的生產(chǎn)數(shù)量,明年的出貨量將進(jìn)一步增加。

特斯拉方面也透露,明年將小批量生產(chǎn)人形機(jī)器人,計(jì)劃在工廠部署超千臺以輔助工作。

好消息很多,可是人形機(jī)器人距離真正的商業(yè)落地還是很遠(yuǎn)。

王田苗表示,現(xiàn)階段無論15萬還是10萬或更便宜,主要還是面向科研平臺展示,類似于自動駕駛行業(yè)中的線控底盤,目前的人形機(jī)器人產(chǎn)品更多是行業(yè)內(nèi)的內(nèi)部消化,同行們買來進(jìn)行相關(guān)研發(fā)來用。

有行業(yè)人士分析表示,對應(yīng)著自動駕駛的商業(yè)機(jī)會,具身智能,也就是人形機(jī)器人的發(fā)展過程中也有著三類機(jī)遇。

首先是像L4級自動駕駛一樣,機(jī)器人本地的開發(fā),瞄準(zhǔn)人形機(jī)器人的終局提前占位,只要能夠熬到具身智能時代的真正到來,自然能夠爽吃一把。

其次是像自動駕駛在礦山、封閉園區(qū)、環(huán)衛(wèi)清掃這樣的特定場景中的應(yīng)用,人形機(jī)器人的場景開發(fā)也有不少機(jī)會,只是現(xiàn)在階段行業(yè)的探索尚未有明確的結(jié)果。

最后是上下游的產(chǎn)業(yè)機(jī)會,有時候賣鏟子遠(yuǎn)比挖礦更賺錢。這里的上游包括智算中心的建設(shè)、算力芯片和端側(cè)模型等方面的關(guān)鍵技術(shù);下游則涉及到各種傳感器、關(guān)節(jié)模組等,類似于自動駕駛中的各種雷達(dá)、智能座艙等。

對照著以上,人形機(jī)器人產(chǎn)業(yè)的發(fā)展路徑其實(shí)已經(jīng)非常清晰了。

雖然目前行業(yè)對于人形機(jī)器人在智能機(jī)器人領(lǐng)域的占比有不同觀點(diǎn),樂觀派認(rèn)為人形機(jī)器人的市場份額最高將超過60%。

另一部分產(chǎn)業(yè)觀察者則認(rèn)為,人形機(jī)器人只解決了一部分需求,而其他類型的機(jī)器人,如臂式、輪式、履帶式等機(jī)器人的適用場景更加豐富,因而人形機(jī)器人只會占據(jù)30%左右的市場份額。

真正的市場競爭與坐在辦公室里的“兵棋推演”還是會有不同,人形機(jī)器人的具體形態(tài)取決于應(yīng)用場景和客戶需求,取決于客戶愿意為哪種服務(wù)成本和產(chǎn)品功能買單,最終還是要看技術(shù)的創(chuàng)新能力和發(fā)展程度。

來自國際機(jī)器人協(xié)會預(yù)測顯示,2021年至2030年,全球人形機(jī)器人市場規(guī)模年復(fù)合增長率將高達(dá)71%。中國電子學(xué)會數(shù)據(jù)則稱,到2030年,我國人形機(jī)器人市場規(guī)模有望達(dá)到約8700億元。

       原文標(biāo)題 : 具身智能火了,但規(guī)模落地還需時間

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號