具身智能是萬億賽道。今年以來,具身智能熱度空前,投資金額攀升,各種資本涌入。

當前,具身智能賽道是否有泡沫?哪些場景會先成熟落地?VLA一定是最終機器人大腦的終局?賽道決賽圈將如何?

6月28日,在2025華映資本年度大會上,星動紀元創(chuàng)始人陳建宇、自變量機器人創(chuàng)始人&CEO王潛、地瓜機器人CEO王叢、魔法原子總裁吳長征展開了一場討論。


華映資本圓桌論壇現(xiàn)場。企業(yè)供圖


“還是需要更多的熱錢進來”

具身智能市場熱度攀升,具身智能是否存在泡沫?

星動紀元是研發(fā)通用型人形機器人和機器人通用大腦的公司,陳建宇表示,完全沒有到泡沫階段。具身智能、人形機器人是物理的AI,是智能機器人,行業(yè)理應(yīng)比智能汽車、大語言模型更大。但目前行業(yè)投資規(guī)模、融資水平與智能汽車的頭部企業(yè)相比還是少很多。因為這個周期稍微長些,現(xiàn)在還沒有找到真正長期的核心的規(guī)?;虡I(yè)應(yīng)用的閉環(huán)。一旦行業(yè)有玩家找到規(guī)?;虡I(yè)應(yīng)用,第二波非常大的資本馬上爆發(fā)。

自變量機器人是一個基礎(chǔ)模型公司,王潛認為,目前應(yīng)該是中國AI歷史上泡沫最小的時候,和美國市場比,我們水平差不多,具身智能是非常少見的中國可以和美國站在一條起跑線上的大賽道,但融資規(guī)模還是差一個數(shù)量級。國內(nèi)頭部公司在幾十億元人民幣的規(guī)模,美國是幾十億美元的規(guī)模。這是比較危險的,雖處于一條起跑線上,而且國內(nèi)具有特有優(yōu)勢,比如供應(yīng)鏈、人才,但是融資還是差得比較多,還是需要更多的熱錢進來。

地瓜是從地平線獨立的專門做機器人軟硬件芯片和系統(tǒng)平臺的公司,王叢提到,泡沫是個真問題,也是一個假問題。創(chuàng)始人不需要關(guān)注賽道是否有泡沫,去做就好了。當然實操層面是真問題,關(guān)注是否在泡沫期,會判斷投資的節(jié)奏。不過,都會有企業(yè)穿越周期,最后取得成功。投資機構(gòu)需要找到真正的玩家,無論是否有泡沫都沒關(guān)系。
 
魔法原子以通用人形機器人和四足機器人為主要方向,“更多的目光和資金聚集這是好事,這樣加速了供應(yīng)鏈、人才的聚集,對具身智能行業(yè)是一個巨大的推動。從長期來看,具身智能一定是劃時代的,在未來五十年、一百年,可以變革人類的發(fā)展歷程。對于一家企業(yè)來說,會更加堅信機器人未來一定用在實際的生產(chǎn)生活當中,回歸到了從事具身智能的初心。”吳長征認為。
 
B端場景最先落地

商業(yè)化場景評估是具身智能落地進程中的關(guān)鍵一環(huán),哪些場景會先成熟落地?
 
吳長征認為,現(xiàn)在最適合的場景更多還是在B端領(lǐng)域,相對垂直的一些場景里,比如搬運、上下料、質(zhì)檢等環(huán)節(jié)。當前,人形機器人的能力與人的能力還是有差距,更多做一些相對簡單的事情,把數(shù)據(jù)、模型、服務(wù)體系跑通是關(guān)鍵?,F(xiàn)在已經(jīng)讓機器人進到家電制造的產(chǎn)線,做涂膠工位上下料,因為這個產(chǎn)線經(jīng)常需要切換,家電制造的節(jié)奏很快,兩到三個月要切換一次產(chǎn)線,這個過程中沒有辦法通過自動化設(shè)備,人形機器人反而能夠具備的能力,未來三到五年可以解決更復(fù)雜的場景。
 
王叢總結(jié),現(xiàn)在具身智能分為四具,教具、展具、科研工具、數(shù)采工具等,目前還在探索當中,有很多不同的策略,如具身智能替代工人,替代一些本來就不好招工的地方。當然隨著科技的周期變化,可能有階段性的行業(yè)落地,再到更大范圍的落地,一步一步拓展。
 
具身智能包括人形機器人感知、決策、執(zhí)行三大核心能力,VLA一定是最終機器人大腦的終局?
 
在陳建宇看來,VLA是三個字母,V是視覺,L是語言,A是動作。一個VLA的模型,現(xiàn)在的范式定義是視覺和語言作為輸入,用模型輸出動作,相當于一個機器人通過傳感器、攝像頭感知世界,通過語言指令輸出動作,將動作完成。用目前的方法采集數(shù)據(jù),用模型訓(xùn)練的范式一定不是最終極的形態(tài),還有很多可以改進的地方。此前是沒有這么好的端到端并且必須泛化的模型范式,現(xiàn)在已經(jīng)有了巨大的進展。

“以前的VLA,L太重了,先是有語言模型,再加視覺模塊、動作模塊??赡墁F(xiàn)在的順序反了,如果在預(yù)訓(xùn)練時,先訓(xùn)練視覺和動作,用一些生成式的模型,然后進一步跟語言對齊,在解決一些精細操作時會有更好的優(yōu)勢?!标惤ㄓ钐岬?,現(xiàn)在VLA都是模仿學(xué)習(xí),與以前學(xué)習(xí)模式識別是一樣的,是一個純離線的學(xué)習(xí)方式。我們設(shè)計了一個算法架構(gòu),用于強化學(xué)習(xí),在模仿學(xué)習(xí)的基礎(chǔ)上進一步微調(diào)。
 
“VLA是一個很泛的觀念,理論上只要有這三個部分就是一個VLA模型,如果從最泛的意義來講,肯定是已經(jīng)收斂到VLA模型范式上。很難想象將來通用機器人不包含這三個方面。過去四十年,AI總體最大的目標是讓模型越來越統(tǒng)一,越來越端到端。當前,我們更傾向于通用模型,不管是具身智能還是AI的大方向上,是行業(yè)公認的技術(shù)收斂點?!蓖鯘撜J為。

賽道介于手機與汽車之間

具身智能賽道創(chuàng)業(yè)者聚集、巨頭涌入,具身智能決賽圈如何?需要具備哪些特質(zhì)?
   
陳建宇提到,具身智能和機器人的決賽圈應(yīng)該會是比較豐富的狀態(tài)?,F(xiàn)在智能駕駛領(lǐng)域,有手機企業(yè)跨界,有芯片和算法公司,也有專門做自動駕駛的公司,還有多方面的零部件廠商。未來機器人和智能汽車非常像,或者說智能汽車就是一種形態(tài)的機器人,所以決賽圈也會有主機廠做整機,有的可能偏硬件,有的偏做AI大腦,發(fā)展范式類似,未來看到有公司跑出來以后,大廠會真正大規(guī)模進場??赡軙l(fā)單一形態(tài)或者多形態(tài)的大量單品的終端產(chǎn)品,比如家用機器人,想象空間無窮大。

對于如何跨越周期,“一是保持長周期的技術(shù)壁壘,二是找到很好的商業(yè)落地,并且建立閉環(huán)?!标惤ㄓ钫J為。
 
王潛以手機和汽車行業(yè)發(fā)展歷程為例,現(xiàn)在手機市場就只剩下六七家主機廠,汽車市場還有幾十家,機器人應(yīng)該是介于兩者之間。包括產(chǎn)業(yè)鏈長度、體積重量大小、復(fù)雜性,最終會收斂到全球一二十家的主機廠,其中可能會包含一些芯片巨頭,純粹在虛擬世界中或者是純粹在制造業(yè)中的巨頭,機會相對小一點,因為這是一個軟硬一體的工作,最終決賽圈大概率還是今天的創(chuàng)業(yè)公司。

“未來通用家用機器人會收斂到幾家,但是機器人應(yīng)用太多了,很難收斂。”王叢表示。

吳長征從市場容量來說,“應(yīng)該會有非常多,核心會回歸到產(chǎn)品、服務(wù)。魔法原子潛心打造自己的產(chǎn)品和技術(shù),也在積極拓展自己的生態(tài),未來具身事業(yè)還需要有更多的場景。通過打造場景到技術(shù)的生態(tài)閉環(huán),才能夠持續(xù)下去,這也是我們的一點兒底氣?!?br>
新京報貝殼財經(jīng)記者 陳維城
編輯 張冰
校對 劉軍