操喷视频网站,9999999re

具身智能仍需“世界模型”突破，泛化能力是最大挑戰(zhàn)

http://www.henanjusheng.com 2026-06-18 16:09 來(lái)源：中國(guó)電子報(bào)

從數(shù)字世界走向物理世界，人工智能正站在一個(gè)新的范式變革的關(guān)口。在近日舉辦的2026北京智源大會(huì)期間，智源研究院院長(zhǎng)王仲遠(yuǎn)接受《中國(guó)電子報(bào)》等媒體采訪，就具身智能、世界模型及AI安全等前沿話題分享了深度見解。王仲遠(yuǎn)指出，當(dāng)前具身智能在硬件層面取得了顯著進(jìn)步，但通用化與泛化能力仍是制約其大規(guī)模落地的核心瓶頸，而世界模型正是打開這一困局的關(guān)鍵鑰匙。

具身智能硬件突破顯著，泛化能力嚴(yán)重不足

王仲遠(yuǎn)坦言，過(guò)去一年多來(lái)，具身智能領(lǐng)域在硬件本體層面進(jìn)步顯著。“機(jī)器人可以進(jìn)行非常復(fù)雜的表演，能夠跑馬拉松，而且已經(jīng)超過(guò)了人類的馬拉松冠軍。”-在技術(shù)落地層面，越來(lái)越多的機(jī)器人開始進(jìn)入工廠、物流等實(shí)際場(chǎng)景，解決具體問(wèn)題并形成數(shù)據(jù)閉環(huán)。

然而，距離真正的通用具身智能仍有相當(dāng)距離。“當(dāng)前具身智能的泛化能力依然嚴(yán)重不足。”王仲遠(yuǎn)直言，“一旦將一個(gè)任務(wù)遷移到另外一個(gè)任務(wù)，它的失敗概率依然很高。”相比之下，人類具備極強(qiáng)的通用性和泛化能力，這正是當(dāng)下具身智能必須突破和解決的核心問(wèn)題。

在王仲遠(yuǎn)看來(lái)，具身智能的突破需要依賴世界模型這一關(guān)鍵基座。“世界模型與具身智能的關(guān)系，本質(zhì)上是‘大腦’與‘身體’的關(guān)系。”他指出，大模型在經(jīng)歷了大語(yǔ)言、視覺(jué)模型、多模態(tài)的探索之后，需要從虛擬走向真實(shí)世界的下一階段。

世界模型的核心本質(zhì)，是實(shí)現(xiàn)對(duì)物理世界下一狀態(tài)的預(yù)測(cè)。“面向物理世界的世界模型以真實(shí)場(chǎng)景的時(shí)空規(guī)律、物理常識(shí)與因果邏輯為建模核心，能夠感知、推演環(huán)境變化，支撐AI完成與實(shí)體世界的主動(dòng)交互。”但王仲遠(yuǎn)也坦承，當(dāng)前模型在因果推理、復(fù)雜動(dòng)態(tài)系統(tǒng)預(yù)判這些核心能力上存在瓶頸，對(duì)物理場(chǎng)景的推演結(jié)果尚達(dá)不到實(shí)用標(biāo)準(zhǔn)。

在技術(shù)路線上，智源研究院對(duì)現(xiàn)有世界模型進(jìn)行了系統(tǒng)性梳理，將其分為四大類：第一類是以語(yǔ)言為中心的世界模型，包括VLM（視覺(jué)語(yǔ)言大模型）、VLA（視覺(jué)-語(yǔ)言-動(dòng)作模型）等；第二類是以像素為中心的視頻生成模型；第三類是以三維結(jié)構(gòu)為中心的空間模型；第四類是以視覺(jué)表征為中心的模型。王仲遠(yuǎn)強(qiáng)調(diào)，未來(lái)不排除模型會(huì)走向大一統(tǒng)的方向。

VLA不必推倒重來(lái)，但終將被新一代模型替代

針對(duì)當(dāng)前基于VLA的具身智能技術(shù)路線是否需要“推倒重來(lái)”的疑問(wèn)，王仲遠(yuǎn)的回答十分明確：“不用推倒重來(lái)，但它一定會(huì)在將來(lái)的某個(gè)時(shí)間點(diǎn)被新的模型給替代。”

王仲遠(yuǎn)指出，現(xiàn)有的VLA類模型已經(jīng)能夠在某些具體場(chǎng)景中發(fā)揮作用，在某些具體特定的場(chǎng)景中已經(jīng)能夠達(dá)到類人的水平。他以2012年深度學(xué)習(xí)的興起作比——當(dāng)時(shí)大模型尚未出現(xiàn)，但深度學(xué)習(xí)已經(jīng)能夠針對(duì)特定問(wèn)題、特定場(chǎng)景訓(xùn)練特定模型，并在該場(chǎng)景中工作得比人類更好，這就足以推動(dòng)產(chǎn)業(yè)發(fā)展。同樣，阿爾法Go能戰(zhàn)勝圍棋世界冠軍卻無(wú)法解決其他領(lǐng)域問(wèn)題，但并不妨礙其產(chǎn)生廣泛的應(yīng)用價(jià)值。

因此，關(guān)于具身智能，他也持類似觀點(diǎn)：現(xiàn)在的技術(shù)雖然其泛化性面向真實(shí)的物理世界依然不夠，但是不阻礙現(xiàn)在具身智能技術(shù)和產(chǎn)業(yè)的發(fā)展。

對(duì)于下一代世界模型應(yīng)具備的特征，王仲遠(yuǎn)提出了明確方向：必須是全模態(tài)的，必須以下一個(gè)物理狀態(tài)預(yù)測(cè)為核心，必須能夠理解真實(shí)的物理規(guī)律和物理常識(shí)，同時(shí)又需要具備主動(dòng)交互的能力。

“我們相信，如果真的誕生這樣的一個(gè)下一代世界基座模型，它才能夠真正去推動(dòng)具身智能，解決我們現(xiàn)在實(shí)際落地中遇到的各種困難，尤其是泛化性和面向真實(shí)場(chǎng)景的推理能力。”

談及人工智能，王仲遠(yuǎn)觀察到，AI在數(shù)字世界和物理世界的發(fā)展速度正在分化。

在數(shù)字世界里面，不管是更強(qiáng)的基座模型，還是AI Coding，都已經(jīng)展現(xiàn)出了極強(qiáng)的能力，甚至很多人認(rèn)為呈指數(shù)級(jí)的能力躍升。整個(gè)數(shù)字世界都有可能被新一代人工智能重構(gòu)。

而在物理世界，智能體的發(fā)展則相對(duì)緩慢。王仲遠(yuǎn)指出，這是因?yàn)槲覀冞€缺乏一個(gè)世界基座模型，缺乏一個(gè)對(duì)于時(shí)間空間、物理規(guī)律，對(duì)于多模態(tài)乃至全模態(tài)有很好的理解推理、規(guī)劃決策的基座模型。

王仲遠(yuǎn)預(yù)計(jì)，在未來(lái)一年到兩三年內(nèi)，將看到越來(lái)越多數(shù)字世界中智能體的落地，幫助人類解決很多問(wèn)題。例如，智源研究院已研發(fā)了心臟輔助診斷智能體、自主科研智能體等多款產(chǎn)品，用于提升醫(yī)療診斷水平下沉和科研效率。

在AI安全方面，王仲遠(yuǎn)指出行業(yè)關(guān)注點(diǎn)正在發(fā)生變化。“行業(yè)在前兩年更多擔(dān)憂超級(jí)人工智能的遠(yuǎn)期風(fēng)險(xiǎn)。如今，隨著AI智能體、大模型自進(jìn)化能力發(fā)展，已出現(xiàn)大量現(xiàn)實(shí)可能復(fù)現(xiàn)的安全威脅。”

王仲遠(yuǎn)呼吁，應(yīng)對(duì)AI安全風(fēng)險(xiǎn)，不僅僅是技術(shù)，實(shí)際上需要技術(shù)、產(chǎn)業(yè)、政策以及各領(lǐng)域的專家，大家來(lái)共同攜手，共同努力來(lái)應(yīng)對(duì)。

欧美韩国日本桃色,一区二区三区国产私人毛片,精品极品精品,亚洲一区人妻,久久久久久久久亚洲免费,青娱乐91,亚洲情涩,久久久成人毛片,日本欧美不卡二区在线

具身智能仍需“世界模型”突破，泛化能力是最大挑戰(zhàn)

相關(guān)新聞

編輯精選

工控原創(chuàng)

欧美韩国日本桃色,一区二区三区国产私人毛片,精品极品精品,亚洲一区人妻,久久久久久久久亚洲免费,青娱乐91,亚洲情涩,久久久成人毛片,日本欧美不卡二区在线

具身智能仍需“世界模型”突破，泛化能力是最大挑戰(zhàn)

相關(guān)新聞

編輯精選

工控原創(chuàng)

具身智能仍需“世界模型”突破，泛化能力是最大挑戰(zhàn)