欧美韩国日本桃色,一区二区三区国产私人毛片,精品极品精品,亚洲一区人妻,久久久久久久久亚洲免费,青娱乐91,亚洲情涩,久久久成人毛片,日本欧美不卡二区在线

中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情

具身智能仍需“世界模型”突破,泛化能力是最大挑戰(zhàn)

http://www.henanjusheng.com 2026-06-18 16:09 來源:中國電子報

從數(shù)字世界走向物理世界,人工智能正站在一個新的范式變革的關(guān)口。在近日舉辦的2026北京智源大會期間,智源研究院院長王仲遠接受《中國電子報》等媒體采訪,就具身智能、世界模型及AI安全等前沿話題分享了深度見解。王仲遠指出,當前具身智能在硬件層面取得了顯著進步,但通用化與泛化能力仍是制約其大規(guī)模落地的核心瓶頸,而世界模型正是打開這一困局的關(guān)鍵鑰匙。

具身智能硬件突破顯著,泛化能力嚴重不足

王仲遠坦言,過去一年多來,具身智能領(lǐng)域在硬件本體層面進步顯著。“機器人可以進行非常復雜的表演,能夠跑馬拉松,而且已經(jīng)超過了人類的馬拉松冠軍。”-在技術(shù)落地層面,越來越多的機器人開始進入工廠、物流等實際場景,解決具體問題并形成數(shù)據(jù)閉環(huán)。

然而,距離真正的通用具身智能仍有相當距離。“當前具身智能的泛化能力依然嚴重不足。”王仲遠直言,“一旦將一個任務(wù)遷移到另外一個任務(wù),它的失敗概率依然很高。”相比之下,人類具備極強的通用性和泛化能力,這正是當下具身智能必須突破和解決的核心問題。

在王仲遠看來,具身智能的突破需要依賴世界模型這一關(guān)鍵基座。“世界模型與具身智能的關(guān)系,本質(zhì)上是‘大腦’與‘身體’的關(guān)系。”他指出,大模型在經(jīng)歷了大語言、視覺模型、多模態(tài)的探索之后,需要從虛擬走向真實世界的下一階段。

世界模型的核心本質(zhì),是實現(xiàn)對物理世界下一狀態(tài)的預測。“面向物理世界的世界模型以真實場景的時空規(guī)律、物理常識與因果邏輯為建模核心,能夠感知、推演環(huán)境變化,支撐AI完成與實體世界的主動交互。”但王仲遠也坦承,當前模型在因果推理、復雜動態(tài)系統(tǒng)預判這些核心能力上存在瓶頸,對物理場景的推演結(jié)果尚達不到實用標準。

在技術(shù)路線上,智源研究院對現(xiàn)有世界模型進行了系統(tǒng)性梳理,將其分為四大類:第一類是以語言為中心的世界模型,包括VLM(視覺語言大模型)、VLA(視覺-語言-動作模型)等;第二類是以像素為中心的視頻生成模型;第三類是以三維結(jié)構(gòu)為中心的空間模型;第四類是以視覺表征為中心的模型。王仲遠強調(diào),未來不排除模型會走向大一統(tǒng)的方向。

VLA不必推倒重來,但終將被新一代模型替代

針對當前基于VLA的具身智能技術(shù)路線是否需要“推倒重來”的疑問,王仲遠的回答十分明確:“不用推倒重來,但它一定會在將來的某個時間點被新的模型給替代。”

王仲遠指出,現(xiàn)有的VLA類模型已經(jīng)能夠在某些具體場景中發(fā)揮作用,在某些具體特定的場景中已經(jīng)能夠達到類人的水平。他以2012年深度學習的興起作比——當時大模型尚未出現(xiàn),但深度學習已經(jīng)能夠針對特定問題、特定場景訓練特定模型,并在該場景中工作得比人類更好,這就足以推動產(chǎn)業(yè)發(fā)展。同樣,阿爾法Go能戰(zhàn)勝圍棋世界冠軍卻無法解決其他領(lǐng)域問題,但并不妨礙其產(chǎn)生廣泛的應(yīng)用價值。

因此,關(guān)于具身智能,他也持類似觀點:現(xiàn)在的技術(shù)雖然其泛化性面向真實的物理世界依然不夠,但是不阻礙現(xiàn)在具身智能技術(shù)和產(chǎn)業(yè)的發(fā)展。

對于下一代世界模型應(yīng)具備的特征,王仲遠提出了明確方向:必須是全模態(tài)的,必須以下一個物理狀態(tài)預測為核心,必須能夠理解真實的物理規(guī)律和物理常識,同時又需要具備主動交互的能力。

“我們相信,如果真的誕生這樣的一個下一代世界基座模型,它才能夠真正去推動具身智能,解決我們現(xiàn)在實際落地中遇到的各種困難,尤其是泛化性和面向真實場景的推理能力。”

談及人工智能,王仲遠觀察到,AI在數(shù)字世界和物理世界的發(fā)展速度正在分化。

在數(shù)字世界里面,不管是更強的基座模型,還是AI Coding,都已經(jīng)展現(xiàn)出了極強的能力,甚至很多人認為呈指數(shù)級的能力躍升。整個數(shù)字世界都有可能被新一代人工智能重構(gòu)。

而在物理世界,智能體的發(fā)展則相對緩慢。王仲遠指出,這是因為我們還缺乏一個世界基座模型,缺乏一個對于時間空間、物理規(guī)律,對于多模態(tài)乃至全模態(tài)有很好的理解推理、規(guī)劃決策的基座模型。

王仲遠預計,在未來一年到兩三年內(nèi),將看到越來越多數(shù)字世界中智能體的落地,幫助人類解決很多問題。例如,智源研究院已研發(fā)了心臟輔助診斷智能體、自主科研智能體等多款產(chǎn)品,用于提升醫(yī)療診斷水平下沉和科研效率。

在AI安全方面,王仲遠指出行業(yè)關(guān)注點正在發(fā)生變化。“行業(yè)在前兩年更多擔憂超級人工智能的遠期風險。如今,隨著AI智能體、大模型自進化能力發(fā)展,已出現(xiàn)大量現(xiàn)實可能復現(xiàn)的安全威脅。”

王仲遠呼吁,應(yīng)對AI安全風險,不僅僅是技術(shù),實際上需要技術(shù)、產(chǎn)業(yè)、政策以及各領(lǐng)域的專家,大家來共同攜手,共同努力來應(yīng)對。

版權(quán)所有 工控網(wǎng) Copyright?2026 Gkong.com, All Rights Reserved
梅州市| 五河县| 衡山县| 垣曲县| 会宁县| 鹤峰县| 武强县| 丹巴县| 和顺县| 陆丰市| 济源市| 太康县| 武城县| 佛山市| 营山县| 马山县| 淅川县| 景德镇市| 谷城县| 乌审旗| 新龙县| 元江| 新野县| 青川县| 长沙县| 菏泽市| 永城市| 三亚市| 钟祥市| 阿拉善左旗| 赞皇县| 察哈| 普兰县| 江阴市| 祥云县| 大连市| 泽州县| 临夏县| 新密市| 麦盖提县| 霍城县|