http://www.henanjusheng.com 2026-05-06 10:39 來源:優(yōu)必選科技
隨著具身智能技術持續(xù)迭代,人形機器人的場景認知、指令理解與任務規(guī)劃能力穩(wěn)步提升,逐步具備在真實工業(yè)場景落地應用的基礎能力。但在動態(tài)多變的產線實操環(huán)境中,行業(yè)通用的傳統(tǒng)具身方案仍存在明顯短板:多數模型只能基于實時場景完成靜態(tài)決策與短程任務拆解,缺少對物理世界的場景推演與未來狀態(tài)預判能力,難以適配真實工業(yè)場景實時變化的長程任務作業(yè)需求,導致實現決策執(zhí)行與迭代優(yōu)化的全鏈路無法閉環(huán)。

優(yōu)必選立足工業(yè)場景真實作業(yè)需求與具身智能技術演進方向,基于自研具身智能大模型Thinker,重磅推出全新具身智能世界模型Thinker-WM,打造物理AI基座,實現具身大腦架構與核心能力的全方位升級。憑借在空間泛化、長程任務和綜合性能上的優(yōu)勢,Thinker-WM在權威具身智能評測基準 Libero 中登頂榜首。同時參與榜單排名的還有英偉達、Physical Intelligence、小米等知名公司的模型。
依托優(yōu)必選在行業(yè)積累的數據及對模型架構的針對性優(yōu)化,Thinker-WM構建了Diffusion Transformer統(tǒng)一多模態(tài)空間架構。模型在 Flow Matching 迭代演化過程中,實現視頻表征與機器人動作空間的協同優(yōu)化;在對未來場景進行智能想象推演的同時,漸進式打磨動作生成的合理性與連貫性,使其在復雜長程任務規(guī)劃與執(zhí)行中具備顯著優(yōu)勢。
在全國多地人形機器人數據采集中心網絡的強大數據基建支撐下,優(yōu)必選持續(xù)積累更多工業(yè)分揀、物料搬運、精細操作、雙臂協同等場景的高質量真實交互數據,為世界模型搭建扎實的物理世界認知基底。

所有真實數據均經過精細化清洗、多模態(tài)對齊與多層級質量篩選,留存高價值的場景交互、動作軌跡、環(huán)境動態(tài)變化樣本。這些數據有效地幫助世界模型深度學習真實物理規(guī)則、物體交互邏輯與工業(yè)場景動態(tài)特征,精準掌握現實世界的時空演變規(guī)律,從根源上避免虛擬生成的數據脫離實際作業(yè)場景的問題,為后續(xù)智能數據的生成筑牢堅實根基。
01、登頂Libero 攻克長程任務最難壁壘
Thinker-WM 憑借全新的多模態(tài)融合架構與自主智能進化能力,助力優(yōu)必選在權威具身智能評測基準 Libero 中斬獲榜首。Libero 仿真環(huán)境重點評估機器人終身知識遷移能力,核心考核跨場景泛化、物體泛化、長程任務執(zhí)行三大關鍵能力。
目前業(yè)內多數模型在空間泛化與物體泛化任務上已逼近滿分,但長程任務執(zhí)行始終是行業(yè)長期難以攻克的技術壁壘。而 Thinker-WM 依托具身智能世界模型強大的場景推演與動態(tài)環(huán)境預判能力,有效破解了長程任務中的環(huán)境狀態(tài)時序變化、執(zhí)行誤差累積等核心難題,取得當前長程任務執(zhí)行最優(yōu)性能。同時我們也清晰看到,模型在空間泛化與物體泛化維度仍有性能提升潛力,后續(xù)將通過高質量場景數據迭代、模型底層架構持續(xù)優(yōu)化,進一步補齊能力短板、實現綜合性能再躍升。

為進一步驗證Thinker-WM模型在更加真實的復雜場景下的動作生成精度與未來預測能力,針對日常家居與辦公兩大典型場景,我們在另一個權威Benchmark——Robotwin中選取了六大類精細化基礎操作任務構建評測集,對Thinker-WM的動作執(zhí)行精度、軌跡穩(wěn)定性及生成內容的視覺保真度(PSNR, SSIM)進行同步量化評估與多維分析,結果展現出Thinker-WM在更加復雜場景下的依然具有高精度的操作與視頻生成能力。
02、世界模型驅動智能數據飛輪 打造虛實協同的全新訓練范式
當前行業(yè)普遍存在真實機器人交互數據采集成本高、危險場景采樣難、長尾樣本數量稀缺、動態(tài)復雜任務數據不足等問題,單純依靠真機采集的傳統(tǒng)訓練方式,已經無法滿足機器人動態(tài)預判、精細操控與復雜場景適配的迭代需求。

優(yōu)必選依托全新世界模型架構,重構具身數據的生產與訓練邏輯,搭建專屬新一代具身模型的AI數據飛輪體系,打破真實數據采集的物理限制,實現數據與模型的雙向協同進化。
真實數據打底 少量數據撬動超強泛化性能
少量高質量的真機數據能夠精準錨定真實世界的物理交互規(guī)則與作業(yè)約束,為模型提供不可替代的“地基”。

例如,單條操作數據就可以生成十條以上相同場景不同軌跡的高保真虛擬數據,極大放大有限真實樣本的利用效率。這套范式擺脫了行業(yè)對超大批量真實標注數據集的依賴,最終實現更低訓練成本、更強動態(tài)預判、更穩(wěn)精細操控、更廣場景泛化的工程落地優(yōu)勢。
虛擬數據 擴容虛實融合補齊數據短板
區(qū)別于傳統(tǒng)模型完全依賴真實數據訓練的局限性,新一代模型可以依托自主習得的物理世界規(guī)律,釋放強大的場景想象與智能數據生成能力?;谏倭扛哔|量真實基準數據,世界模型能夠智能推演生成海量高保真、多樣化、高難度的虛擬訓練數據,補齊真機難以采集的極限工況、動態(tài)干擾、長尾場景、多步驟復雜操作等稀缺樣本。同時支持場景環(huán)境、光照視角、物體姿態(tài)、作業(yè)軌跡的自適應泛化生成,有效彌補真實數據集的場景短板,低成本訓練數據量級與多樣性的雙重提升。
雙向進化閉環(huán) VLA與世界模型的雙向進化
升級后的具身智能數據采集鏈路包含了真實數據校準、世界模型生成、高質量數據回流、VLA策略優(yōu)化,形成更加穩(wěn)健端到端數據閉環(huán)飛輪。世界模型產出的海量高保真虛擬數據,可持續(xù)為下游VLA模型提供訓練支撐,有效強化VLA的精細動作控制、動態(tài)場景響應、復雜任務閉環(huán)執(zhí)行能力,補足傳統(tǒng)VLA模型訓練樣本單一、動態(tài)適配能力弱、小場景泛化效果差的短板。同時VLA在真實場景作業(yè)中產生的全新交互數據、失敗案例與實操反饋,會反向回流迭代世界模型,持續(xù)優(yōu)化模型的物理推演精度與場景生成質量,讓虛擬數據更加貼合真實工業(yè)作業(yè)邏輯。

03、數據飛輪驅動模型進化 加速通用具身智能落地
優(yōu)必選Thinker-WM通過真實數據打底、虛擬數據擴容、雙向進化閉環(huán)的模式,模型既可精準掌握真實物理規(guī)則,又能依托海量泛化樣本提升復雜場景適配能力,實現從被動數據投喂到主動生成數據、自主學習技能、持續(xù)優(yōu)化能力的跨越式升級。這套自驅式數據迭代機制,使模型在持續(xù)場景交互與數據循環(huán)中補齊能力短板、拓展技能邊界。
堅持技術開源,優(yōu)必選近期將在具身智能開發(fā)者社區(qū)Thinker-Cosmos上開源Thinker-WM,攜手全球開發(fā)者共建具身智能數據生態(tài),持續(xù)推進模型迭代革新,加速人形機器人在千行百業(yè)的規(guī)?;涞嘏c應用普及。