http://www.henanjusheng.com 2026-05-06 10:39 來源:優(yōu)必選科技
隨著具身智能技術(shù)持續(xù)迭代,人形機(jī)器人的場景認(rèn)知、指令理解與任務(wù)規(guī)劃能力穩(wěn)步提升,逐步具備在真實(shí)工業(yè)場景落地應(yīng)用的基礎(chǔ)能力。但在動(dòng)態(tài)多變的產(chǎn)線實(shí)操環(huán)境中,行業(yè)通用的傳統(tǒng)具身方案仍存在明顯短板:多數(shù)模型只能基于實(shí)時(shí)場景完成靜態(tài)決策與短程任務(wù)拆解,缺少對物理世界的場景推演與未來狀態(tài)預(yù)判能力,難以適配真實(shí)工業(yè)場景實(shí)時(shí)變化的長程任務(wù)作業(yè)需求,導(dǎo)致實(shí)現(xiàn)決策執(zhí)行與迭代優(yōu)化的全鏈路無法閉環(huán)。

優(yōu)必選立足工業(yè)場景真實(shí)作業(yè)需求與具身智能技術(shù)演進(jìn)方向,基于自研具身智能大模型Thinker,重磅推出全新具身智能世界模型Thinker-WM,打造物理AI基座,實(shí)現(xiàn)具身大腦架構(gòu)與核心能力的全方位升級。憑借在空間泛化、長程任務(wù)和綜合性能上的優(yōu)勢,Thinker-WM在權(quán)威具身智能評測基準(zhǔn) Libero 中登頂榜首。同時(shí)參與榜單排名的還有英偉達(dá)、Physical Intelligence、小米等知名公司的模型。
依托優(yōu)必選在行業(yè)積累的數(shù)據(jù)及對模型架構(gòu)的針對性優(yōu)化,Thinker-WM構(gòu)建了Diffusion Transformer統(tǒng)一多模態(tài)空間架構(gòu)。模型在 Flow Matching 迭代演化過程中,實(shí)現(xiàn)視頻表征與機(jī)器人動(dòng)作空間的協(xié)同優(yōu)化;在對未來場景進(jìn)行智能想象推演的同時(shí),漸進(jìn)式打磨動(dòng)作生成的合理性與連貫性,使其在復(fù)雜長程任務(wù)規(guī)劃與執(zhí)行中具備顯著優(yōu)勢。
在全國多地人形機(jī)器人數(shù)據(jù)采集中心網(wǎng)絡(luò)的強(qiáng)大數(shù)據(jù)基建支撐下,優(yōu)必選持續(xù)積累更多工業(yè)分揀、物料搬運(yùn)、精細(xì)操作、雙臂協(xié)同等場景的高質(zhì)量真實(shí)交互數(shù)據(jù),為世界模型搭建扎實(shí)的物理世界認(rèn)知基底。

所有真實(shí)數(shù)據(jù)均經(jīng)過精細(xì)化清洗、多模態(tài)對齊與多層級質(zhì)量篩選,留存高價(jià)值的場景交互、動(dòng)作軌跡、環(huán)境動(dòng)態(tài)變化樣本。這些數(shù)據(jù)有效地幫助世界模型深度學(xué)習(xí)真實(shí)物理規(guī)則、物體交互邏輯與工業(yè)場景動(dòng)態(tài)特征,精準(zhǔn)掌握現(xiàn)實(shí)世界的時(shí)空演變規(guī)律,從根源上避免虛擬生成的數(shù)據(jù)脫離實(shí)際作業(yè)場景的問題,為后續(xù)智能數(shù)據(jù)的生成筑牢堅(jiān)實(shí)根基。
01、登頂Libero 攻克長程任務(wù)最難壁壘
Thinker-WM 憑借全新的多模態(tài)融合架構(gòu)與自主智能進(jìn)化能力,助力優(yōu)必選在權(quán)威具身智能評測基準(zhǔn) Libero 中斬獲榜首。Libero 仿真環(huán)境重點(diǎn)評估機(jī)器人終身知識遷移能力,核心考核跨場景泛化、物體泛化、長程任務(wù)執(zhí)行三大關(guān)鍵能力。
目前業(yè)內(nèi)多數(shù)模型在空間泛化與物體泛化任務(wù)上已逼近滿分,但長程任務(wù)執(zhí)行始終是行業(yè)長期難以攻克的技術(shù)壁壘。而 Thinker-WM 依托具身智能世界模型強(qiáng)大的場景推演與動(dòng)態(tài)環(huán)境預(yù)判能力,有效破解了長程任務(wù)中的環(huán)境狀態(tài)時(shí)序變化、執(zhí)行誤差累積等核心難題,取得當(dāng)前長程任務(wù)執(zhí)行最優(yōu)性能。同時(shí)我們也清晰看到,模型在空間泛化與物體泛化維度仍有性能提升潛力,后續(xù)將通過高質(zhì)量場景數(shù)據(jù)迭代、模型底層架構(gòu)持續(xù)優(yōu)化,進(jìn)一步補(bǔ)齊能力短板、實(shí)現(xiàn)綜合性能再躍升。

為進(jìn)一步驗(yàn)證Thinker-WM模型在更加真實(shí)的復(fù)雜場景下的動(dòng)作生成精度與未來預(yù)測能力,針對日常家居與辦公兩大典型場景,我們在另一個(gè)權(quán)威Benchmark——Robotwin中選取了六大類精細(xì)化基礎(chǔ)操作任務(wù)構(gòu)建評測集,對Thinker-WM的動(dòng)作執(zhí)行精度、軌跡穩(wěn)定性及生成內(nèi)容的視覺保真度(PSNR, SSIM)進(jìn)行同步量化評估與多維分析,結(jié)果展現(xiàn)出Thinker-WM在更加復(fù)雜場景下的依然具有高精度的操作與視頻生成能力。
02、世界模型驅(qū)動(dòng)智能數(shù)據(jù)飛輪 打造虛實(shí)協(xié)同的全新訓(xùn)練范式
當(dāng)前行業(yè)普遍存在真實(shí)機(jī)器人交互數(shù)據(jù)采集成本高、危險(xiǎn)場景采樣難、長尾樣本數(shù)量稀缺、動(dòng)態(tài)復(fù)雜任務(wù)數(shù)據(jù)不足等問題,單純依靠真機(jī)采集的傳統(tǒng)訓(xùn)練方式,已經(jīng)無法滿足機(jī)器人動(dòng)態(tài)預(yù)判、精細(xì)操控與復(fù)雜場景適配的迭代需求。

優(yōu)必選依托全新世界模型架構(gòu),重構(gòu)具身數(shù)據(jù)的生產(chǎn)與訓(xùn)練邏輯,搭建專屬新一代具身模型的AI數(shù)據(jù)飛輪體系,打破真實(shí)數(shù)據(jù)采集的物理限制,實(shí)現(xiàn)數(shù)據(jù)與模型的雙向協(xié)同進(jìn)化。
真實(shí)數(shù)據(jù)打底 少量數(shù)據(jù)撬動(dòng)超強(qiáng)泛化性能
少量高質(zhì)量的真機(jī)數(shù)據(jù)能夠精準(zhǔn)錨定真實(shí)世界的物理交互規(guī)則與作業(yè)約束,為模型提供不可替代的“地基”。

例如,單條操作數(shù)據(jù)就可以生成十條以上相同場景不同軌跡的高保真虛擬數(shù)據(jù),極大放大有限真實(shí)樣本的利用效率。這套范式擺脫了行業(yè)對超大批量真實(shí)標(biāo)注數(shù)據(jù)集的依賴,最終實(shí)現(xiàn)更低訓(xùn)練成本、更強(qiáng)動(dòng)態(tài)預(yù)判、更穩(wěn)精細(xì)操控、更廣場景泛化的工程落地優(yōu)勢。
虛擬數(shù)據(jù) 擴(kuò)容虛實(shí)融合補(bǔ)齊數(shù)據(jù)短板
區(qū)別于傳統(tǒng)模型完全依賴真實(shí)數(shù)據(jù)訓(xùn)練的局限性,新一代模型可以依托自主習(xí)得的物理世界規(guī)律,釋放強(qiáng)大的場景想象與智能數(shù)據(jù)生成能力?;谏倭扛哔|(zhì)量真實(shí)基準(zhǔn)數(shù)據(jù),世界模型能夠智能推演生成海量高保真、多樣化、高難度的虛擬訓(xùn)練數(shù)據(jù),補(bǔ)齊真機(jī)難以采集的極限工況、動(dòng)態(tài)干擾、長尾場景、多步驟復(fù)雜操作等稀缺樣本。同時(shí)支持場景環(huán)境、光照視角、物體姿態(tài)、作業(yè)軌跡的自適應(yīng)泛化生成,有效彌補(bǔ)真實(shí)數(shù)據(jù)集的場景短板,低成本訓(xùn)練數(shù)據(jù)量級與多樣性的雙重提升。
雙向進(jìn)化閉環(huán) VLA與世界模型的雙向進(jìn)化
升級后的具身智能數(shù)據(jù)采集鏈路包含了真實(shí)數(shù)據(jù)校準(zhǔn)、世界模型生成、高質(zhì)量數(shù)據(jù)回流、VLA策略優(yōu)化,形成更加穩(wěn)健端到端數(shù)據(jù)閉環(huán)飛輪。世界模型產(chǎn)出的海量高保真虛擬數(shù)據(jù),可持續(xù)為下游VLA模型提供訓(xùn)練支撐,有效強(qiáng)化VLA的精細(xì)動(dòng)作控制、動(dòng)態(tài)場景響應(yīng)、復(fù)雜任務(wù)閉環(huán)執(zhí)行能力,補(bǔ)足傳統(tǒng)VLA模型訓(xùn)練樣本單一、動(dòng)態(tài)適配能力弱、小場景泛化效果差的短板。同時(shí)VLA在真實(shí)場景作業(yè)中產(chǎn)生的全新交互數(shù)據(jù)、失敗案例與實(shí)操反饋,會(huì)反向回流迭代世界模型,持續(xù)優(yōu)化模型的物理推演精度與場景生成質(zhì)量,讓虛擬數(shù)據(jù)更加貼合真實(shí)工業(yè)作業(yè)邏輯。

03、數(shù)據(jù)飛輪驅(qū)動(dòng)模型進(jìn)化 加速通用具身智能落地
優(yōu)必選Thinker-WM通過真實(shí)數(shù)據(jù)打底、虛擬數(shù)據(jù)擴(kuò)容、雙向進(jìn)化閉環(huán)的模式,模型既可精準(zhǔn)掌握真實(shí)物理規(guī)則,又能依托海量泛化樣本提升復(fù)雜場景適配能力,實(shí)現(xiàn)從被動(dòng)數(shù)據(jù)投喂到主動(dòng)生成數(shù)據(jù)、自主學(xué)習(xí)技能、持續(xù)優(yōu)化能力的跨越式升級。這套自驅(qū)式數(shù)據(jù)迭代機(jī)制,使模型在持續(xù)場景交互與數(shù)據(jù)循環(huán)中補(bǔ)齊能力短板、拓展技能邊界。
堅(jiān)持技術(shù)開源,優(yōu)必選近期將在具身智能開發(fā)者社區(qū)Thinker-Cosmos上開源Thinker-WM,攜手全球開發(fā)者共建具身智能數(shù)據(jù)生態(tài),持續(xù)推進(jìn)模型迭代革新,加速人形機(jī)器人在千行百業(yè)的規(guī)?;涞嘏c應(yīng)用普及。