http://www.henanjusheng.com 2026-06-26 15:49 來源:中國工業(yè)新聞網(wǎng)
2026年是“十五五”規(guī)劃開局之年,也是新質(zhì)生產(chǎn)力加速培育、智能制造全面升級的關(guān)鍵之年,機(jī)器視覺作為智能制造研究和感知的核心,正在從傳統(tǒng)數(shù)據(jù)采集邁入智能決策的范式。機(jī)器視覺產(chǎn)業(yè)聯(lián)盟理事長潘津認(rèn)為,當(dāng)前,全球制造業(yè)正在經(jīng)歷深刻變革,新一代智能制造已成為產(chǎn)業(yè)升級的主攻方向。“我國機(jī)器視覺行業(yè)規(guī)模正保持年均超過20%的快速增長。”潘津表示。
當(dāng)今世界之爭莫過于科技競爭,而科技競爭的實(shí)質(zhì)又在于智能制造和人工智能(AI)技術(shù)領(lǐng)域的爭奪。作為人工智能(AI)快速發(fā)展的關(guān)鍵性技術(shù)應(yīng)用之一,機(jī)器視覺的地位作用不斷增強(qiáng)和放大,甚至影響著一個(gè)國家乃至世界經(jīng)濟(jì)社會(huì)發(fā)展格局,成為推動(dòng)全球科技發(fā)展的關(guān)鍵力量。
機(jī)器視覺已經(jīng)成為制造業(yè)數(shù)智化轉(zhuǎn)型發(fā)展的“必選項(xiàng)”,在可預(yù)見的未來將長期呈現(xiàn)百花齊放的繁榮形態(tài)。6月25日,在機(jī)器視覺助力智能制造創(chuàng)新發(fā)展大會(huì)上,復(fù)旦大學(xué)智能機(jī)器人與先進(jìn)制造創(chuàng)新學(xué)院副院長張萬路介紹,機(jī)器視覺又稱計(jì)算機(jī)視覺,是研究采用人工智能技術(shù)實(shí)現(xiàn)機(jī)器模擬人類視覺功能的一門學(xué)科。他認(rèn)為,未來機(jī)器視覺感知的發(fā)展不僅需要更強(qiáng)的算法,更需要建立從光學(xué)信息獲取到智能認(rèn)知決策系統(tǒng)級理論體系。
我國大力推進(jìn)新型工業(yè)化,而人工智能(AI)深度賦能實(shí)體經(jīng)濟(jì),機(jī)器視覺正從配套技術(shù)躍升為智能制造的核心引擎。6月3日,工業(yè)和信息化部印發(fā)的《“人工智能+信息通信”創(chuàng)新發(fā)展實(shí)施意見(2026—2028年)》明確指出,賦能垂直行業(yè)提升體制升級、培育一批工業(yè)智能體、加快工業(yè)視覺檢測等應(yīng)用規(guī)模推廣等一系列政策信號(hào),為機(jī)器視覺發(fā)展指明了方向,注入了強(qiáng)勁動(dòng)力。
為機(jī)器植入“眼睛”和“大腦”,讓世界看清中國智造。隨著AI大模型、具身智能等技術(shù)加速突破,工業(yè)AI正在實(shí)現(xiàn)從感知到認(rèn)知再到?jīng)Q策的歷史性跨越,具身智能與工業(yè)大模型深度融合將讓機(jī)器視覺不僅僅是“看見”,更是理解和行動(dòng),讓機(jī)器獲得真正的“眼睛”和“大腦”。“今天的機(jī)器視覺早已不止于看得清,更做到了看得準(zhǔn)、想得快、會(huì)決策、能行動(dòng)。”潘津認(rèn)為。
我國機(jī)器人產(chǎn)業(yè)展現(xiàn)出強(qiáng)勁增長韌性
當(dāng)前,我國制造業(yè)全面邁向數(shù)字化、智能化和柔性化,發(fā)展新質(zhì)生產(chǎn)力、建設(shè)現(xiàn)代化產(chǎn)業(yè)體系成為制造業(yè)高質(zhì)量發(fā)展的核心主線。中國電子技術(shù)標(biāo)準(zhǔn)研究院技術(shù)總監(jiān)張暉分析說,我國智能制造發(fā)展從“十四五”時(shí)期需求驅(qū)動(dòng)、場景牽引到“十五五”高端躍升、服務(wù)全球,政策培育邏輯從“給項(xiàng)目”轉(zhuǎn)向“給場景”,產(chǎn)業(yè)培育重心向“強(qiáng)不強(qiáng)”和“走出去”遞進(jìn),供應(yīng)商進(jìn)一步向全球價(jià)值共創(chuàng)者升級。他表示,“十五五”規(guī)劃總體方向以智能化、綠色化、融合化為抓手,激活實(shí)體經(jīng)濟(jì)潛能,通過“傳統(tǒng)+新興+未來”三層產(chǎn)業(yè)布局,構(gòu)筑可持續(xù)的現(xiàn)代化產(chǎn)業(yè)體系。
實(shí)際上,我國機(jī)器人產(chǎn)業(yè)展現(xiàn)出強(qiáng)勁增長韌性,工業(yè)機(jī)器人增速高達(dá)33.2%,在規(guī)模擴(kuò)張的同時(shí)產(chǎn)品技術(shù)實(shí)現(xiàn)了加速創(chuàng)新和迭代,從減速器、字符控制器等關(guān)鍵零部件到新一代傳感器、零巧手,通用智能底座等新型軟硬件不斷取得新的突破。而且,我國機(jī)器人整機(jī)智能化程度越來越高,機(jī)器操作能力越來越強(qiáng),正加速向更廣更深的領(lǐng)域拓展,成為推動(dòng)賦能產(chǎn)業(yè)升級、拉動(dòng)生產(chǎn)力整體躍升的重要驅(qū)動(dòng)力。
機(jī)器視覺核心技術(shù)能不能掌握在自己手里直接決定了國產(chǎn)智造的發(fā)展底氣。凌云光技術(shù)股份有限公司產(chǎn)品與解決方案部總經(jīng)理包振健認(rèn)為,在“國家智能制造”戰(zhàn)略驅(qū)動(dòng)下,我國機(jī)器視覺技術(shù)創(chuàng)新與應(yīng)用滲透同步加速,專利布局、企業(yè)數(shù)量與市場規(guī)模實(shí)現(xiàn)多維突破,產(chǎn)業(yè)生態(tài)日趨繁榮。但是在行業(yè)高速發(fā)展的背后,實(shí)際應(yīng)用中存在“數(shù)據(jù)孤島、自動(dòng)化閉環(huán)缺失和價(jià)值兌現(xiàn)不足”等“隱形短板”問題,正制約著機(jī)器視覺從單純的檢測工具向智能決策核心的進(jìn)化。
張暉分析,智能制造未來發(fā)展面臨著歷史性機(jī)遇:一是AI技術(shù)突破,開啟換道超車新范式。二是政策強(qiáng)力驅(qū)動(dòng),釋放“人工智能+”紅利。三是數(shù)據(jù)要素市場化,激活核心生產(chǎn)要素。但智能制造未來發(fā)展面臨著挑戰(zhàn):一是核心技術(shù)依賴,二是數(shù)據(jù)價(jià)值釋放不足,三是轉(zhuǎn)向成本與人才“瓶頸”,四是標(biāo)準(zhǔn)與安全亟待完善。智能制造未來發(fā)展戰(zhàn)略關(guān)注點(diǎn):政府方面強(qiáng)化頂層設(shè)計(jì)、精準(zhǔn)投入與公共服務(wù)。企業(yè)方面“一把手”掛帥、場景驅(qū)動(dòng)與數(shù)據(jù)筑基。人才方面擁抱變化、主動(dòng)進(jìn)化、跨界融合、復(fù)合發(fā)展。
機(jī)器視覺深度賦能機(jī)器人產(chǎn)業(yè)發(fā)展
機(jī)器人作為智能制造核心裝備,機(jī)器視覺是機(jī)器人感知外界、精準(zhǔn)作業(yè)、自主決策的智慧慧眼,早已成為打通機(jī)器人落地應(yīng)用、破解制造痛點(diǎn)、升級產(chǎn)線能力的核心關(guān)鍵,而機(jī)器人和機(jī)器視覺的深度融合徹底重構(gòu)了工業(yè)分揀、精密裝配、在線質(zhì)檢、無序抓取、柔性生產(chǎn)等全流程,推動(dòng)著中國制造從自動(dòng)化走向智能化、無人化和高精度生產(chǎn)的全面新階段。同時(shí),機(jī)器視覺和機(jī)器人融合發(fā)展已經(jīng)從產(chǎn)線“選配”升級為“標(biāo)配”,成為機(jī)器人行業(yè)智能化升級不可或缺的核心力量。
機(jī)器視覺是機(jī)器人的“眼睛”,更是人類的大腦,機(jī)器視覺行業(yè)的快速發(fā)展從看得見、看得清到看得懂,深度賦能機(jī)器人產(chǎn)業(yè)發(fā)展。潘津分析,具身智能讓智能體從感知走向交互,工業(yè)大模型讓視覺系統(tǒng)更懂場景、更適配產(chǎn)線,3D視覺與智能傳感使高端制造更加柔性、精密。在半導(dǎo)體、新能源、PCB、光通信等關(guān)鍵賽道上,視覺技術(shù)正不斷破解“卡脖子”難題,提升產(chǎn)業(yè)鏈韌性與安全水平。新視諾科技(蘇州)有限公司“關(guān)注1%關(guān)鍵數(shù)據(jù)”極致效率,提供“算力輕量化、能耗高效化、性能實(shí)際化、隱私安全化”四大核心價(jià)值。
當(dāng)機(jī)器視覺與AI大模型、具身智能的深度融合,智能制造的“眼睛”和“大腦”正在被重新定義。清華大學(xué)人工智能研究院視覺智能研究中心教授鄧志東認(rèn)為,對具身智能而言,大模型驅(qū)動(dòng)的空間視覺是AI智能體觀察與理解真實(shí)物理世界的“眼睛”,對許多物理任務(wù)只有用“眼睛”看見了、看懂了,才能進(jìn)行可靠的決策與規(guī)劃,才能生成相應(yīng)的物理交互動(dòng)作。“空間視覺就是機(jī)器視覺從傳統(tǒng)的被動(dòng)感知躍升為主動(dòng)的幾何與物理學(xué)認(rèn)知,聚焦對真實(shí)物理世界中空間物體遵從物理學(xué)規(guī)律的幾何屬性及其關(guān)系的理解與預(yù)測。”鄧志東說。
鄧志東分析,空間視覺與具身智能關(guān)鍵核心技術(shù):一是融合感知與主動(dòng)探索技術(shù)。二是多模態(tài)(圖像、視頻、點(diǎn)云、語言、動(dòng)作等對齊技術(shù)。三是空間表征與空間理解技術(shù)。四是空間推理、空間預(yù)測與視覺-語言-導(dǎo)航技術(shù)。他表示,傳統(tǒng)的機(jī)器視覺利用特征工程的方法,需要進(jìn)化到具有深度學(xué)習(xí)能力的“端到端”新范式,而且還要進(jìn)一步與多模態(tài)基礎(chǔ)大模型相結(jié)合,并將物理AI驅(qū)動(dòng)的空間視覺作為具身智能“感知-決策-行動(dòng)”或“觀察-思考-執(zhí)行”大閉環(huán)中視覺感知或視覺觀察的實(shí)時(shí)入口,這是機(jī)器視覺下一個(gè)范式的躍遷。
真正把“看得見”變?yōu)?ldquo;做得到”
在“戰(zhàn)略引領(lǐng)、AI驅(qū)動(dòng)、硬核攻堅(jiān)”的新階段,我國具身智能技術(shù)突破與產(chǎn)業(yè)實(shí)踐的深度融合是制勝關(guān)鍵。鄧志東認(rèn)為,面向具身智能的空間視覺面臨的主要挑戰(zhàn):一是缺乏高質(zhì)量多樣性物理空間交互大數(shù)據(jù)。二是對物理世界的空間理解與空間推理存在嚴(yán)重不足。三是對開放性應(yīng)用場景的支持非常有限。四是較低AI端測算力與實(shí)高時(shí)推斷需求之間的矛盾日益凸顯。“當(dāng)前,四足機(jī)器人與通用人形機(jī)器人在復(fù)雜環(huán)境中的移動(dòng)與操作主要依賴于二維圖像與三維激光雷達(dá)點(diǎn)云等僅有二維視覺感知,沒有空間視覺認(rèn)知。”鄧志東表示。
鄧志東舉例說,自動(dòng)駕駛、無人機(jī)、無人艇等空間視覺感知、自主決策與場景預(yù)測能力較低。大模型驅(qū)動(dòng)的新一代AI可穿戴設(shè)備與智能家居終端設(shè)備,尚無自然高效的物理空間交互與人機(jī)協(xié)作能力。真實(shí)工業(yè)場景下的多AI智能體協(xié)同制造能力也有待提升,尚需空間視覺與空間智能加持。張萬路認(rèn)為,算法決定機(jī)器視覺效果,圖像質(zhì)量決定機(jī)器視覺效果的上限,可見不同光譜對機(jī)器視覺成像有著重要影響,其中紅色鉛筆在紅色光譜和藍(lán)色光譜下的圖像最為突出。
機(jī)器視覺行業(yè)通用賽道競爭日趨白熱化,突破核心技術(shù)壁壘,實(shí)現(xiàn)智能制造一體化成為行業(yè)高質(zhì)量發(fā)展的核心方向。鄧志東表示,為了適應(yīng)面臨的挑戰(zhàn),面向具身智能的空間視覺與空間智能須做出五方面的努力:一是發(fā)展空間智能與世界基礎(chǔ)大模型。二是從大型語言模型到物理學(xué)“端到端”建模。三是如何進(jìn)行空間視覺感知并理解真實(shí)的物理世界成為最大的技術(shù)挑戰(zhàn)。四是發(fā)展經(jīng)驗(yàn)主義的物理AI面向直覺技能任務(wù)增加空間持久記憶。五是端云協(xié)同與產(chǎn)業(yè)部署。
事實(shí)上,好的品質(zhì)是制造出來的,具身智能機(jī)器人可以應(yīng)用在裝配、巡檢等場景做到本體可復(fù)用、靈活搭配功能模塊。而當(dāng)下工業(yè)機(jī)器人落地量產(chǎn)線的核心“瓶頸”不在“動(dòng)”,而在“看”——能不能精準(zhǔn)識(shí)別目標(biāo)、自主規(guī)劃路徑、柔性適應(yīng)變化,決定了機(jī)器人能不能真正替人干活。廣東奧普特科技股份有限公司為具身機(jī)器人提供完整的“眼睛”與“視覺大腦”,實(shí)現(xiàn)從“視覺感知”到“落地應(yīng)用”的跨越,真正把“看得見”變?yōu)?ldquo;做得到”。