【導讀】機器視覺(jué)(MV)是一種使機器人和自動(dòng)駕駛汽車(chē)等其他機器能夠看到和識別周?chē)h(huán)境中物體的技術(shù)。在過(guò)去幾年里,機器視覺(jué)的進(jìn)步使得許多機器人和自動(dòng)駕駛汽車(chē)擁有了幾乎與人類(lèi)相似的感知水平。這個(gè)過(guò)程主要是通過(guò)將光學(xué)傳感器與人工智能和可以分析和處理圖像數據的機器學(xué)習工具進(jìn)行配對,此時(shí)搭載了機器視覺(jué)系統的機器人和自動(dòng)駕駛汽車(chē)就能夠執行非常復雜的任務(wù)了。
眼睛和大腦:
機器視覺(jué)和計算機視覺(jué)的主要區別
很多時(shí)候,機器視覺(jué)會(huì )與計算機視覺(jué)一詞混為一談。然而,事實(shí)上二者還是有區別的。對機器視覺(jué)而言,它通常與具備計算機視覺(jué)能力的工業(yè)應用聯(lián)系在一起,需要攝像頭來(lái)捕捉和提供圖像數據。計算機視覺(jué)的任務(wù)則是將已有的圖像數字化,處理其中包含的數據并采取某種行動(dòng)。
一般來(lái)講,機器視覺(jué)系統的處理能力相對較小,主要用于精益制造環(huán)境,通過(guò)高速執行實(shí)際任務(wù)以獲取完成指定作業(yè)所需的數據。計算機視覺(jué)系統是處理視覺(jué)數據的人工智能(AI)和機器學(xué)習(ML)算法的所在,它需要收集盡可能多的關(guān)于物體或場(chǎng)景的數據并充分理解它們。因此,計算機視覺(jué)既要能夠分析來(lái)自運動(dòng)檢測器、紅外傳感器等來(lái)源的圖像,又可以在沒(méi)有相機的情況下執行任務(wù),掃描數字網(wǎng)絡(luò )照片或視頻,處理來(lái)自任何來(lái)源(包括互聯(lián)網(wǎng))的圖像。從本質(zhì)上講,機器視覺(jué)就是系統的眼睛,而計算機視覺(jué)則相當于系統的大腦。
相機:
機器視覺(jué)系統中的重要組件
機器視覺(jué)是一項看似簡(jiǎn)單但實(shí)際上相當復雜的技術(shù)。首先,它需要使用專(zhuān)門(mén)的光學(xué)器件來(lái)捕捉周?chē)h(huán)境中的視覺(jué)信息。然后,再借助硬件和軟件的組合對圖像的某些特征進(jìn)行處理、分析和測量。例如,作為制造系統的一部分的機器視覺(jué)應用程序可以用于分析在裝配線(xiàn)上制造的零件的特定特性,確定零件是否符合質(zhì)量標準。
在實(shí)際應用中,機器視覺(jué)常常被看作是計算機的一種視覺(jué)能力,其系統由一個(gè)或多個(gè)光學(xué)傳感器(如高分辨率相機)、模數轉換(ADC)和數字信號處理(DSP)等器件組成。相機和傳感器用于收集感光形式的圖像,并將其轉化為電信號,所產(chǎn)生的電信號經(jīng)數字化處理后被傳輸到計算機進(jìn)行分析并提供所需的輸出。在技術(shù)復雜性上,機器視覺(jué)與語(yǔ)音識別相似。
目前,用于制造業(yè)的機器視覺(jué)主要采用兩種類(lèi)型的相機,即:面陣掃描相機和線(xiàn)陣掃描相機。
面陣掃描相機使用矩形傳感器在單個(gè)幀中拍攝照片,傳感器中的像素數量對應于圖像的寬度和高度。線(xiàn)陣掃描相機是逐個(gè)像素地構建圖像,它們適用于拍攝運動(dòng)中或尺寸不規則的物品的圖像。在拍攝照片時(shí),傳感器在物體上以線(xiàn)性運動(dòng)通過(guò),因此,線(xiàn)陣掃描相機不像面陣掃描相機那樣局限于特定的分辨率。
相機的靈敏度和分辨率是機器視覺(jué)系統的兩個(gè)重要參數,其中,分辨率負責區分物體,而靈敏度是機器在光線(xiàn)昏暗或波長(cháng)不可見(jiàn)的情況下檢測物體或微弱脈沖的能力。一般來(lái)說(shuō),分辨率越大,視野就越有限。靈敏度和分辨率是相互依存的,如果其他因素不變,增加靈敏度就會(huì )降低分辨率,而增加分辨率則會(huì )降低靈敏度。面陣相機的分辨率和掃描頻率一般均低于線(xiàn)陣相機。
許多機器視覺(jué)相機的分辨率超過(guò)4,500萬(wàn)像素,這些相機能以極高的速度拍攝物體而不會(huì )失真。推動(dòng)機器視覺(jué)功能的另一個(gè)進(jìn)步是基于事件的視覺(jué)傳感器。這些傳感器處理圖像的方式與人眼的視神經(jīng)處理信息的方式類(lèi)似。更具體地說(shuō),這些基于事件的視覺(jué)傳感器檢測每個(gè)像素的亮度變化。這種能力使機器視覺(jué)能夠在比傳統的基于幀的視覺(jué)傳感器暗得多的環(huán)境中使用。
Sony Spresense的ISX012是一款有效像素達到511萬(wàn)像素的圖像傳感器,相機板在Spreseense的主板上使用了這款結構緊湊、高分辨率的傳感器來(lái)擴展主板的功能。板載編碼器可以采集JPEG、RAW、Y/C或RGB格式的圖片。相機板通過(guò)專(zhuān)用的并行接口直接連接到主板,當與主板上CXD5602微控制器的AI功能相結合時(shí),可為物聯(lián)網(wǎng)設備提供先進(jìn)的視覺(jué)功能。
圖1:可提供先進(jìn)的視覺(jué)功能的
Sony Spresense相機板(圖源:Mouser)
當然,出于應用成本的考慮,機器視覺(jué)系統不是越復雜越好,而應選擇適合的。一維(1D)視覺(jué)、二維(2D)視覺(jué)以及三維(3D)視覺(jué)這三種類(lèi)型是常用的、面向不同任務(wù)的機器視覺(jué)系統。
01 1D視覺(jué)
1D視覺(jué)不會(huì )一次性完成整個(gè)物體圖像的分析,而是一次讀取一行,通常采用線(xiàn)陣掃描相機,這種類(lèi)型的機器視覺(jué)常常用在制造過(guò)程中的產(chǎn)品檢測,比如用來(lái)發(fā)現傳送帶上產(chǎn)品中的缺陷;
02 2D視覺(jué)
2D視覺(jué)主要使用數碼相機收集圖像數據,通過(guò)比較一幅圖像與下一幅圖像的變化來(lái)確定下一步應采取的處理措施,這種類(lèi)型的機器視覺(jué)通常用于物體跟蹤以及產(chǎn)品的類(lèi)型驗證等;
03 3D視覺(jué)
3D視覺(jué)通常在不同位置使用多個(gè)數碼相機和其他傳感器來(lái)捕捉物體的數字模型或圖像,從而對其位置、大小和特征進(jìn)行準確的評估,因此,3D機器視覺(jué)非常適合幫助機器人導航周?chē)h(huán)境并執行與訂單相關(guān)的任務(wù)。
隨著(zhù)不同垂直行業(yè)對質(zhì)量檢測和自動(dòng)化的需求不斷增加,3D機器視覺(jué)市場(chǎng)將以高于行業(yè)平均水平的速度實(shí)現快速增長(cháng)。Grand View Research的分析數據表明,2022年,全球3D機器視覺(jué)市場(chǎng)規模為58.1億美元,預計2023年至2030年的復合年增長(cháng)率(CAGR)將達到13.5%。
ams OSRAM公司的Mira220全局快門(mén)圖像傳感器是一款體積小巧、專(zhuān)為工業(yè)機器視覺(jué)應用而設計的2D和3D解決方案,有效分辨率為1,600(H)x 1,400(V),幀速率可高達90fps,深度為12位。Mira220采用的先進(jìn)背面照明(BSI)技術(shù)將傳感器層堆疊在數字/讀出層的頂部,這種設計產(chǎn)生了占位面積僅為5.3毫米×5.3毫米的芯片級封裝,特別適合空間受限產(chǎn)品的設計。
Mira220的功耗非常低,在睡眠模式下僅需4mW,在空閑模式下功耗40mW,而在90fps的全分辨率下也僅僅需要350mW。此外,Mira220傳感器還可以利用MIPI CSI-2接口方便地與處理器和FPGA進(jìn)行交互。
圖2:專(zhuān)為工業(yè)機器視覺(jué)應用而設計的ams OSRAM的Mira220全局快門(mén)圖像傳感器(圖源:ams OSRAM)
工業(yè):
機器視覺(jué)應用的主戰場(chǎng)
機器人之所以能與人類(lèi)做同樣的工作,主要歸功于機器視覺(jué)。機器人手臂用它來(lái)檢查從裝配線(xiàn)上下來(lái)的零件和產(chǎn)品,確定哪些符合質(zhì)量標準。此外,機器視覺(jué)還使機器人和人類(lèi)之間的協(xié)作更加高效和安全?,F在,機器視覺(jué)已經(jīng)成為工業(yè)4.0過(guò)程自動(dòng)化的關(guān)鍵技術(shù),其中汽車(chē)、制藥、包裝、食品和飲料等垂直行業(yè)是使用機器人系統比較突出的領(lǐng)域。
據Grand View Research的分析,2022年,全球機器視覺(jué)市場(chǎng)規模為168.9億美元,預計2023年至2030年將以12.3%的復合年增長(cháng)率(CAGR)增長(cháng),到2030年,市場(chǎng)規模將達到416億美元。按照產(chǎn)品劃分,機器視覺(jué)產(chǎn)品可細分為基于PC的和基于智能攝像頭的系統。2022年,基于PC的細分市場(chǎng)在全球的市場(chǎng)份額超過(guò)54.92%,接下來(lái)的幾年里預計這一趨勢仍將得到延續。
與機構或教育應用中使用的機器視覺(jué)系統相比,工業(yè)機器視覺(jué)系統通常更耐用,并要求較高的可靠性、穩定性和準確性,而它們的成本則比在軍事、航空航天、國防和政府應用中使用的系統要低很多。這也是近些年機器視覺(jué)在工業(yè)領(lǐng)域日益普及的重要原因。
在工業(yè)應用中,機器視覺(jué)常常被用于執行各種任務(wù),下面我們就列舉一些:
01 電子元件的識別和分析。對元器件的準確識別及跟蹤是整個(gè)制造或物流過(guò)程控制的重要環(huán)節。例如,將機器視覺(jué)用于電路板的焊接過(guò)程監控,除了完成焊接質(zhì)量檢查,還能同步檢查元器件的放置是否正確。
02 印刷缺陷識別。印刷缺陷識別的目的是定位印刷異常,如不正確的色調或印刷品的缺失或有缺陷的部分,機器視覺(jué)的應用大幅降低了人為因素可能出現的錯誤。
03 材料檢查。材料檢測系統中的機器視覺(jué)功能確保了產(chǎn)品的質(zhì)量控制,它能準確識別產(chǎn)品中的缺陷甚至污染物。例如,可將機器視覺(jué)系統用于藥丸和片劑的過(guò)程監控。
04 物體定位。在機器人制導等應用中,機器視覺(jué)通常被用來(lái)尋找東西,其目的是確定目標物體的坐標和位置。這也是機器視覺(jué)普遍的應用之一。
05 模式識別。機器視覺(jué)在當今的醫學(xué)診斷方面發(fā)揮了重要作用。醫學(xué)成像分析使用基于機器視覺(jué)的模式識別、磁共振成像、血液掃描和大腦掃描等技術(shù)可對疾病進(jìn)行準確的診斷。
06 物體識別。在汽車(chē)行業(yè),自動(dòng)駕駛汽車(chē)使用機器視覺(jué)系統中的攝像頭拍攝的圖像進(jìn)行物體識別,得以準確地分析出道路上的障礙物類(lèi)型。隨著(zhù)自動(dòng)駕駛技術(shù)的不斷演進(jìn),這一領(lǐng)域將成為機器視覺(jué)極具發(fā)展前景的應用之一。
人工智能:
工業(yè)機器視覺(jué)技術(shù)發(fā)展的加速器
現代機器視覺(jué)系統開(kāi)始越來(lái)越多地使用人工智能(AI)方法與技術(shù),如機器學(xué)習或深度學(xué)習,以及人工神經(jīng)網(wǎng)絡(luò )。AI能夠處理大量以前難以收集的圖像和數據信息,加快了決策過(guò)程。例如,簽名和字符識別,有了人工智能的加持,機器視覺(jué)系統可以快速甄別其中的細微差別。
在制造業(yè)中,AI有助于物體識別和材料檢查,使機器視覺(jué)系統能夠理解物體或材料形狀和紋理的變化。在質(zhì)量保證方面,AI系統可以分析出現的異?,F象,而不是單純地檢出和拒絕不符合規范的產(chǎn)品。機器視覺(jué)與AI和深度學(xué)習相結合,擴大了機器人在執行生產(chǎn)線(xiàn)任務(wù)中的作用,如挑選、分揀、放置和執行生產(chǎn)線(xiàn)掃描。這種技術(shù)組合還使機器人能夠在其他環(huán)境中運行,如超市、醫院和餐館等?;贏(yíng)I的機器視覺(jué)還可以在更廣泛的背景和照明設置中識別缺陷,并靈活應對產(chǎn)品外觀(guān)和缺陷類(lèi)型的變化,例如凹痕或變色。
深度學(xué)習是人工智能中一個(gè)更復雜、更強大的子集,在機器視覺(jué)應用中也越來(lái)越多地被采用。在人工智能的支持下,機器視覺(jué)系統常常被用來(lái)執行復雜的任務(wù),比如質(zhì)量控制、裝配控制、過(guò)程控制和機器人操控等。在過(guò)去幾年里,將人工智能融入機器視覺(jué)應用是工業(yè)機器視覺(jué)技術(shù)發(fā)展的主要加速器。在“未來(lái)的工廠(chǎng)”中,機器視覺(jué)和AI技術(shù)將是過(guò)程自動(dòng)化和提高效率的關(guān)鍵組成部分。
機器視覺(jué)與AI的技術(shù)進(jìn)步離不開(kāi)芯片組的支持。新一代嵌入式芯片的功能更強大,成本合理,適用于處理圖像和運行基于A(yíng)I的機器視覺(jué)算法,可將深度學(xué)習訓練時(shí)間從數周減少到數小時(shí)。
NXP的i.MX 95系列應用處理器將eIQ Neutron神經(jīng)處理單元(NPU)、Arm Mali沉浸式3D圖形處理、異構安全分區和網(wǎng)絡(luò )功能組合在一起,可實(shí)現機器學(xué)習和先進(jìn)的邊緣應用。此外,i.MX95還集成了NXP的圖像信號處理器(ISP),支持多種不同的圖像傳感器,從而實(shí)現工業(yè)、機器人、醫療和汽車(chē)等領(lǐng)域廣泛的視覺(jué)應用。為此,NXP專(zhuān)門(mén)針對機器視覺(jué)應用對這個(gè)ISP進(jìn)行了優(yōu)化,能支持兩個(gè)目標區域、兩個(gè)曝光的HDR合成、先進(jìn)降噪和邊緣增強,支持彩色、單色和RGB-IR攝像頭傳感器。
在i.MX95 SoC中,主要通過(guò)集成的eIQ Neutron NPU實(shí)現機器視覺(jué),在這里,NPU作為視覺(jué)處理通路的一部分,連通多個(gè)攝像頭傳感器和網(wǎng)絡(luò )連接的智能攝像頭。
圖3:NXP i.MX95系統框圖
(圖源:NXP)
本文小結
工業(yè)機器視覺(jué)是使用相機、鏡頭和照明設備對制成品進(jìn)行自動(dòng)視覺(jué)檢查。這是一種實(shí)時(shí)檢測部件的方法,既快速又準確,它可以對高速生產(chǎn)線(xiàn)上的每一件產(chǎn)品進(jìn)行拍攝和分析,通過(guò)復雜的算法來(lái)檢查和評估在工業(yè)環(huán)境中獲取的圖像,確保100%的質(zhì)量控制。它還可以自動(dòng)化許多工業(yè)檢查,包括缺陷和問(wèn)題的目視檢查、產(chǎn)品存在與否檢查、產(chǎn)品類(lèi)型驗證、測量和產(chǎn)品代碼讀取等。今天,工業(yè)自動(dòng)化正在以驚人的速度發(fā)展,機器視覺(jué)技術(shù)在其發(fā)展和擴張中發(fā)揮著(zhù)至關(guān)重要的作用。
在剛剛過(guò)去幾年里,融入了人工智能的機器視覺(jué)技術(shù)幫助許多機器人和自動(dòng)駕駛汽車(chē)實(shí)現了幾乎與人類(lèi)相似的感知水平。通過(guò)使用大量先進(jìn)的光學(xué)傳感器,如高分辨率相機,這些機器人和汽車(chē)最終能夠以自己的方式擁有“看”的能力。多種技術(shù)的融合和飛速發(fā)展使得新應用的潛力顯著(zhù)增加,這意味著(zhù)未來(lái)的機器視覺(jué)技術(shù)將與更多的行業(yè)相關(guān),所創(chuàng )建的解決方案也將更加通用和智能。
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀:
上百萬(wàn)顆電芯實(shí)時(shí)監測管理,儲能系統的“大腦”BMS有何過(guò)人之處?