【導讀】在人們從自然界獲取的各種信息中,視覺(jué)獲取量最高,約占總信息量的80%。隨著(zhù)信息技術(shù)的發(fā)展,人類(lèi)的視覺(jué)功能逐步被賦予計算機、機器人或其他智能機器。目前正處在行業(yè)風(fēng)口的機器視覺(jué)就是這樣一種技術(shù),它通過(guò)圖像處理實(shí)現自動(dòng)檢測和分析應用,包括自動(dòng)檢測、過(guò)程控制和機器人導航等。目前,機器視覺(jué)(MV)技術(shù)已經(jīng)實(shí)現產(chǎn)品化。視覺(jué)傳感器、鏡頭、高速相機、光源、視覺(jué)軟件、圖像采集卡、視覺(jué)處理器等都變得越來(lái)越完善。在工業(yè)自動(dòng)化環(huán)境中,機器視覺(jué)越來(lái)越受到行業(yè)的關(guān)注,并被大量用于諸如自動(dòng)駕駛汽車(chē)、食品生產(chǎn)、包裝和物流、機器人和無(wú)人機等。
機器視覺(jué)
在人們從自然界獲取的各種信息中,視覺(jué)獲取量最高,約占總信息量的80%。隨著(zhù)信息技術(shù)的發(fā)展,人類(lèi)的視覺(jué)功能逐步被賦予計算機、機器人或其他智能機器。目前正處在行業(yè)風(fēng)口的機器視覺(jué)就是這樣一種技術(shù),它通過(guò)圖像處理實(shí)現自動(dòng)檢測和分析應用,包括自動(dòng)檢測、過(guò)程控制和機器人導航等。目前,機器視覺(jué)(MV)技術(shù)已經(jīng)實(shí)現產(chǎn)品化。視覺(jué)傳感器、鏡頭、高速相機、光源、視覺(jué)軟件、圖像采集卡、視覺(jué)處理器等都變得越來(lái)越完善。在工業(yè)自動(dòng)化環(huán)境中,機器視覺(jué)越來(lái)越受到行業(yè)的關(guān)注,并被大量用于諸如自動(dòng)駕駛汽車(chē)、食品生產(chǎn)、包裝和物流、機器人和無(wú)人機等。
當提到機器視覺(jué)時(shí),技術(shù)人員可能會(huì )很多理解,本文嘗試著(zhù)從四個(gè)方面逐一解釋有關(guān)機器視覺(jué)應了解的真相。
真相一:機器視覺(jué)≠計算機視覺(jué)
機器視覺(jué)是一種通過(guò)光學(xué)設備和非接觸傳感器自動(dòng)接收和處理真實(shí)物體圖像的設備,以獲取所需信息或控制機器人的運動(dòng)。自20世紀50年代開(kāi)始運行,從1980年到1990年,這項技術(shù)真正開(kāi)始起飛并逐漸普及。經(jīng)過(guò)數十年的發(fā)展,機器視覺(jué)已經(jīng)為它是什么以及它是如何工作的積累了各種定義。
自動(dòng)化成像協(xié)會(huì )(AIA)給出了一個(gè)更具廣義意味的定義,即:機器視覺(jué)包括所有工業(yè)和非工業(yè)應用,其中硬件和軟件的組合為設備執行基于圖像捕獲和處理的功能提供操作指導。而SearchEnterpriseAI則給出了機器視覺(jué)的狹義定義,將其稱(chēng)之為“計算機的視覺(jué)能力”,該系統使用一個(gè)或多個(gè)攝像機、模數轉換(ADC)和數字信號處理(DSP),將產(chǎn)生的數據傳輸到計算機或機器人控制器。
在實(shí)際應用中,機器視覺(jué)通常需要與其他先進(jìn)的技術(shù)協(xié)同工作,包括自然語(yǔ)言處理、機器人過(guò)程自動(dòng)化(RPA)、人工智能(AI)和機器學(xué)習(ML)等,以實(shí)現自動(dòng)化所需的“視覺(jué)”功能。你可以把機器視覺(jué)看作是自動(dòng)化的眼睛,AI和ML是大腦,RPA提供了完成工作所需的“鍵盤(pán)手”。近年來(lái),自動(dòng)化的采用速度不斷加快,這對企業(yè)保持行業(yè)競爭力至關(guān)重要。如果把自動(dòng)化想象成“數字化員工”在工作,假如不增加機器視覺(jué),那么所有這些“數字化員工”都會(huì )處于失明狀態(tài)。
計算機視覺(jué)也是近年來(lái)的行業(yè)大熱門(mén),那么它與機器視覺(jué)又有什么關(guān)聯(lián)呢?宏觀(guān)來(lái)講,機器視覺(jué)是一種以新的方式與現有技術(shù)集成并應用于解決現實(shí)世界問(wèn)題的技術(shù)能力,是一門(mén)系統工程學(xué)科。而計算機視覺(jué)是計算機科學(xué)的一種形式,不是通過(guò)固定在機器人上的視覺(jué)設備如攝像頭等有形硬件來(lái)實(shí)現的。
更具體來(lái)說(shuō),機器視覺(jué)是一個(gè)系統的主體,而計算機視覺(jué)是系統的智能,是處理信息的大腦。沒(méi)有計算機視覺(jué),機器視覺(jué)將無(wú)法工作。機器學(xué)習、深度學(xué)習和神經(jīng)網(wǎng)絡(luò )是通過(guò)機器視覺(jué)系統以更快的速度處理項目的三種技術(shù)。這三種技術(shù)可用于擴大機器視覺(jué)對要定位的內容的理解,使其成為機器視覺(jué)的寶貴資產(chǎn)。隨著(zhù)計算機視覺(jué)技術(shù)的進(jìn)步,機器視覺(jué)潛在應用的可能性也相應增加。
值得注意的是,機器視覺(jué)與圖像處理同樣是兩個(gè)不同的概念,圖像處理是一個(gè)輸出圖像的過(guò)程,而機器視覺(jué)系統可以檢測和分類(lèi)廣泛行業(yè)中的各種物體和項目,包括汽車(chē)、電子和半導體、食品和飲料、道路和車(chē)輛交通或智能運輸系統(ITS)、醫療成像、包裝、標簽和印刷、制藥、電視廣播等,基于機器視覺(jué)的技術(shù)正在成為自動(dòng)化創(chuàng )建的核心。
真相二:
硬件和軟件的發(fā)展促成了機器視覺(jué)的進(jìn)步
機器視覺(jué)是工業(yè)自動(dòng)化的眼睛。其主要工作流程是:系統通過(guò)機器視覺(jué)產(chǎn)品(如攝像頭、CMOS或CCD)將拍攝的目標轉換為圖像信號,然后將圖像信號傳輸到專(zhuān)用圖像處理系統。根據像素分布、亮度和顏色等信息,再將圖像信號轉換為數字化信號,最終使機器(機器人或其他工業(yè)工具)能夠完成制造和質(zhì)量驗證等工業(yè)任務(wù)。
機器視覺(jué)是工業(yè)4.0的關(guān)鍵要素,它正以多種方式幫助工業(yè)自動(dòng)化系統,例如通過(guò)改善庫存、檢測故障產(chǎn)品和提高制造質(zhì)量來(lái)提高效率。若要準確地模擬人類(lèi)的感知,機器視覺(jué)需要一系列設備和軟件的幫助。而這些軟硬件技術(shù)的不斷發(fā)展進(jìn)一步推動(dòng)了機器視覺(jué)技術(shù)的演進(jìn)。
#01
智能攝像頭
攝像頭(camera)是機器視覺(jué)系統中檢查物體或物品的主要設備。有時(shí),一個(gè)特定的檢查點(diǎn)可能需要安裝多個(gè)攝像頭,以確??梢哉_檢查每一個(gè)細節。當機器視覺(jué)系統需要從圖像中捕獲和提取特定應用程序的信息時(shí),這時(shí)就需要智能攝像頭的支持。智能攝像頭通常包含所有必要的通信接口,并可連接到Wi-Fi或服務(wù)器,以便傳輸捕獲的圖像數據。作為一種強大工具,深度學(xué)習能使系統設計師快速實(shí)現復雜且主觀(guān)決策的自動(dòng)化,同時(shí)有效提高產(chǎn)品質(zhì)量和產(chǎn)能。由Teledyne Flir公司提供的FLIR Firefly DL攝像頭,內建的深度學(xué)習推斷使得該產(chǎn)品不再需要任務(wù)分類(lèi)的主機系統,大大降低了系統的成本和復雜性。Firefly DL攝像頭尺寸小巧、重量輕且功耗低,非常適合嵌入移動(dòng)、桌面和手持系統。
圖1:Teledyne公司FLIR Firefly DL攝像頭,具有尺寸小巧、功耗低等特點(diǎn)
(圖源:Teledyne)
Omron Industrial Automation公司的S133 UVC彩色CMOS攝像頭同樣是一款智能攝像頭產(chǎn)品,它內置CMOS傳感器,采用超緊湊結構,即插即用,是尋找具有機器視覺(jué)功能攝像頭的理想選擇。由于使用方便,S133 UVC彩色CMOS攝像頭深受工業(yè)/機器視覺(jué)應用、汽車(chē)、生命科學(xué)等領(lǐng)域的歡迎。
圖2:S133 UVC彩色CMOS攝像頭
(圖源:Omron)
#02
3D攝像頭
3D攝像頭可以在圖像中顯示被檢測物的深度,以顯示圖像的不同角度。通過(guò)在機器視覺(jué)系統中使用3D攝像頭,將帶來(lái)不同的視角和深度感知。飛行時(shí)間(ToF)攝像頭是使用飛行時(shí)間原理測量距離的3D攝像頭。ToF成像技術(shù)允許它在不掃描物體的情況下進(jìn)行3D成像,該技術(shù)通??筛采w幾米到約40米的距離,每秒最多100張圖像,距離分辨率約為5到10毫米,橫向分辨率約為200 x 200。
歷史上,因對ToF的準確性存在一些質(zhì)疑,人們通常將其視為精度較低的3D傳感技術(shù)。當然,近些年很多頭部企業(yè)已經(jīng)開(kāi)發(fā)出高達130萬(wàn)像素的高分辨率產(chǎn)品,用于機器視覺(jué)系統的高精度ToF攝像頭能顯著(zhù)提高生產(chǎn)的靈活性和自動(dòng)化程度。索尼公司的IMX556 DepthSense ToF傳感器采用CAPD和背面照明(BSI)技術(shù),與市場(chǎng)上現有的ToF解決方案相比,能夠提供精確到毫米的精度,在6米工作距離下,以30fps的速度提供640 x 480的分辨率。
圖3:索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細更快速的幀率重建被測物體
(圖源:Sony)
Texas Instruments的OPT8241飛行時(shí)間 (ToF) 傳感器,將ToF傳感與模數轉換器和可編程定時(shí)發(fā)生器(TG)相結合,該器件能以高達150幀/秒的幀速率提供320 x 240分辨率的圖像。內置的TG可控制復位、調制和讀出數字化序列。同時(shí),TG具備可編程性,可靈活優(yōu)化各項深度感知性能指標,例如功率、運動(dòng)穩健性、信噪比和環(huán)境消除等。
圖4:TI公司OPT8241 ToF傳感器系統框圖
(圖源:TI)
#03
視覺(jué)傳感器
視覺(jué)傳感器是機器視覺(jué)系統的核心,是最大化環(huán)境特性的來(lái)源,其核心設備是CCD、CMOS等圖像傳感器。這些分辨率較高的視覺(jué)傳感器通常能夠生成包含更多像素的圖像,非常有助于提高圖像質(zhì)量,更容易識別視覺(jué)細節。
長(cháng)期以來(lái),CCD傳感器是捕獲高質(zhì)量、低噪聲圖像的主流技術(shù)。但是CCD傳感器的制造成本很高,因此價(jià)格普遍較高,功耗也要比CMOS傳感器高很多。如今,CMOS傳感器技術(shù)已經(jīng)發(fā)展到可以快速接近CCD技術(shù)的質(zhì)量和功能,并且價(jià)格更低,體積更小,功耗更低。CMOS相機的幀速率通常要高于CCD相機,對于那些依賴(lài)實(shí)時(shí)圖像處理進(jìn)行自動(dòng)化或圖像數據分析的機器視覺(jué)系統而言,此功能至關(guān)重要。另外,CMOS傳感器比CCD傳感器對紅外波長(cháng)更敏感,CMOS芯片和相機制造商利用這一優(yōu)勢可捕獲紅外線(xiàn),為圖像識別提供了額外的成像能力。兩相權衡,CMOS傳感器可能更加適合機器視覺(jué)應用。
安森美(onsemi)AR0130是一款1/3英寸CMOS數字圖像傳感器,有源像素陣列為1280H x 960V,使用滾動(dòng)快門(mén)讀數捕獲圖像。該產(chǎn)品包括復雜的相機功能,如自動(dòng)曝光控制,窗口,以及視頻和單幀模式。AR0130能夠拍攝非常清晰的數字圖像,并且能夠捕獲連續視頻和單幀,尤其適合高性能機器視覺(jué)應用。
#04
光源
作為一種輔助成像設備,光源對成像質(zhì)量往往起到至關(guān)重要的作用。以L(fǎng)ED照明產(chǎn)品為例,它們具有更高的靈活性,具有可調角度和附加波長(cháng),更一致的光譜響應。市場(chǎng)上有多種波長(cháng)和形狀的光源可供選擇,產(chǎn)品的選擇并不難。
#05
圖像采集卡
圖像采集卡通常以電腦插卡的形式存在,它的主要工作是將圖像輸出傳送到計算機主機。圖像采集卡需要將來(lái)自相機的模擬或數字信號轉換為特定格式的圖像數據流,還可以控制相機的一些參數,例如觸發(fā)信號、曝光/積分時(shí)間、快門(mén)速度等。圖像采集卡通常針對不同類(lèi)型的相機具有不同的硬件結構,同時(shí)也具有不同的總線(xiàn)形式,如PCI、PCI64、Compact PCI、PC104、ISA等。
#06
視覺(jué)處理軟件
機器視覺(jué)軟件用于完成輸入圖像數據的處理,然后通過(guò)一定的計算就可以得到需要的結果。通用機器視覺(jué)軟件以C/C++圖像庫、ActiveX控件和基于圖形的編程環(huán)境等形式出現,可以專(zhuān)用,例如僅用于LCD檢測、BGA檢測、模板對齊等,或通用,包括定位、測量、條形碼/字符識別、斑點(diǎn)檢測等。
真相三:
機器視覺(jué)市場(chǎng)發(fā)展迅速,汽車(chē)行業(yè)功不可沒(méi)
機器視覺(jué)在自動(dòng)化方面的價(jià)值在于它能夠快速高效地捕獲和處理大量文檔、圖像和視頻,其數量和速度遠遠超過(guò)人類(lèi)的能力。
廣闊的應用前景和巨大的市場(chǎng)潛力決定了機器視覺(jué)必將是一個(gè)不斷增長(cháng)的市場(chǎng),Markets and Markets的數據表明,機器視覺(jué)的市場(chǎng)規模預計將從2020年的107億美元增長(cháng)到2025年的147億美元,復合年增長(cháng)率為6.5%。
根據grand view research的數據,2021年,全球機器視覺(jué)市場(chǎng)規模為132.3億,預計2022年至2030年將以7.7%的復合年增長(cháng)率(CAGR)增長(cháng)。汽車(chē)、食品和飲料、制藥和化工以及包裝領(lǐng)域對視覺(jué)引導機器人系統的需求是推動(dòng)市場(chǎng)增長(cháng)的主要動(dòng)力。其中,汽車(chē)行業(yè)依然是全球最大的機器視覺(jué)系統采用者,在2021年,來(lái)自汽車(chē)行業(yè)的收入份額超過(guò)了15.0%,預計未來(lái)幾年仍將繼續穩步增長(cháng)。
圖5:按照行業(yè)劃分,2020年--2030年美國機器視覺(jué)市場(chǎng)發(fā)展趨勢
(圖源:grand view research)
真相四:
機器視覺(jué)在機器人應用中將大顯身手
在市場(chǎng)范圍和應用方面,機器視覺(jué)有很多機會(huì )可以擴展。這些機會(huì )需要一些想象力,這意味著(zhù)機器視覺(jué)不僅僅是取代技術(shù)人員的眼睛,而是充分利用機器人完成技術(shù)人員無(wú)法完成的任務(wù)。機器視覺(jué)使得機器人擁有實(shí)時(shí)、高細節地“看到”的能力,它允許機器人根據對象或環(huán)境的綜合視圖做出決策。如今,機器人在世界上的使用越來(lái)越多。當機器人配備機器視覺(jué)時(shí),會(huì )給它們帶來(lái)更高的精確度、方向感和理解力,能夠更準確地抓取物品,以更高的精度放置物品,并更快地執行更復雜的任務(wù)。
機器視覺(jué)在機器人應用中正變得越來(lái)越重要,根據自動(dòng)化促進(jìn)協(xié)會(huì )(A3)最近的一份報告,與2020年相比,機器人和機器視覺(jué)市場(chǎng)在2021年第二季度取得了實(shí)質(zhì)性增長(cháng)。工業(yè)機器人已經(jīng)被廣泛使用,隨著(zhù)協(xié)作機器人的出現和3D機器視覺(jué)的快速發(fā)展,它們將被更多地結合使用。
機器視覺(jué)體現的是一種技術(shù)能力,自動(dòng)化、機器學(xué)習、深度學(xué)習和神經(jīng)網(wǎng)絡(luò )等其他能力也是如此。這是一種可以集成到其他技術(shù)和流程中的能力,用以造福行業(yè)并提高業(yè)務(wù)效率?,F在的機器人已經(jīng)越來(lái)越多地內置機器視覺(jué),機器視覺(jué)使機器人能夠執行更復雜的任務(wù)。如果沒(méi)有機器視覺(jué)告訴機器人物品的確切位置,這些任務(wù)是不可能完成的。機器視覺(jué)是釋放自動(dòng)化全部潛力的關(guān)鍵,為智能自動(dòng)化添加了更多智能。
來(lái)源:Mouser
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀:
基于傳感器內神經(jīng)網(wǎng)絡(luò )的模擬-信息轉換技術(shù),可顯著(zhù)降低傳感器功耗