在各類常見行業(yè)應(yīng)用及智能相機的市場定位中,OCR識別的需求一直是最多最豐富的需求也是大家最關(guān)注的方向,本文以智能相機為產(chǎn)品依托,結(jié)合實際需求介紹各場景下的OCR識別類型及方法
首先關(guān)注一個核心問題:什么場景下的OCR識別需求分別對應(yīng)選擇什么型號智能相機,以及是否需要深度學(xué)習(xí)?
一、字符識別
對于一些產(chǎn)線產(chǎn)品位置固定,OCR 特征清晰明顯,對比度高、背景簡單的字符,可 以通過傳統(tǒng)方式即閾值分割的形式進行讀取的需求,相機字符識別自帶的模型可以應(yīng)對 現(xiàn)場如點陣、刻蝕、壓印出來的字符。自帶的模型內(nèi)部已經(jīng)訓(xùn)練了幾百萬張樣本,基本涵蓋了絕大部分應(yīng)用場景。
二、特征匹配(位置修正)+字符識別
對于一些產(chǎn)品在視野內(nèi)可能位置會變動、產(chǎn)品位置不固定但前景和背景灰度差較大、干擾較少的實際場景,可以開啟位置修正對字符識別進行輔助定位,來保證產(chǎn)品移動、旋轉(zhuǎn)等各種情況下都可以定位到要識別的字符。
注:開啟位置修正后,需保證模板區(qū)域始終在相機視野內(nèi),否則特征匹配不到會持續(xù)NG。
三、DL 字符識別
在一些字符形態(tài)大小不統(tǒng)一,對比度低,背景存在干擾,字符粘連,畸變等場景, 傳統(tǒng)方法效果一般,這個時候可以用到深度學(xué)習(xí),在常見行業(yè)如,食藥品包裝,電子行業(yè),煙草行業(yè)薄膜,半導(dǎo)體晶源等等已經(jīng)實現(xiàn)全行業(yè)覆蓋,不需要進行過多的模型訓(xùn)練,就可以實現(xiàn)字符的高效識別檢測,準確率基本在三個九以上。
四、DL字符定位+DL字符識別
在很多實際的OCR檢測需求中,字符位置不固定,字符大小不統(tǒng)一,甚至一些需求僅檢測視野內(nèi)某個特定區(qū)域內(nèi)的字符,應(yīng)對這類情況,往往需要深度學(xué)習(xí)定位和深度學(xué)習(xí)識別搭配起來使用,提高準確率和穩(wěn)定性達到預(yù)期效果。
食品行業(yè)噴墨會導(dǎo)致字符大小、深淺、形態(tài)和位置都會有變化,傳統(tǒng)方法無法準確定位到字符,引入深度學(xué)習(xí)定位和深度學(xué)習(xí)識別有效解決難題。
面對僅檢測紅框內(nèi)字符(出界即NG)的實際需求,傳統(tǒng)算法模塊無法實現(xiàn)檢測需求,引入深度學(xué)習(xí)定位進行輔助,定位框框選目標區(qū)域,搭配出界過濾使能完美解決應(yīng)用難點。
外包裝行業(yè)需要對箱體噴墨進行OCR識別,字符位數(shù)、長短、大小、位置及拍照距離都存在變化,且應(yīng)對字符分段、噴墨深淺不一、存在劃痕等干擾,深度學(xué)習(xí)都可以穩(wěn)定定位并識別。
OCR識別仍然是智能相機的主要應(yīng)用方向之一,關(guān)于OCR識別的優(yōu)化和更新也是智能相機的重點迭代方向,智能相機會結(jié)合市場需求和建議不斷優(yōu)化算法庫以適應(yīng)并解決愈發(fā)多樣性的檢測場景和任務(wù)。
相關(guān)產(chǎn)品
相關(guān)文章