【獎勵公示】第20期 2022年4月獎勵名單公示:社區明星評選 | 新人獎 | 博客同步 | 推薦獎
819
2025-03-31
1、OCR簡介
光學字符識別(Optical Character Recognition, OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進行識別,并以文本的形式返回。
2、OCR應用場景
1)針對圖片類識別
2)文檔類識別場景
3)拍照表單類場景
4)自然場景(比如車牌識別、攝像監控、自動駕駛等)
3、OCR流程
圖像預處理:去噪、灰度化、圖像增強等
文本檢測:滑動窗口算法遍歷整張圖片
常見的算法包括: Faster R-CNN、FCN、RRPN、TextBoxes、 DMPNet?、 CTPN、 SegLink
字符分類:劃分單個字符,識別單字
文本識別:引入上下文的信息,成為了提升條目準確率的關鍵
4、華為云OCR端到端OCR流程
1)準備一張含有文字的原圖
2)對原圖進行文字位置的監測,檢測結果可能是水平矩形框,也可能是傾斜矩形框
3)從原圖中把文字框對應的圖片切下來,并旋轉正,得到水平的文字塊切片圖
4)對每個文字塊切片圖依次進行字符識別,每個切片圖的識別結果匯總起來,就得到原圖的文字識別結果
總結:輸入原圖->文字檢測->文字塊切片->字符識別->識別結果匯總
OCR
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。