【學習筆記】AI全棧成長計劃-AI應用篇-第一章：企業應用最廣泛的AI案例開發 OCR文字識別

網友投稿 819 2025-03-31

1、OCR簡介

光學字符識別（Optical Character Recognition, OCR）是指對文本資料的圖像文件進行分析識別處理，獲取文字及版面信息的過程。亦即將圖像中的文字進行識別，并以文本的形式返回。

2、OCR應用場景

1）針對圖片類識別

2）文檔類識別場景

3）拍照表單類場景

4）自然場景（比如車牌識別、攝像監控、自動駕駛等）

3、OCR流程

圖像預處理：去噪、灰度化、圖像增強等

文本檢測：滑動窗口算法遍歷整張圖片

【學習筆記】AI全棧成長計劃-AI應用篇-第一章：企業應用最廣泛的AI案例開發 OCR文字識別

常見的算法包括： Faster R-CNN、FCN、RRPN、TextBoxes、 DMPNet?、 CTPN、 SegLink

字符分類：劃分單個字符，識別單字

文本識別：引入上下文的信息，成為了提升條目準確率的關鍵

4、華為云OCR端到端OCR流程

1）準備一張含有文字的原圖

2）對原圖進行文字位置的監測，檢測結果可能是水平矩形框，也可能是傾斜矩形框

3）從原圖中把文字框對應的圖片切下來，并旋轉正，得到水平的文字塊切片圖

4）對每個文字塊切片圖依次進行字符識別，每個切片圖的識別結果匯總起來，就得到原圖的文字識別結果

總結：輸入原圖->文字檢測->文字塊切片->字符識別->識別結果匯總

OCR

標簽：上下文華為云可能

【獎勵公示】第20期 2022年4月獎勵名單公示：社區明星評選 | 新人獎 | 博客同步 | 推薦獎

819 2025-03-31

【精選單品】智慧食堂，我們應更重視“吃飯這件小事”

819 2025-03-31

華為云超高IO云硬盤六折特惠，總有Size適合你！">華為云超高IO云硬盤六折特惠，總有Size適合你！

819 2025-03-31

【學習筆記】AI全棧成長計劃-AI應用篇-第一章：企業應用最廣泛的AI案例開發 OCR文字識別

【獎勵公示】第20期 2022年4月獎勵名單公示：社區明星評選 | 新人獎 | 博客同步 | 推薦獎

【精選單品】智慧食堂，我們應更重視“吃飯這件小事”

華為云超高IO云硬盤六折特惠，總有Size適合你！">華為云超高IO云硬盤六折特惠，總有Size適合你！

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統：重新定義家庭生活方式

友情鏈接