Free Style】云市場上那么多審計產(chǎn)品,到底該怎么選?">【Free Style】云市場上那么多審計產(chǎn)品,到底該怎么選?
1179
2022-05-29
OCR文檔識別,是專門用于識別復(fù)印、手寫文檔并轉(zhuǎn)化為可編輯的電子文檔的一種技術(shù),也是當代日常辦公學(xué)習(xí)必不可少的“趁手”工具之一。
選擇一款高效的OCR識別工具,可以大大提升文檔電子化錄入效率。目前,國內(nèi)不少人工智能識別技術(shù)研究公司推出OCR應(yīng)用平臺,使更多的人得以享受OCR技術(shù)帶來的便利。
上圖是國內(nèi)應(yīng)用市場上幾款熱門文檔識別工具以及他們的測試結(jié)果,主要測試不同OCR技術(shù)在面對模糊圖片、清晰圖片時候的表現(xiàn)結(jié)果以及所需的平均時長。
在圖片模糊(像素較低)的情況下:
騰訊優(yōu)圖、易道、云脈三方表現(xiàn)良好,識別率均達到了91.58%以上,其中云脈最高,識別率高達94.15%;文通、ABBYY表現(xiàn)令人大跌眼鏡,文通識別率甚至不足50%。
在圖片模糊(像素較高)的情況下:
騰訊優(yōu)圖、易道、云脈三方依然表現(xiàn)良好,易道、云脈識別率均達98%以上,區(qū)別在于云脈OCR深度學(xué)習(xí)平均用時遠低于易道和騰訊優(yōu)圖,平均用時僅需2.11s。
在OCR技術(shù)測試過程中我們發(fā)現(xiàn):
①在符號問題中,騰訊優(yōu)圖、百度云、易道均存在中英文全角半角混淆、符號識別錯誤、 句末符號漏識別等問題。
②ABBYY、文通在光線暗、模糊、小字體等情況下,容易識別成亂碼或識別全錯,拉伸、壓扁字體,出現(xiàn)整行漏識別。
③易道斷筆字情況下,容易識別錯誤,識別時間較長。
文檔識別http://www.yunmai.com/
文字識別 OCR
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實的內(nèi)容,請聯(lián)系我們jiasou666@gmail.com 處理,核實后本網(wǎng)站將在24小時內(nèi)刪除侵權(quán)內(nèi)容。