健康險理算耗時長?OCR來助攻!

      網友投稿 761 2022-05-30

      近年來,我國健康險市場規模持續保持高增長。據行業數據統計,自2013年到2018年,健康險市場復合年均增長率達35.95%。而銀保監會最新披露的數據顯示,2019年Q1健康險原保費收入同比增速高達39.1%;據行業研究機構分析預測,我國健康保險保費收入將在2020年首次突破萬億元。

      與市場規模呈正相關,健康險理賠案件數也在逐年走高。據了解,自2015年起,健康險理賠案件數量和賠付金額正以年均20%的速度增長。因此,如何提升理賠服務效率也是健康險機構重點考慮的問題。

      深源恒際從健康險核賠理算業務場景入手,研發了醫療票據OCR產品,基于深度學習算法下的專項模型訓練,自動識別、提取醫療票據上的核心理算信息,并將結構化的信息錄入理算系統,以機器替代人力作業,大幅縮短了理算用時,進而提升健康險理賠服務效率。

      據深源恒際產品部介紹,醫療票據OCR產品預計年內在八省市完成落地。目前,已率先在北京、天津、上海、浙江四地展開試點合作;廣東、山東、江蘇、河南四省也已列入落地規劃,預計年內上線。

      切中要害,直擊痛點

      健康險理算耗時長?OCR來助攻!

      出于行業監管因素,目前商業醫保機構無法直接獲取或即時共享到投保用戶的醫療信息。在健康險理賠環節中,理算人員需要從用戶提交的醫療票據圖像上獲取原始的理算數據,并將相關信息逐項錄入系統,通常單個案件涉及錄入的信息多達百余項。

      而且,人工錄入并不是最經濟的解決方案:一是人工作業難免出現紕漏,影響理算準確性,容易造成理賠滲漏;二是大量人力從事高度重復的事務性工作,耗時費力、效率低下。

      相比傳統方式,OCR技術在信息識別錄入上的應用可減少80%的人力作業。

      面向健康險核賠理算業務場景,深源恒際打造了集識別、提取、結構化于一體的醫療票據信息識別錄入自動化解決方案?;贠CR識別技術,結合專項訓練+自適應提取方法,自動從醫療票據圖片中識別、提取出理算所需的字段信息,并同步完成錄入,以自動化方式幫助健康險機構快速、準確地完成理算信息的識別錄入,讓理賠效率整體提升60%-80%。目前,支持識別錄入的票據類型包括門診發票、住院發票、醫保結算單、費用清單,字符識別準確率超過98%。

      醫療票據OCR的應用,幫助健康險機構實現人力資源的優化,基于流程自動化而釋放的勞動力可以從事對腦力依賴更強的工作;同時,讓健康險理賠服務效率呈指數級提升,基于OCR處理單個案件用時僅幾分鐘,大幅縮短了理賠周期,用戶體驗明顯提升。

      對癥下藥,攻破難點

      事實上,醫療票據OCR在實際落地應用中面臨諸多技術難點,如票面信息模糊、發票折疊畸變、內容重疊、信息串行等,都會影響識別準確率,給算法模型帶來極大挑戰。為降低或消弭噪音,深源恒際結合多種圖像處理技術,在不損害文字信息的前提下排除干擾因素,讓識別模型具備很好的抗干擾能力和魯棒性。

      首先,醫療票據在全國范圍內沒有相對統一的制版格式,各地版式迥異。面對此類情形,通用OCR算法無法突破模版多樣化的問題。

      深源恒際針對各地模版進行獨立強化訓練,在模型訓練中增強特征提取細粒度,根據不同模版上的啟發性信息輔助文字區域的定位和切分,弱化版式差異帶來的不良影響。目前,首批完成針對性強化訓練的模型包括北京、天津、上海、浙江四省及部隊醫療系統模版;隨后,廣東、山東、江蘇、河南四省模版也將陸續在年內發布。

      其次,醫療票據多采用數據與格式分離的套打方式,在OCR識別中通常會帶來兩方面困擾:一是套打發票大多采用針式打印技術,圖像分辨率低、打印字跡模糊,影響識別準確率;二是難免出現機打信息和印刷信息串行或內容重疊的情形——串行加大了信息提取難度,影響數據結構化;內容重疊造成部分信息被遮擋,在文本檢測時容易導致漏檢,在文本識別時容易導致誤識。

      深源恒際基于深度學習算法,通過圖層分離技術解決了突破性地解決了套打票據識別中存在的技術難題,使識別準確率大幅提升。

      圖層分離:通過大量分析樣本數據,提取機打部分與印刷部分的差異化特征,強化特征提取細粒度,基于深度學習方法搭建像素級圖層分離模型,實現從原始圖像中分離出機打信息與印刷信息,通過圖層分離完成信息剝離。

      坐標定位:圖層分離后,基于圖像識別技術獲取所有文本條目的坐標信息,通過傳統匹配算法完成印刷類文本條目坐標信息與機打類文本條目坐標信息的關聯,實現印刷字段信息與機打字段信息的匹配,從而解決信息串行帶來的干擾。

      雙識別模型:針對機打和印刷兩類文本信息分別訓練算法模型,大幅提升圖層分離精確度,降低信息重疊帶來的干擾。

      再次,為確保理算信息完整無誤,深源恒際提出“機器校驗為主、人工復核為輔”的校驗機制,開發了多重校驗規則引擎。基于字段間的內在邏輯與關聯關系,自動甄別置信度較低的字段信息,對存疑的高風險信息進行預警提示,并依據內在邏輯對可能出錯的數據進行啟發式糾正;對于模糊文字,則通過醫療詞典庫進行智能校驗。綜合多種方式輔助復核,快速完成數據的校驗與糾正,為理算提供完整、精確的數據依據。

      據了解,目前大多健康險機構均已啟用智能理算規則引擎,即依托全國社保目錄、疾病目錄、藥品目錄等數據庫關聯規則自動計算理算結果。而醫療票據OCR的應用主要在于自動提取出理算所需的數據信息,為理算打好前站。如此一來,醫療票據OCR與智能理算規則引擎的無縫銜接,讓健康險理算作業從信息錄入到結果輸出實現了全面自動化。

      云市場 人工智能 OCR識別 醫療

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:細數電商Web安全七宗罪!
      下一篇:汽車網關(gateway)系統的作用原理及部分車型網關位置
      相關文章
      亚洲youwu永久无码精品| 亚洲婷婷天堂在线综合| 精品无码一区二区三区亚洲桃色| 亚洲国产精品成人AV无码久久综合影院| 亚洲国产精品午夜电影| 久久亚洲国产精品成人AV秋霞| 亚洲av女电影网| 久久91亚洲精品中文字幕| 伊人亚洲综合青草青草久热| 亚洲无码日韩精品第一页| 亚洲精品97久久中文字幕无码| 国产精品无码亚洲精品2021| 亚洲av无码兔费综合| 亚洲av日韩aⅴ无码色老头| 亚洲精品av无码喷奶水糖心| 亚洲综合国产成人丁香五月激情 | 亚洲熟女乱色一区二区三区| 亚洲综合偷自成人网第页色| 亚洲人成电影网站久久| 中文字幕无码精品亚洲资源网久久| 亚洲中字慕日产2020| 国产精品亚洲片在线va| 亚洲av片不卡无码久久| 亚洲综合无码无在线观看| 亚洲男同gay片| 在线观看亚洲精品专区| 亚洲精品无码久久毛片| 国产成人亚洲精品狼色在线| 亚洲大尺度无码专区尤物| 亚洲欧洲日韩不卡| 亚洲另类小说图片| 亚洲欧美日本韩国| 亚洲av午夜精品一区二区三区 | 亚洲综合在线成人一区| 亚洲成a人片在线观看精品| 亚洲日韩精品A∨片无码加勒比| 亚洲熟妇自偷自拍另欧美| 亚洲av日韩综合一区久热| 国产精品亚洲lv粉色| 亚洲国产香蕉人人爽成AV片久久 | 国产精品亚洲综合久久|