天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Tesseract的醫(yī)學化驗單內(nèi)容識別技術

發(fā)布時間:2023-04-26 21:02
  目的由于化驗單內(nèi)容可以真實地記錄患者健康狀態(tài),因此將紙質(zhì)的化驗單轉(zhuǎn)為醫(yī)療電子檔案進行存儲在進行保險理賠、轉(zhuǎn)院、遠程會診、建立健康檔案時都具有重要作用。但目前在臨床上尚缺乏能識別化驗單內(nèi)容,把化驗單直接轉(zhuǎn)成醫(yī)療電子檔案的工具,為此本文設計了一套完整的自動化醫(yī)學化驗單內(nèi)容的光學字符識別(optical character recognition,OCR)方法。方法首先對化驗單圖像進行預處理,利用大津法對化驗單圖像進行二值化、用霍夫變換對圖像進行抗扭斜和特征提取,然后使用Tesseract的集束搜索算法和K鄰近算法對化驗單內(nèi)容進行識別,對字庫進行訓練,利用醫(yī)學詞典文件與模糊字文件來對識別內(nèi)容進行糾錯,并以此建立醫(yī)學化驗單OCR引擎。最后利用從上海某社區(qū)醫(yī)院收集的302條化驗單數(shù)據(jù)對OCR引擎的準確率進行了評估。結(jié)果經(jīng)評估驗證,本文方法的識別準確率為92. 72%,可基本滿足臨床需求。結(jié)論基于Tesseract建立的醫(yī)學化驗單OCR引擎可以免去手動輸入化驗單數(shù)據(jù)的麻煩,醫(yī)生僅需拍照上傳化驗單照片,即可將化驗單中的內(nèi)容轉(zhuǎn)成結(jié)構(gòu)化醫(yī)療電子檔案,極大提高了醫(yī)生的工作效率,有助于數(shù)據(jù)的進一步利用。

【文章頁數(shù)】:7 頁

【文章目錄】:
0 引言
1 方法
    1.1 化驗單圖像預處理
        1.1.1 化驗單圖像二值化
        1.1.2 化驗單圖像抗扭斜
        1.1.3 化驗單圖像特征提取
    1.2 醫(yī)學化驗單OCR技術
        1.2.1 頁面版式分析
        1.2.2 字庫訓練步驟
    1.3 醫(yī)學化驗單OCR引擎開發(fā)
2 識別準確率的驗證結(jié)果及分析
3 討論與結(jié)論



本文編號:3802180

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3802180.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶7d94a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com