基于條件隨機場的醫(yī)學(xué)文本與圖像標(biāo)注模型構(gòu)建及應(yīng)用研究
本文關(guān)鍵詞:基于條件隨機場的醫(yī)學(xué)文本與圖像標(biāo)注模型構(gòu)建及應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】:計算機輔助醫(yī)學(xué)信息處理屬于計算機科學(xué)和醫(yī)學(xué)的交叉研究,如何對文本與圖像進行高精度標(biāo)注是制約醫(yī)學(xué)信息處理發(fā)展的技術(shù)難題,有效獲取文本與圖像的空間上下文聯(lián)系能夠有效解決該難題。條件隨機場模型(Conditional Random Fields,CRFs)是適用于分類及標(biāo)注結(jié)構(gòu)化數(shù)據(jù)的概率圖模型,其主要優(yōu)勢是可以描述大尺度空間上下文信息和直接后驗概率建模,有效提高文本與圖像的標(biāo)注精度。 基于CRFs理論的優(yōu)勢,本文針對當(dāng)前中文文本病歷識別與醫(yī)學(xué)圖像標(biāo)注中存在的問題,進行基于空間上下文特征的CRFs模型的研究。研究的主要內(nèi)容及創(chuàng)新點如下: 1、針對中文文本病歷的特點,提出了構(gòu)建層疊CRFs模型對文本病歷中的命名實體進行識別。首先在低層CRFs模型中對兩類簡單命名實體進行識別,即身體基本部位名稱與基本疾病名稱;然后將得到的標(biāo)注結(jié)果傳送到第二層CRFs模型,并加入一個根據(jù)文本病歷特點設(shè)計的特征序列,這個自定義特征序列由詞性特征和實體特征交互融合而成,在論文中我們稱之為自定義組合特征。實體特征是指第一層CRFs模型的標(biāo)注結(jié)果。第二層CRFs模型的輸入數(shù)據(jù)不僅包含有觀測序列,還包含第一層模型識別后的標(biāo)注結(jié)果,這為進一步識別最終實體類別——復(fù)雜疾病名稱及臨床癥狀提供更可靠的依據(jù)。通過對在醫(yī)生指導(dǎo)下構(gòu)建的中文文本病歷語料庫進行多組封閉與開放測試表明,基于自定義組合特征的層疊CRFs模型比未加入自定義組合特征的層疊CRFs模型,F(xiàn)值提高3%,比單層CRFs模型,F(xiàn)值提高7%,其他各項評測指標(biāo)及總體性能均有顯著提高。即便是對那些訓(xùn)練語料中未曾出現(xiàn)的實體名稱,也能夠進行準(zhǔn)確地識別。此外,它還有效地解決了具有嵌套構(gòu)詞特點的中文文本病歷命名實體在標(biāo)注識別中產(chǎn)生歧義性的問題。 2、針對骨肉瘤MRI圖像的各組織之間結(jié)構(gòu)復(fù)雜,提出基于CRFs模型的骨肉瘤MRI圖像中多類目標(biāo)分類標(biāo)注方法。由于骨肉瘤MRI圖像中每一個像素屬于某個類別的概率不僅與其自身特征有關(guān),還與其周圍像素的信息分布緊密相關(guān)。因此在對骨肉瘤MRI各類目標(biāo)(肌肉、骨組織、脂肪、腫瘤等)紋理特征建模的同時,也對能夠表達各類間相互約束關(guān)系的特征進行建模。模型充分考慮各類目標(biāo)的空間關(guān)系,提升特征的區(qū)分度。通過在相關(guān)圖像紋理上定義紋理空間濾波器,得到更加具有區(qū)分度的紋理、形狀、相對位置、上下文信息等重要特征,本文將其稱之為上下文環(huán)境特征。然后采用基于這些特征的JointBoost分類器來構(gòu)建CRFs模型的一元勢函數(shù),對標(biāo)注樣本進行訓(xùn)練。經(jīng)過實驗表明,該算法實現(xiàn)了骨肉瘤MRI圖像中同時對多類目標(biāo)進行分類標(biāo)注的目標(biāo),特別是在結(jié)構(gòu)不規(guī)則且多變化的腫瘤識別方面,基于上下文環(huán)境特征的CRFs模型相對完善,準(zhǔn)確率相比現(xiàn)有的骨肉瘤MRI圖像識別算法有提高,可作為臨床借鑒。 3、針對基于CRFs模型的骨肉瘤MRI圖像時間復(fù)雜度高的問題,提出基于區(qū)域CRFs模型的骨肉瘤MRI圖像標(biāo)注方法。該方法首先利用一種基于圖結(jié)構(gòu)的過分割算法將骨肉瘤MRI圖像分割成若干小的均勻區(qū)域,然后將區(qū)域作為圖的節(jié)點、用邊連接相鄰節(jié)點構(gòu)建圖模型。相對以像素為節(jié)點建模,該方法減少了圖模型中的節(jié)點數(shù)目,減小了圖的規(guī)模。實驗結(jié)果表明,相比以像素為節(jié)點的方法,,基于區(qū)域的CRFs模型縮短了運行時間,并實現(xiàn)對骨肉瘤MRI圖像中多類目標(biāo)同時分類標(biāo)注的目的。 本文采用的醫(yī)學(xué)文本和醫(yī)學(xué)圖像數(shù)據(jù)來源于XX省腫瘤醫(yī)院及XX大學(xué)第X醫(yī)院,每組數(shù)據(jù)均經(jīng)過臨床醫(yī)生及放射科醫(yī)生的審核確認(rèn)。
【關(guān)鍵詞】:條件隨機場 醫(yī)學(xué)文本命名實體識別 醫(yī)學(xué)圖像分類標(biāo)注 計算機輔助診療
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 摘要4-6
- Abstract6-11
- 第1章 緒論11-35
- 1.1 研究目的與研究意義11
- 1.2 研究現(xiàn)狀與存在問題11-32
- 1.2.1 序列標(biāo)注方法及醫(yī)學(xué)數(shù)據(jù)信息特點11-17
- 1.2.2 醫(yī)學(xué)文本序列標(biāo)注問題研究現(xiàn)狀17-25
- 1.2.3 醫(yī)學(xué)圖像標(biāo)注問題及研究現(xiàn)狀25-31
- 1.2.4 存在的主要問題31-32
- 1.3 論文的主要研究內(nèi)容32-33
- 1.4 論文章節(jié)安排33-35
- 第2章 基于層疊 CRFs 模型的文本病歷命名實體識別研究35-63
- 2.1 引言35
- 2.2 文本病歷及其特點35-38
- 2.3 CRFs 模型38-42
- 2.3.1 CRFs 模型的定義38-39
- 2.3.2 勢函數(shù)的定義39-40
- 2.3.3 參數(shù)估計與模型求解40-42
- 2.4 層疊 CRFs 模型構(gòu)建及整體框架設(shè)計42-47
- 2.4.1 層疊 CRFs 模型構(gòu)建42-43
- 2.4.2 模型整體框架設(shè)計43-47
- 2.5 中文病歷命名實體識別47-53
- 2.5.1 特征集的選取47-48
- 2.5.2 語料標(biāo)注48-50
- 2.5.3 工具包的選取50-51
- 2.5.4 特征模板的構(gòu)造51-53
- 2.6 實驗結(jié)果與分析53-61
- 2.7 本章小結(jié)61-63
- 第3章 基于CRFs 的骨肉瘤MRI 圖像多類目標(biāo)標(biāo)注研究63-85
- 3.1 引言63-66
- 3.2 基于 CRFs 模型的骨肉瘤 MRI 圖像標(biāo)注模型構(gòu)建66-69
- 3.2.1 模型整體框架設(shè)計66-67
- 3.2.2 CRFs 模型及勢函數(shù)的定義67-69
- 3.3 由 上下文環(huán)境特征‖構(gòu)建的一元勢函數(shù)69-73
- 3.3.1 紋理特征的獲取70-71
- 3.3.2 上下文環(huán)境特征‖的獲取71-73
- 3.4 CRFs 模型參數(shù)學(xué)習(xí)與求解73-75
- 3.4.1 CRFs 模型參數(shù)學(xué)習(xí)73-74
- 3.4.2 CRFs 模型求解74-75
- 3.5 實驗結(jié)果與分析75-83
- 3.6 本章小結(jié)83-85
- 第4章 基于區(qū)域 CRFs 的骨肉瘤MRI 圖像標(biāo)注研究85-95
- 4.1 引言85-86
- 4.2 基于區(qū)域 CRFs 的骨肉瘤 MRI 圖像標(biāo)注模型86-93
- 4.2.1 過分割算法86-89
- 4.2.2 模型構(gòu)建89-90
- 4.2.3 勢函數(shù)的定義90-91
- 4.2.4 模型參數(shù)估計與推導(dǎo)91-92
- 4.2.5 算法流程92-93
- 4.3 實驗結(jié)果與分析93-94
- 4.4 本章小結(jié)94-95
- 第5章 全文總結(jié)95-97
- 5.1 論文主要研究內(nèi)容及創(chuàng)新性的工作95-96
- 5.2 下一步工作96-97
- 參考文獻97-109
- 作者簡介及在學(xué)期間所取得的科研成果109-111
- 致謝111-112
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳少卿,吳朝霞,程敬之,王臻,李松建,黃魯豫;骨腫瘤X光圖像定量分析系統(tǒng)的研究[J];北京生物醫(yī)學(xué)工程;1998年04期
2 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機場模型的中文機構(gòu)名自動識別[J];電子學(xué)報;2006年05期
3 沈曄;李敏丹;夏順仁;;基于內(nèi)容的醫(yī)學(xué)圖像檢索技術(shù)[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2010年04期
4 鄭強;劉齊軍;王正華;朱云平;;生物醫(yī)學(xué)命名實體識別的研究與進展[J];計算機應(yīng)用研究;2010年03期
5 林瑤;田捷;;醫(yī)學(xué)圖像分割方法綜述[J];模式識別與人工智能;2002年02期
6 燕楊;文敦偉;王云吉;王珂;;基于層疊條件隨機場的中文病歷命名實體識別[J];吉林大學(xué)學(xué)報(工學(xué)版);2014年06期
7 張浩;崔雷;;生物醫(yī)學(xué)文本知識發(fā)現(xiàn)的研究進展[J];醫(yī)學(xué)信息學(xué)雜志;2008年09期
8 李超峰;劉燕;胡珊;何榮;;基于支持向量機的骨肉瘤X線圖像中病變區(qū)域的自動識別研究[J];醫(yī)學(xué)信息學(xué)雜志;2010年09期
9 邵虹,崔文成,張繼武,趙宏;低級特征和語義特征相結(jié)合的醫(yī)學(xué)圖像檢索方法[J];中國圖象圖形學(xué)報;2004年02期
10 吳士林;耿佳佳;朱楓;于泳;;基于區(qū)域的多類目標(biāo)識別與分割算法研究[J];中國圖象圖形學(xué)報;2011年09期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 湯步洲;序列標(biāo)注問題的監(jiān)督學(xué)習(xí)方法及應(yīng)用[D];哈爾濱工業(yè)大學(xué);2011年
2 劉軍偉;基于水平集的圖像分割方法研究及其在醫(yī)學(xué)圖像中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2009年
3 李博;基于LDA和LSA的醫(yī)學(xué)文本和影像分析模型及應(yīng)用研究[D];吉林大學(xué);2012年
4 毛凌;基于概率圖模型的場景理解方法研究[D];電子科技大學(xué);2013年
5 徐麗;面向圖像標(biāo)記的條件隨機場模型研究[D];長安大學(xué);2013年
本文關(guān)鍵詞:基于條件隨機場的醫(yī)學(xué)文本與圖像標(biāo)注模型構(gòu)建及應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
本文編號:302222
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/302222.html