基于機(jī)器學(xué)習(xí)的生物多樣性中文文檔的信息抽取研究
【圖文】:
(z)系統(tǒng)原理學(xué)習(xí)模塊可以從訓(xùn)練實例中快速獲取層級結(jié)構(gòu),該結(jié)構(gòu)將用于之后的標(biāo)注。為了展示這個過程,以圖2.3為例展開陳述。首先,學(xué)習(xí)層級設(shè)有一個根節(jié)點“deseription”。當(dāng)X人4L文本被讀入至根節(jié)點時,根節(jié)點在“Dese找ption”中發(fā)現(xiàn)5個元素(即“plant一habit一and一life一style”、“l(fā)eaves”、“nowers”“加its”、和“SeedS”),從而創(chuàng)建5個子節(jié)點,將每個元素的內(nèi)容分配至相應(yīng)的節(jié)點中,例如新創(chuàng)建的子節(jié)點“nowers”獲取有關(guān)花的描述文本。每個子節(jié)點會繼續(xù)讀取它所獲得的內(nèi)容,如果需要,創(chuàng)建新的子節(jié)點以容納新的元素。例如,子節(jié)點“flowers”為“braet”和“eal林”元素創(chuàng)建它的兩個子節(jié)點(“苞片,,和“花警”)。這個過程將持續(xù)進(jìn)行直至每個分支都到達(dá)終端元素。, 9eui
圖2.3訓(xùn)練集合實例學(xué)習(xí)模塊對XML文本進(jìn)行處理后,一個簡單的層級結(jié)構(gòu)就產(chǎn)生了,,并且這個層級結(jié)構(gòu)完全對應(yīng)于文本描述的XML結(jié)構(gòu)。(圖2.4)當(dāng)讀入一個新的訓(xùn)練實例時,學(xué)習(xí)層級結(jié)構(gòu)對自身進(jìn)行擴(kuò)展以容納之前沒有出現(xiàn)的新元素。假設(shè)第二個習(xí)11練實例的“description”元素含有“stems”元素。當(dāng)“deseription”節(jié)點通過
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:G350
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 柳回春,馬樹元,吳平東,楊峰,曾興生,畢路拯;UK心理測試自動分析系統(tǒng)的手寫體數(shù)字識別[J];北京理工大學(xué)學(xué)報;2002年05期
2 高學(xué),金連文,尹俊勛,黃建成;一種基于支持向量機(jī)的手寫漢字識別方法[J];電子學(xué)報;2002年05期
3 張曙紅,張金隆,陳德軍;面向電子商務(wù)的客戶關(guān)系管理數(shù)據(jù)挖掘模型研究[J];工業(yè)工程與管理;2004年04期
4 凌旭峰,楊杰,葉晨洲;基于支撐向量機(jī)的人臉識別技術(shù)[J];紅外與激光工程;2001年05期
5 劉學(xué)軍,陳松燦,彭宏京;基于支持向量機(jī)的計算機(jī)鍵盤用戶身份驗真[J];計算機(jī)研究與發(fā)展;2002年09期
6 張曉東;;支持向量機(jī)在肺癌生存期預(yù)測中的應(yīng)用分析[J];計算機(jī)工程與應(yīng)用;2007年18期
7 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說話人確認(rèn)[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2002年11期
8 王宏漫,歐宗瑛;采用PCA/ICA特征和SVM分類的人臉識別[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2003年04期
9 馬勇,丁曉青;基于層次型支持向量機(jī)的人臉檢測[J];清華大學(xué)學(xué)報(自然科學(xué)版);2003年01期
10 葉航軍,白雪生,徐光yP;基于支持向量機(jī)的人臉姿態(tài)判定[J];清華大學(xué)學(xué)報(自然科學(xué)版);2003年01期
相關(guān)碩士學(xué)位論文 前1條
1 黃浩煒;SVM與基于轉(zhuǎn)換的錯誤驅(qū)動學(xué)習(xí)方法相結(jié)合的生物實體識別[D];國防科學(xué)技術(shù)大學(xué);2008年
本文編號:2688264
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2688264.html