基于中文百科的知識(shí)圖譜分類體系構(gòu)建研究
本文關(guān)鍵詞:基于中文百科的知識(shí)圖譜分類體系構(gòu)建研究
更多相關(guān)文章: 分類體系 知識(shí)圖譜 整數(shù)規(guī)劃
【摘要】:分類體系作為知識(shí)圖譜的骨干組成部分,對(duì)整個(gè)知識(shí)圖譜的易用性和連通性具有起到?jīng)Q定性的作用。隨著知識(shí)圖譜應(yīng)用的日益廣泛,國(guó)內(nèi)外都不斷涌現(xiàn)出優(yōu)秀的知識(shí)圖譜項(xiàng)目。如何為知識(shí)圖譜構(gòu)建分類體系,是亟需解決的問題,這是一個(gè)非常有意義和挑戰(zhàn)的問題。在文中,我們提出了一套完善的為中文百科知識(shí)圖譜構(gòu)建分類體系的方法。我們以百科詞條為實(shí)體,從百科頁(yè)面中抽取了詞條的相關(guān)信息,并把詞條的信息結(jié)構(gòu)化為特征。我們從百科自有分類樹和詞條的分類標(biāo)簽中抽取出了類目詞條,并根據(jù)實(shí)體詞條和類目詞條之間的關(guān)聯(lián)為類目生成了結(jié)構(gòu)化特征。為了獲得分類體系中的subclass-of關(guān)系,我們采用了支持向量機(jī)模型(SVM)。首先構(gòu)造出兩個(gè)類目之間的相關(guān)性特征作為輸入,用人工標(biāo)注的數(shù)據(jù)訓(xùn)練好的模型之后,再用模型判斷兩個(gè)類目之間是否存在subclass-of關(guān)系。對(duì)與instance-of關(guān)系的判斷,我們?cè)诩尤雜ubclass-of關(guān)系制約的基礎(chǔ)上還提出了兩種整數(shù)規(guī)劃的方法。整數(shù)規(guī)劃的方法除了考慮直接的instance-of關(guān)系特征外,還考慮到了類目之間的關(guān)聯(lián)結(jié)構(gòu)。我們通過實(shí)驗(yàn)證明了我們的方法在解決實(shí)際問題上獲得了令人滿意的結(jié)果。最后我們還嘗試了把整個(gè)分類體系構(gòu)建算法放到迭代模型當(dāng)中。在整個(gè)迭代的過程中,我們利用了subclass-of關(guān)系和instance-of關(guān)系的傳遞性,使得它們之間能夠相互制約同時(shí)相互提升。通過實(shí)驗(yàn)數(shù)據(jù),我們看到整個(gè)迭代模型達(dá)到了預(yù)期的效果,可以在此基礎(chǔ)上進(jìn)行后續(xù)的研究。
【關(guān)鍵詞】:分類體系 知識(shí)圖譜 整數(shù)規(guī)劃
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-11
- 第1章 緒論11-15
- 1.1 課題背景11-12
- 1.2 本文的研究工作12-13
- 1.3 本文的組織結(jié)構(gòu)13-14
- 1.4 本章小結(jié)14-15
- 第2章 國(guó)內(nèi)外研究現(xiàn)狀15-22
- 2.1 概述15-16
- 2.2 實(shí)體和類目的區(qū)別16-17
- 2.3 基于規(guī)則的is-a關(guān)系挖掘17-18
- 2.4 基于機(jī)器學(xué)習(xí)的is-a關(guān)系挖掘18-19
- 2.5 國(guó)內(nèi)外知識(shí)圖譜的分類體系構(gòu)建研究19-21
- 2.5.1 DBpedia19-20
- 2.5.2 YAGO20
- 2.5.3 Zhishi.me20
- 2.5.4 XLore20-21
- 2.5.5 知識(shí)魔方21
- 2.6 本章小結(jié)21-22
- 第3章 分類體系的上層構(gòu)建22-33
- 3.1 實(shí)體的抽取和結(jié)構(gòu)化22-23
- 3.2 類目的抽取和結(jié)構(gòu)化23-24
- 3.3 Subclass-of關(guān)系判斷24-29
- 3.3.1 Subclass-of關(guān)系備選集生成24-25
- 3.3.2 支持向量機(jī)分類器25-27
- 3.3.3 實(shí)驗(yàn)評(píng)估27-29
- 3.4 類目的篩選與融合29-31
- 3.5 本章小結(jié)31-33
- 第4章 分類體系的下層構(gòu)建33-49
- 4.1 Instance-of關(guān)系備選集生成33-34
- 4.2 支持向量機(jī)分類器34-36
- 4.3 混合整數(shù)規(guī)劃方法36-39
- 4.4 非線性整數(shù)規(guī)劃方法39-41
- 4.5 實(shí)驗(yàn)評(píng)估41-45
- 4.5.1 數(shù)據(jù)集41-42
- 4.5.2 評(píng)估方法42-43
- 4.5.3 結(jié)果分析43-45
- 4.6 參數(shù)優(yōu)化45-48
- 4.7 本章小結(jié)48-49
- 第5章 基于迭代模型的一體算法49-58
- 5.1 迭代模型50-51
- 5.2 Subclass-of關(guān)系判斷51
- 5.3 類目特征更新51-52
- 5.4 實(shí)驗(yàn)評(píng)估52-57
- 5.4.1 數(shù)據(jù)集52-53
- 5.4.2 結(jié)果分析53-57
- 5.5 本章小結(jié)57-58
- 第6章 系統(tǒng)展示與總結(jié)展望58-68
- 6.1 CKB系統(tǒng)展示58-65
- 6.2 工作總結(jié)65-66
- 6.3 未來展望66-68
- 參考文獻(xiàn)68-71
- 攻讀碩士學(xué)位期間主要的研究成果71-72
- 致謝72
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 宋蓓玲;淺析構(gòu)建網(wǎng)絡(luò)信息分類體系[J];情報(bào)雜志;2004年08期
2 羅德一;;農(nóng)業(yè)網(wǎng)絡(luò)信息分類體系初探[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2010年08期
3 華勛基;;十九世紀(jì)以來科學(xué)分類體系的演變及其趨勢(shì)[J];圖書館學(xué)研究;1983年05期
4 夏南強(qiáng);類書分類體系的發(fā)展演變[J];華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2001年02期
5 劉延章;差異與改進(jìn):兩種分類體系[J];圖書館論壇;2002年05期
6 史學(xué)斌;網(wǎng)絡(luò)信息分類體系[J];圖書館;2002年02期
7 劉延章,謝琳惠;中文搜索引擎分類體系的特點(diǎn)、問題及其改進(jìn)[J];鄭州大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2002年06期
8 史學(xué)斌;網(wǎng)絡(luò)信息分類體系[J];山東圖書館季刊;2002年01期
9 楊健,吳英梅;四庫(kù)分類體系中的小說歸屬芻議——從二十世紀(jì)編纂的幾種古籍書目談起[J];圖書館工作與研究;2003年04期
10 鄭慶勝,易曉陽(yáng);從新浪等網(wǎng)站看網(wǎng)絡(luò)信息分類體系的建立——兼論綜合性中文網(wǎng)站分類體系之建立[J];圖書館建設(shè);2003年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李琳;華薇娜;;美國(guó)工程信息村中的工程分類體系探析[A];中國(guó)索引學(xué)會(huì)第三次全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)論壇論文集[C];2008年
2 房艷紅;;從“15+2”模式到課程應(yīng)用性分類體系基礎(chǔ)上的多模式實(shí)踐教學(xué)[A];北京高教學(xué)會(huì)實(shí)驗(yàn)室工作研究會(huì)2010年學(xué)術(shù)研討會(huì)論文集(上冊(cè))[C];2010年
3 呂品;張萍;林森;顧?quán)l(xiāng);;關(guān)于改革我國(guó)排球教材技戰(zhàn)術(shù)分類體系的研究[A];第七屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(一)[C];2004年
4 王余沛;劉梅姜;;新一輪土地利用總體規(guī)劃修編土地分類體系的銜接[A];2008年中國(guó)土地學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2008年
5 王余沛;劉梅姜;;新一輪土地利用總體規(guī)劃修編土地分類體系的銜接[A];科學(xué)合理用地 人地和諧相處2008年學(xué)術(shù)年會(huì)論文集[C];2008年
6 孫劍飛;;國(guó)際洛迦諾分類體系在我國(guó)的研究與實(shí)踐[A];發(fā)展知識(shí)產(chǎn)權(quán)服務(wù)業(yè),支撐創(chuàng)新型國(guó)家建設(shè)-2012年中華全國(guó)專利代理人協(xié)會(huì)年會(huì)第三屆知識(shí)產(chǎn)權(quán)論壇論文選編(第二部分)[C];2011年
7 姜永志;;西方心理學(xué)理論分類體系的反思與建構(gòu)[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
8 廖遠(yuǎn)濤;肖榮波;艾勇軍;;城鄉(xiāng)一體的綠地分類體系研究[A];城市規(guī)劃和科學(xué)發(fā)展——2009中國(guó)城市規(guī)劃年會(huì)論文集[C];2009年
9 范敏;許志慶;朱寧;;CPC分類體系的特點(diǎn)和檢索字段分析[A];2014年中華全國(guó)專利代理人協(xié)會(huì)年會(huì)第五屆知識(shí)產(chǎn)權(quán)論壇論文(第二部分)[C];2014年
10 王善平;;建設(shè)科學(xué)的科技期刊論文主題-分類體系[A];學(xué)報(bào)編輯論叢(第十三集)[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前7條
1 本報(bào)記者 彭嘉陵;北美行業(yè)分類體系[N];中國(guó)信息報(bào);2013年
2 忠民;透視新土地分類體系[N];中國(guó)國(guó)土資源報(bào);2001年
3 國(guó)家知識(shí)產(chǎn)權(quán)局專利局機(jī)械發(fā)明審查部 劉建;美國(guó)為何選用專利分類新體系?[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2013年
4 任曉玲;歐洲專利局即將推出清潔能源專利新分類體系[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2010年
5 本報(bào)記者 魏瑋;順應(yīng)行業(yè)發(fā)展 細(xì)化基金分類體系[N];中國(guó)證券報(bào);2009年
6 中國(guó)建筑標(biāo)準(zhǔn)設(shè)計(jì)研究院 李昭君;中國(guó)國(guó)家BIM標(biāo)準(zhǔn)探究——分類與編碼勢(shì)在必行[N];中國(guó)建設(shè)報(bào);2013年
7 陳連喜;“六大管理體系”激活用人機(jī)制[N];中國(guó)人口報(bào);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 樓仁杰;基于中文百科的知識(shí)圖譜分類體系構(gòu)建研究[D];浙江大學(xué);2016年
2 羅德一;農(nóng)業(yè)分類搜索引擎分類體系研究[D];南京農(nóng)業(yè)大學(xué);2007年
3 劉梅;村鎮(zhèn)教育資源分類體系的研究與應(yīng)用[D];華中師范大學(xué);2011年
4 侯永春;建設(shè)項(xiàng)目集成化信息分類體系研究[D];東南大學(xué);2003年
5 黃弋蕓;災(zāi)害應(yīng)急管理信息資源分類體系研究[D];南昌大學(xué);2013年
6 吳禮志;《中國(guó)網(wǎng)絡(luò)信息分類法》編制研究[D];武漢大學(xué);2004年
7 呂峰;《城鄉(xiāng)規(guī)劃法》背景下的城鄉(xiāng)用地分類研究[D];華中科技大學(xué);2011年
8 陳瑞;基于多源POI數(shù)據(jù)的匹配融合方法研究[D];蘭州交通大學(xué);2014年
9 董桂平;現(xiàn)代漢語(yǔ)義類詞典分類體系考察與研究[D];魯東大學(xué);2012年
,本文編號(hào):1124732
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1124732.html