基于本體的民族教育資源自動(dòng)語義標(biāo)注研究
本文關(guān)鍵詞:基于本體的民族教育資源自動(dòng)語義標(biāo)注研究
更多相關(guān)文章: 語義標(biāo)注 本體 迭代模型 三元組
【摘要】:現(xiàn)在我們面對(duì)著網(wǎng)絡(luò)數(shù)據(jù)的浩瀚海洋,要想使計(jì)算機(jī)能夠完全準(zhǔn)確地從這些數(shù)量大、結(jié)構(gòu)不規(guī)則的數(shù)據(jù)中提取出滿足人們要求的信息變得越來越難,以前我們使用搜索引擎進(jìn)行搜索時(shí)不僅所需要的時(shí)間非常短,而且搜索產(chǎn)生的數(shù)據(jù)也是十分準(zhǔn)確的,但是現(xiàn)在我們要想更好地實(shí)現(xiàn)信息檢索就要往語義檢索的方向發(fā)展,要想實(shí)現(xiàn)語義檢索的前提是語義標(biāo)注,只有將網(wǎng)絡(luò)上的資源進(jìn)行了有效的語義標(biāo)注才能將人類的語義檢索的夢(mèng)想變?yōu)楝F(xiàn)實(shí)。也就是說我們現(xiàn)在面對(duì)著數(shù)據(jù)海量化與檢索低效率化這樣一個(gè)矛盾,在這樣一個(gè)矛盾的背景下,語義標(biāo)注尤其是自動(dòng)語義標(biāo)注越來越受到研究者的青睞,然而由于各國使用的網(wǎng)絡(luò)語言不同,以及不同的網(wǎng)絡(luò)時(shí)代下的網(wǎng)絡(luò)框架的區(qū)別等諸多原因,語義標(biāo)注的完全自動(dòng)化仍未得到全面的發(fā)展,要滿足人們的個(gè)性化、專業(yè)化的檢索需求還需要克服相當(dāng)大的困難。在這樣一個(gè)復(fù)雜的情況下,本論文首先分析信息采集的原理和方法,對(duì)民族教育信息網(wǎng)絡(luò)文檔資源的采集技術(shù)進(jìn)行了充分研究,通過網(wǎng)絡(luò)爬蟲技術(shù)爬取了網(wǎng)絡(luò)上的資源,接著充分利用了領(lǐng)域本體在語義表達(dá)上的有利條件,來對(duì)網(wǎng)絡(luò)上的資源進(jìn)行有效的語義表達(dá),因此構(gòu)建了領(lǐng)域本體庫來對(duì)特定主題的網(wǎng)絡(luò)資源進(jìn)行描述,最后對(duì)語義標(biāo)注方法進(jìn)行了深入研究分析,借鑒軟件工程的思想,以迭代模型為基礎(chǔ),并改進(jìn)原有的OCRNIP算法,提出了語義標(biāo)注的迭代模型,同時(shí)對(duì)該模型系統(tǒng)進(jìn)行了設(shè)計(jì)實(shí)現(xiàn)與實(shí)驗(yàn)分析。
【關(guān)鍵詞】:語義標(biāo)注 本體 迭代模型 三元組
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:G750;TP391.1
【目錄】:
- 摘要3-4
- Abstract4-9
- 第1章 緒論9-14
- 1.1 引言9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-12
- 1.3 本文的主要研究工作12-13
- 1.4 本文結(jié)構(gòu)13-14
- 第2章 語義網(wǎng)的發(fā)展14-22
- 2.1 Web的發(fā)展14-17
- 2.1.1 PC時(shí)代15
- 2.1.2 Web1.0 時(shí)代15-16
- 2.1.3 Web2.0 時(shí)代16
- 2.1.4 Web3.0 時(shí)代16-17
- 2.1.5 Web4.0 時(shí)代17
- 2.1.6 Web發(fā)展歷程小結(jié)17
- 2.2 語義網(wǎng)17-21
- 2.2.1 語義網(wǎng)的概念18
- 2.2.2 語義網(wǎng)的層次模型18-20
- 2.2.3 語義網(wǎng)和萬維網(wǎng)的對(duì)比分析20-21
- 2.3 本章小結(jié)21-22
- 第3章 相關(guān)理論與技術(shù)22-40
- 3.1 本體的相關(guān)理論22-28
- 3.1.1 本體與領(lǐng)域本體的基本概念22-24
- 3.1.2 本體描述語言24-27
- 3.1.3 本體構(gòu)建工具27-28
- 3.2 民族教育資源本體庫的構(gòu)建28-35
- 3.2.1 民族教育資源本體領(lǐng)域數(shù)據(jù)來源29
- 3.2.2 民族教育資源本體構(gòu)建流程29-31
- 3.2.3 民族教育資源本體庫的設(shè)計(jì)與實(shí)現(xiàn)——以傣族為例31-35
- 3.3 網(wǎng)絡(luò)爬蟲技術(shù)35-38
- 3.3.1 網(wǎng)絡(luò)爬蟲的概念35
- 3.3.2 網(wǎng)絡(luò)爬蟲的基本框架35-36
- 3.3.3 主題爬蟲36-38
- 3.4 中文分詞技術(shù)38-39
- 3.5 本章小結(jié)39-40
- 第4章 語義標(biāo)注系統(tǒng)模型40-58
- 4.1 語義標(biāo)注的基本概念40-41
- 4.2 語義標(biāo)注方法的分類41-44
- 4.2.1 根據(jù)標(biāo)注方法分類41-43
- 4.2.2 根據(jù)自動(dòng)化程度劃分43-44
- 4.3 語義標(biāo)注工具44-46
- 4.4 語義標(biāo)注系統(tǒng)模型——語義標(biāo)注迭代模型46-57
- 4.4.1 網(wǎng)頁文檔內(nèi)容的獲取過程49
- 4.4.2 本體庫的建立與完善49
- 4.4.3 用戶自定義詞典的獲取49-50
- 4.4.4 分詞文檔的獲取50-53
- 4.4.5 RDF文檔的獲取53-57
- 4.5 本章小結(jié)57-58
- 第5章 語義標(biāo)注迭代模型在傣族教育資源中的應(yīng)用58-65
- 5.1 語義標(biāo)注迭代模型系統(tǒng)的實(shí)現(xiàn)58-63
- 5.1.1 網(wǎng)頁內(nèi)容抽取59-61
- 5.1.2 用戶自定義詞典的生成61
- 5.1.3 中文分詞61-62
- 5.1.4 生成RDF文件62-63
- 5.2 語義標(biāo)注迭代模型系統(tǒng)的實(shí)驗(yàn)結(jié)果及分析63-64
- 5.2.1 評(píng)價(jià)指標(biāo)63
- 5.2.2 結(jié)果分析63-64
- 5.3 本章小結(jié)64-65
- 第6章 總結(jié)與展望65-66
- 6.1 總結(jié)65
- 6.2 展望65-66
- 參考文獻(xiàn)66-70
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文和研究成果70-71
- 致謝71
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 欒悉道;謝毓湘;陳丹雯;鄧?yán)颦?;基于劇本描述的動(dòng)畫素材語義標(biāo)注方法[J];長沙大學(xué)學(xué)報(bào);2012年02期
2 ;[J];;年期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前9條
1 苗傳江;劉智穎;;現(xiàn)代漢語語料的句子級(jí)語義標(biāo)注[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
2 謝法奎;張全;袁毅;;基于HNC理論的語義標(biāo)注語料庫[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 張娜;李濟(jì)洪;;基于語義標(biāo)注的中文閱讀理解語料庫的建設(shè)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
4 宋雨;鄭懌;吳燕;;RDFa語義標(biāo)注技術(shù)綜述[A];2009全國計(jì)算機(jī)網(wǎng)絡(luò)與通信學(xué)術(shù)會(huì)議論文集[C];2009年
5 鮑廣宇;譚偉;吳亞寧;;機(jī)器兵力指揮控制語言的語義標(biāo)注技術(shù)研究[A];2013第一屆中國指揮控制大會(huì)論文集[C];2013年
6 馬永騰;亢世勇;;非典型成員的語義標(biāo)注策略和問題[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
7 王浩然;徐建良;張巍;;一種XML元數(shù)據(jù)的自動(dòng)語義標(biāo)注方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
8 袁柳;李戰(zhàn)懷;陳世亮;;OntoWord:一種新的Web頁面語義標(biāo)注方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
9 曾誠;李兵;何克清;;KMP算法在Web服務(wù)語義標(biāo)注中的應(yīng)用[A];2010年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 米楊;基于頂級(jí)本體整合的醫(yī)學(xué)領(lǐng)域語義標(biāo)注研究[D];吉林大學(xué);2012年
2 謝銘;關(guān)聯(lián)數(shù)據(jù)和知識(shí)表示的自動(dòng)語義標(biāo)注技術(shù)[D];武漢大學(xué);2012年
3 唐金輝;視頻語義標(biāo)注的若干問題研究[D];中國科學(xué)技術(shù)大學(xué);2008年
4 荊濤;面向領(lǐng)域網(wǎng)頁的語義標(biāo)注若干問題研究[D];吉林大學(xué);2011年
5 王傳清;超網(wǎng)絡(luò)視域下數(shù)字資源聚合研究[D];吉林大學(xué);2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 彭晨漪;物聯(lián)網(wǎng)環(huán)境下面向服務(wù)的實(shí)體語義標(biāo)注[D];華南理工大學(xué);2015年
2 張銳;面向期刊論文的多粒度語義標(biāo)注方法研究[D];華中師范大學(xué);2015年
3 程童凌;基于維基類百科知識(shí)資源的實(shí)體關(guān)系發(fā)現(xiàn)和語義標(biāo)注[D];北京化工大學(xué);2015年
4 何中山;基于語義網(wǎng)的初中數(shù)學(xué)的自動(dòng)語義標(biāo)注方法研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
5 崔愉;面向文本的自動(dòng)語義標(biāo)注技術(shù)研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
6 王偉強(qiáng);基于運(yùn)動(dòng)捕捉數(shù)據(jù)的人體行為分割與行為語義標(biāo)注[D];北京交通大學(xué);2016年
7 孫亞男;基于本體的民族教育資源自動(dòng)語義標(biāo)注研究[D];云南師范大學(xué);2016年
8 丁長林;中醫(yī)古籍文獻(xiàn)語義標(biāo)注技術(shù)的研究[D];沈陽航空航天大學(xué);2013年
9 丁蓉;自動(dòng)語義標(biāo)注方法研究[D];蘭州理工大學(xué);2012年
10 王國印;科技文獻(xiàn)語義標(biāo)注系統(tǒng)研究[D];華中科技大學(xué);2009年
,本文編號(hào):1040549
本文鏈接:http://www.sikaile.net/jiaoyulunwen/crjy/1040549.html