學(xué)術(shù)資源本體非等級關(guān)系抽取研究
發(fā)布時間:2018-06-15 19:08
本文選題:本體構(gòu)建 + 非等級關(guān)系抽取。 參考:《圖書情報工作》2016年20期
【摘要】:[目的 /意義]概念非等級關(guān)系抽取是本體構(gòu)建的必要步驟,學(xué)術(shù)文獻(xiàn)作為一種重要的學(xué)術(shù)資源類型,本文主要利用其結(jié)構(gòu)特點來進(jìn)行本體概念非等級關(guān)系的抽取。[方法 /過程]首先,在本體概念抽取的基礎(chǔ)上,對文獻(xiàn)中概念的類型進(jìn)行分類,以便于后期關(guān)系動詞搭配的概念類型來排除不符合條件的三元組;其次,確定學(xué)術(shù)文獻(xiàn)中的關(guān)系類型,并采用C-value方法抽取表示關(guān)系的動詞,進(jìn)行本體關(guān)系的表示;再次,評價概念對的關(guān)聯(lián)性,利用互信息法對概念對進(jìn)行排序并去除非相關(guān)概念對,實驗表明該方法非常有效;最后評價概念對與關(guān)系動詞的關(guān)聯(lián),分析影響三元組關(guān)聯(lián)的因素,再采用實驗確定模型挖掘三元組,實驗比較現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘的方法。[結(jié)果 /結(jié)論]結(jié)果表明本文提出的三元組選擇模型效果明顯超過現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘方法,并且在語料集擴(kuò)大的情況下這種優(yōu)勢更為明顯。
[Abstract]:Abstract of concept non-hierarchical relation is a necessary step in ontology construction. As an important type of academic resources, this paper mainly uses its structural characteristics to extract non-hierarchical relationship of ontology concept. [methods / process] first, on the basis of ontology concept extraction, the classification of concept types in literature is carried out so as to facilitate the conceptual types of post-relational verb collocations to exclude unqualified triples. To determine the types of relationships in academic literature, and use C-value method to extract verbs to express relationships, and to represent ontology relations; thirdly, to evaluate the relevance of concept pairs, and to use mutual information method to sort the concept pairs unless the related concept pairs. The experimental results show that this method is very effective. Finally, we evaluate the relationship between the concept and the relational verbs, analyze the factors that affect the association of triples, and then use the experimental deterministic model to mine the triples, and compare the existing methods of association rules mining. [results / conclusion] the results show that the proposed triple selection model is more effective than the existing association rules mining methods, and this advantage is more obvious when the corpus is enlarged.
【作者單位】: 南京大學(xué)信息管理學(xué)院;
【基金】:國家社會科學(xué)基金重大招標(biāo)項目“面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究”(項目編號:12&ZD221) 南京大學(xué)優(yōu)秀博士研究生創(chuàng)新能力提升計劃(項目編號:201601B033)研究成果之一
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 熊霞;常春;吳雯娜;;等級關(guān)系循環(huán)錯誤檢查算法的設(shè)計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2010年05期
2 余凡;程虹;樓雯;;語法規(guī)則和改進(jìn)關(guān)聯(lián)規(guī)則的中文文本非等級關(guān)系提取研究[J];圖書情報工作;2013年22期
3 王冠華;危紅;;網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》(工程技術(shù)版)詞間等同、等級關(guān)系的處理[J];圖書館論壇;2014年08期
4 王志強;;如此日本人[J];出版參考;2006年17期
5 余凡;程虹;樓雯;;基于改進(jìn)相似度算法的文本等級關(guān)系提取方法研究[J];情報理論與實踐;2014年05期
6 ;[J];;年期
相關(guān)碩士學(xué)位論文 前1條
1 王榮濤;秦嶺川金絲猴(Rhinopithecus roxellana)全雄群的組成,,亞群體類型及個體間等級關(guān)系[D];西北大學(xué);2014年
本文編號:2023219
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2023219.html
最近更新
教材專著