基于語義圖的中文領域概念及關系抽取方法研究與實現(xiàn)
發(fā)布時間:2021-07-31 04:22
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,數(shù)據(jù)量在不斷遞增,從海量數(shù)據(jù)中挖掘有效信息變得越來越重要。在這個過程中知識圖譜,特別是領域知識圖譜發(fā)揮了重要的作用,成為互聯(lián)網(wǎng)知識驅動智能應用的基礎設施。對于領域知識圖譜的構建,首先應該構建知識圖譜的數(shù)據(jù)模式。由于領域數(shù)據(jù)的龐大性,且大部分是非結構化文本,因而自動構建知識圖譜的數(shù)據(jù)模式成為該領域研究的重點。領域術語的抽取、領域概念的抽取以及關系的抽取是構建知識圖譜數(shù)據(jù)模式的重要因素。本文針對知識圖譜數(shù)據(jù)模式的構建進行了以下三個方面的研究。1)采用了基于混合策略的中文領域術語抽取方法。首先對領域數(shù)據(jù)集進行詞法分析,基于規(guī)則進行候選領域術語的抽取;其次使用統(tǒng)計的方法對候選領域術語進行過濾,利用TF-IDF算法進行領域術語的抽取,利用TextRank算法進行單詞術語多詞術語的抽取。實驗結果表明,該方法使得領域術語的抽取較為全面。2)提出了基于語義圖的中文領域概念抽取方法。該方法針對領域術語,構建包含語義信息的術語語義圖,使用社區(qū)發(fā)現(xiàn)算法對術語語義圖進行分析和劃分,從而實現(xiàn)概念抽取。實驗結果表明,該方法能夠有效利用語義信息獲得較好的概念抽取結果。3)提出了一種基于語義...
【文章來源】:河北科技大學河北省
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
CBOW模型架構
語義圖
依存句法結構
本文編號:3312759
【文章來源】:河北科技大學河北省
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
CBOW模型架構
語義圖
依存句法結構
本文編號:3312759
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3312759.html
最近更新
教材專著