制造業(yè)領(lǐng)域知識圖譜的構(gòu)建與應(yīng)用
發(fā)布時間:2021-01-11 01:17
制造業(yè)作為國民經(jīng)濟的主體,是立國之本、興國之器、強國之基。國內(nèi)制造業(yè)按國家標(biāo)準(zhǔn)分為31個大類、191個中類和525個小類,領(lǐng)域?qū)哟畏倍嗲腋拍罱Y(jié)構(gòu)復(fù)雜。隨著“中國制造2025”計劃的推進,大量領(lǐng)域信息迫切需要有效的組織方法。知識圖譜作為一種大規(guī)模語義網(wǎng),可以將制造業(yè)領(lǐng)域信息系統(tǒng)地進行表示和組織。因此,本文對制造業(yè)領(lǐng)域知識圖譜構(gòu)建各環(huán)節(jié)進行研究并完成知識圖譜的構(gòu)建和初步應(yīng)用。本文從以下四個方面展開研究,主要研究內(nèi)容如下:(1)針對知識圖譜概念層的構(gòu)建,本文在領(lǐng)域?qū)<抑笇?dǎo)下進行相關(guān)概念和術(shù)語的梳理,通過建立概念分層結(jié)構(gòu)改進原斯坦福大學(xué)提出的本體構(gòu)建七步法,解決了其無法準(zhǔn)確描述復(fù)雜概念的問題。(2)針對知識圖譜數(shù)據(jù)層的獲取,本文使用基于Heritrix爬蟲框架獲取網(wǎng)絡(luò)資源,通過BKDRHash爬蟲隊列生成算法實現(xiàn)多線程的網(wǎng)絡(luò)信息獲取。在此基礎(chǔ)上,針對非結(jié)構(gòu)化文本數(shù)據(jù)中實體信息的獲取,本文使用條件隨機場模型進行實體識別,通過融合領(lǐng)域?qū)嶓w名稱特征提升抽取準(zhǔn)確率;針對非結(jié)構(gòu)化文本數(shù)據(jù)中實體關(guān)系信息的獲取,本文提出一種基于長短期記憶網(wǎng)絡(luò)的實體關(guān)系抽取方法,解決了傳統(tǒng)方法絡(luò)在實體關(guān)系抽取中的長距離依賴問...
【文章來源】:浙江工商大學(xué)浙江省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
國民經(jīng)濟行業(yè)分類文件示例圖
可復(fù)用本體示例圖
知識圖譜概念層結(jié)構(gòu)可視化示例圖
本文編號:2969780
【文章來源】:浙江工商大學(xué)浙江省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
國民經(jīng)濟行業(yè)分類文件示例圖
可復(fù)用本體示例圖
知識圖譜概念層結(jié)構(gòu)可視化示例圖
本文編號:2969780
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2969780.html
最近更新
教材專著