面向知識(shí)圖譜補(bǔ)全的嵌入模型研究
發(fā)布時(shí)間:2020-11-22 05:39
隨著大數(shù)據(jù)時(shí)代的到來(lái),知識(shí)的存儲(chǔ)與表示變得尤為重要。知識(shí)圖譜是知識(shí)表示最有效的方式之一,被廣泛的應(yīng)用于智能搜索、智能問(wèn)答等智能化應(yīng)用。雖然,現(xiàn)有知識(shí)圖譜的規(guī)模已經(jīng)十分龐大,但其距離達(dá)到知識(shí)的完備狀態(tài)依舊十分遙遠(yuǎn)。知識(shí)圖譜的完備程度將直接影響智能化應(yīng)用的性能好壞。為此,知識(shí)圖譜補(bǔ)全技術(shù)備受關(guān)注,已經(jīng)成為當(dāng)前的一個(gè)研究熱點(diǎn)。知識(shí)圖譜嵌入旨在利用連續(xù)的、稠密的、低維的向量來(lái)表示知識(shí)圖譜中的實(shí)體和關(guān)系,以便使用低維向量進(jìn)行知識(shí)的推理和補(bǔ)全。近年來(lái),基于翻譯的模型表現(xiàn)出強(qiáng)大的可行性和魯棒性,在知識(shí)圖譜補(bǔ)全任務(wù)中實(shí)現(xiàn)了最先進(jìn)的性能。但是現(xiàn)有翻譯模型仍存在知識(shí)表示不夠精確、負(fù)例三元組質(zhì)量較低等不足,為了克服這些不足本文提出了MvTransE與TransE-SNS模型。本文主要研究?jī)?nèi)容如下:(1)本文提出了一種多視角學(xué)習(xí)的嵌入模型MvTransE。該模型先從實(shí)體的語(yǔ)義和結(jié)構(gòu)角度生成多個(gè)平行子圖。然后將原始的知識(shí)圖譜和子圖分別嵌入到全局視角空間和局部視角空間。最后利用多視角融合策略整合關(guān)系事實(shí)的多視角表示。MvTransE解決了現(xiàn)有模型的兩個(gè)不足之處。第一,TransE、TransH等模型側(cè)重于從全局出發(fā),學(xué)習(xí)關(guān)系事實(shí)的全局表示,這樣不能區(qū)別地學(xué)習(xí)各種類型的事實(shí)。特別是,它造成實(shí)體和關(guān)系在向量空間中的擁塞,從而降低了實(shí)體和關(guān)系向量的表示精度。第二,puTransE采用多個(gè)平行空間來(lái)學(xué)習(xí)局部事實(shí),它損害了原始知識(shí)圖譜的全局事實(shí),從而降低了簡(jiǎn)單關(guān)系事實(shí)的學(xué)習(xí)能力。大量實(shí)驗(yàn)結(jié)果表明,MvTransE取得了最先進(jìn)的性能。(2)本文提出了一種相似性負(fù)采樣策略用于生成高質(zhì)量的負(fù)例三元組。該策略先通過(guò)K-Means聚類算法將所有實(shí)體劃分為多個(gè)簇。然后從正例三元組中頭實(shí)體所在的簇中選擇一個(gè)實(shí)體替換頭實(shí)體,并以類似的方法替換尾實(shí)體。我們將相似性負(fù)采樣策略與TransE相結(jié)合得到TransE-SNS。由于相似性負(fù)采樣策略解決了TransE在訓(xùn)練中會(huì)生成大量的低質(zhì)量負(fù)例三元組問(wèn)題,提高了負(fù)例三元組的質(zhì)量。大量實(shí)驗(yàn)結(jié)果表明,TransE-SNS的性能相較于TransE具有顯著地提升。
【學(xué)位單位】:桂林電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.1;TP18
【部分圖文】:
面向知識(shí)圖譜補(bǔ)全的嵌入模型研究自從 2012 年 Google 正式提出知識(shí)圖譜的概念并發(fā)布 GoogleKnowledgeGraph 以來(lái),各大互聯(lián)網(wǎng)企業(yè)也紛紛開始構(gòu)建自己的知識(shí)圖譜,如 MicrosoftSatori、阿里巴巴商品知識(shí)圖譜和百度知心等。最初,Google 構(gòu)建知識(shí)圖譜的目的是為了提升搜索引擎搜索時(shí)的質(zhì)量。在搜索時(shí),Google 搜索引擎不僅會(huì)提供相關(guān)網(wǎng)頁(yè)的鏈接列表,而且還會(huì)顯示一些關(guān)于該搜索主題詳細(xì)的結(jié)構(gòu)化信息。如圖 1-2 所示,當(dāng)用戶使用Google 搜索引擎搜索“馬云”時(shí),在搜索界面左側(cè)提供了關(guān)于“馬云”的網(wǎng)頁(yè)鏈接列表,同時(shí)在搜索界面右側(cè)顯示了若干關(guān)于“馬云”的客觀事實(shí)信息。這些客觀事實(shí)由搜索引擎通過(guò)知識(shí)圖譜提供,從而實(shí)現(xiàn)用戶在進(jìn)行主題查詢時(shí)不必導(dǎo)航至其他網(wǎng)頁(yè)就可獲取相關(guān)的主題信息。由此可見,知識(shí)圖譜能夠提高搜索引擎的用戶體驗(yàn)和搜索質(zhì)量。近年來(lái),知識(shí)圖譜已經(jīng)不僅限于在搜索引擎中使用,同時(shí)還在智能問(wèn)答系統(tǒng)、個(gè)性化推薦系統(tǒng)等智能化應(yīng)用中產(chǎn)生巨大的價(jià)值。
【參考文獻(xiàn)】
本文編號(hào):2894213
【學(xué)位單位】:桂林電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.1;TP18
【部分圖文】:
面向知識(shí)圖譜補(bǔ)全的嵌入模型研究自從 2012 年 Google 正式提出知識(shí)圖譜的概念并發(fā)布 GoogleKnowledgeGraph 以來(lái),各大互聯(lián)網(wǎng)企業(yè)也紛紛開始構(gòu)建自己的知識(shí)圖譜,如 MicrosoftSatori、阿里巴巴商品知識(shí)圖譜和百度知心等。最初,Google 構(gòu)建知識(shí)圖譜的目的是為了提升搜索引擎搜索時(shí)的質(zhì)量。在搜索時(shí),Google 搜索引擎不僅會(huì)提供相關(guān)網(wǎng)頁(yè)的鏈接列表,而且還會(huì)顯示一些關(guān)于該搜索主題詳細(xì)的結(jié)構(gòu)化信息。如圖 1-2 所示,當(dāng)用戶使用Google 搜索引擎搜索“馬云”時(shí),在搜索界面左側(cè)提供了關(guān)于“馬云”的網(wǎng)頁(yè)鏈接列表,同時(shí)在搜索界面右側(cè)顯示了若干關(guān)于“馬云”的客觀事實(shí)信息。這些客觀事實(shí)由搜索引擎通過(guò)知識(shí)圖譜提供,從而實(shí)現(xiàn)用戶在進(jìn)行主題查詢時(shí)不必導(dǎo)航至其他網(wǎng)頁(yè)就可獲取相關(guān)的主題信息。由此可見,知識(shí)圖譜能夠提高搜索引擎的用戶體驗(yàn)和搜索質(zhì)量。近年來(lái),知識(shí)圖譜已經(jīng)不僅限于在搜索引擎中使用,同時(shí)還在智能問(wèn)答系統(tǒng)、個(gè)性化推薦系統(tǒng)等智能化應(yīng)用中產(chǎn)生巨大的價(jià)值。
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王元卓;靳小龍;程學(xué)旗;;網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J];計(jì)算機(jī)學(xué)報(bào);2013年06期
相關(guān)博士學(xué)位論文 前2條
1 王楨;基于嵌入模型的知識(shí)圖譜補(bǔ)全[D];中山大學(xué);2017年
2 胡芳槐;基于多種數(shù)據(jù)源的中文知識(shí)圖譜構(gòu)建方法研究[D];華東理工大學(xué);2015年
本文編號(hào):2894213
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2894213.html
最近更新
教材專著