雙結(jié)構(gòu)網(wǎng)絡(luò)中基于實體的UCL知識空間研究
發(fā)布時間:2021-01-11 13:48
雙結(jié)構(gòu)網(wǎng)絡(luò)是一種以互聯(lián)網(wǎng)為主結(jié)構(gòu)而以播存網(wǎng)絡(luò)為次結(jié)構(gòu)的新型網(wǎng)絡(luò)架構(gòu),其能夠充分利用物理廣播向用戶一側(cè)分發(fā)互聯(lián)網(wǎng)熱門內(nèi)容,以便有效地降低內(nèi)容分發(fā)路由跳數(shù)。而統(tǒng)一內(nèi)容標(biāo)簽(Uniform Content Label,UCL)用來解決異步廣播通信缺乏交互的弊端,且有助于理順互聯(lián)網(wǎng)雜亂無章的非結(jié)構(gòu)化內(nèi)容,使用戶能夠快速獲取互聯(lián)網(wǎng)內(nèi)容中的豐富語義信息。然而,目前關(guān)于雙結(jié)構(gòu)網(wǎng)絡(luò)的研究主要集中在緩存策略和信息推薦方面,這導(dǎo)致用戶能夠獲取的UCL信息僅局限于自身興趣和本地緩存,且缺乏對全局UCL信息的感知。因此,研究如何將散亂的UCL進行有效地語義組織為雙結(jié)構(gòu)網(wǎng)絡(luò)用戶提供可靠的UCL知識發(fā)現(xiàn)服務(wù)具有重要的前瞻研究意義。為此,本文提出了一種基于命名實體(Named Entity,NE)的UCL語義關(guān)聯(lián)模型,設(shè)計了UCL知識空間(UCL Knowledge Space,UCLKS),用以實現(xiàn)基于實體的海量UCL的知識表達、組織和發(fā)現(xiàn)。在UCLKS的基礎(chǔ)之上提出了面向自然語言問句的UCL內(nèi)容解析服務(wù)的解決方案,以便雙結(jié)構(gòu)網(wǎng)絡(luò)用戶能夠輕易獲取UCL全局知識。具體而言,本文的研究工作主要包括以下三個方面:1)針...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究目標(biāo)與研究內(nèi)容對應(yīng)關(guān)系圖
期的實體抽取也稱為命名實體學(xué)習(xí)(Named Entity Learning, NEL)或命名實體識別,自動化提取出語料庫中的命名實體。知識庫或者知識圖譜的基本構(gòu)成要素是命名實體的質(zhì)量受到命名實體識別的精確度和完整性的直接影響。故實體識別是知識庫構(gòu)建過驟。用實體抽取的方法一般分為三類:詞典與規(guī)則相結(jié)合的方法、利用統(tǒng)計機器學(xué)習(xí)的方放域的實體識別方法。詞典與規(guī)則相結(jié)合的方法在構(gòu)建的目標(biāo)實體模板和實體指稱詞匹配的方式提取語料中的實體;利用統(tǒng)計機器學(xué)習(xí)的方法首先在訓(xùn)練集上訓(xùn)練出機器后利用該模型提取語料中的實體;針對開放域的實體識別適用于多領(lǐng)域的、異構(gòu)的海-15]。規(guī)則與詞典的實體識別算法期的實體識別工作一般都限定了文本領(lǐng)域或語義單元,因此往往使用詞典與規(guī)則相結(jié)如利用編寫的特定規(guī)則,識別出語料庫中的人物、時間、地點或機構(gòu)組織等命名實體結(jié)合了自定義的模板規(guī)則和啟發(fā)式算法,實現(xiàn)了對公司名稱的自動實體識別功能。如基于規(guī)則與詞典的實體識別流程。
第二章 研究現(xiàn)狀等相關(guān)技術(shù)已經(jīng)相當(dāng)成熟,例如目前使用較為普遍的中文分詞與詞性標(biāo)注的工具有中科院出的 ICTCALAS[43]以及哈工大信息檢索研究中心研發(fā)的語言技術(shù)平臺(LTP)[44]。因此,理方面的基礎(chǔ)工作往往不是語義分析過程中的研究重心。用戶查詢問句的語義分析主要目的是理解查詢問句的語義信息,只有在確切理解查詢問句前提下,才可能找到知識庫中包含的用戶真正需要的知識。合理的查詢問句分析不僅需要的主題信息,還需要明確問句的類型信息和約束條件等。由于漢語是弱語法結(jié)構(gòu)的自然語查詢問句的分析需要很多語言學(xué)相關(guān)的知識,因而針對中文自然語言問句的語義分析一直點。查詢問句的語義分析往往是對預(yù)處理的結(jié)果進行序列化標(biāo)注,從而理解問句的語義信問句的序列化標(biāo)注工作實現(xiàn)了將自然語言問句映射為結(jié)構(gòu)化的語義空間向量,以便于計算。通常使用基于統(tǒng)計機器學(xué)習(xí)的方法來解決自然語言的序列化標(biāo)注問題,比較典型的處理條件隨機場模型和隱馬爾科夫模型等。圖 2-2 所示是智能搜索的搜索結(jié)構(gòu)流圖。
【參考文獻】:
期刊論文
[1]雙結(jié)構(gòu)網(wǎng)絡(luò)內(nèi)容共享能力研究[J]. 劉旋,楊鵬,董永強. 電子學(xué)報. 2018(04)
[2]互聯(lián)網(wǎng)DNS安全研究現(xiàn)狀與挑戰(zhàn)[J]. 胡寧,鄧文平,姚蘇. 網(wǎng)絡(luò)與信息安全學(xué)報. 2017(03)
[3]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[4]基于圖的中文集成實體鏈接算法[J]. 劉嶠,鐘云,李楊,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(02)
[5]未來網(wǎng)絡(luò)的第三種思路[J]. 李幼平. 電信科學(xué). 2015(12)
[6]基于播存思想的未來互聯(lián)網(wǎng)次結(jié)構(gòu)[J]. 楊鵬,李幼平. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué). 2015(02)
[7]播存網(wǎng)絡(luò)體系結(jié)構(gòu)普適模型及實現(xiàn)模式[J]. 楊鵬,李幼平. 電子學(xué)報. 2015(05)
[8]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動化學(xué)報. 2014(08)
[9]信息中心網(wǎng)絡(luò)發(fā)展研究綜述[J]. 吳超,張堯?qū)W,周悅芝,傅曉明. 計算機學(xué)報. 2015(03)
[10]開放式信息抽取研究進展[J]. 楊博,蔡東風(fēng),楊華. 中文信息學(xué)報. 2014(04)
本文編號:2970879
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究目標(biāo)與研究內(nèi)容對應(yīng)關(guān)系圖
期的實體抽取也稱為命名實體學(xué)習(xí)(Named Entity Learning, NEL)或命名實體識別,自動化提取出語料庫中的命名實體。知識庫或者知識圖譜的基本構(gòu)成要素是命名實體的質(zhì)量受到命名實體識別的精確度和完整性的直接影響。故實體識別是知識庫構(gòu)建過驟。用實體抽取的方法一般分為三類:詞典與規(guī)則相結(jié)合的方法、利用統(tǒng)計機器學(xué)習(xí)的方放域的實體識別方法。詞典與規(guī)則相結(jié)合的方法在構(gòu)建的目標(biāo)實體模板和實體指稱詞匹配的方式提取語料中的實體;利用統(tǒng)計機器學(xué)習(xí)的方法首先在訓(xùn)練集上訓(xùn)練出機器后利用該模型提取語料中的實體;針對開放域的實體識別適用于多領(lǐng)域的、異構(gòu)的海-15]。規(guī)則與詞典的實體識別算法期的實體識別工作一般都限定了文本領(lǐng)域或語義單元,因此往往使用詞典與規(guī)則相結(jié)如利用編寫的特定規(guī)則,識別出語料庫中的人物、時間、地點或機構(gòu)組織等命名實體結(jié)合了自定義的模板規(guī)則和啟發(fā)式算法,實現(xiàn)了對公司名稱的自動實體識別功能。如基于規(guī)則與詞典的實體識別流程。
第二章 研究現(xiàn)狀等相關(guān)技術(shù)已經(jīng)相當(dāng)成熟,例如目前使用較為普遍的中文分詞與詞性標(biāo)注的工具有中科院出的 ICTCALAS[43]以及哈工大信息檢索研究中心研發(fā)的語言技術(shù)平臺(LTP)[44]。因此,理方面的基礎(chǔ)工作往往不是語義分析過程中的研究重心。用戶查詢問句的語義分析主要目的是理解查詢問句的語義信息,只有在確切理解查詢問句前提下,才可能找到知識庫中包含的用戶真正需要的知識。合理的查詢問句分析不僅需要的主題信息,還需要明確問句的類型信息和約束條件等。由于漢語是弱語法結(jié)構(gòu)的自然語查詢問句的分析需要很多語言學(xué)相關(guān)的知識,因而針對中文自然語言問句的語義分析一直點。查詢問句的語義分析往往是對預(yù)處理的結(jié)果進行序列化標(biāo)注,從而理解問句的語義信問句的序列化標(biāo)注工作實現(xiàn)了將自然語言問句映射為結(jié)構(gòu)化的語義空間向量,以便于計算。通常使用基于統(tǒng)計機器學(xué)習(xí)的方法來解決自然語言的序列化標(biāo)注問題,比較典型的處理條件隨機場模型和隱馬爾科夫模型等。圖 2-2 所示是智能搜索的搜索結(jié)構(gòu)流圖。
【參考文獻】:
期刊論文
[1]雙結(jié)構(gòu)網(wǎng)絡(luò)內(nèi)容共享能力研究[J]. 劉旋,楊鵬,董永強. 電子學(xué)報. 2018(04)
[2]互聯(lián)網(wǎng)DNS安全研究現(xiàn)狀與挑戰(zhàn)[J]. 胡寧,鄧文平,姚蘇. 網(wǎng)絡(luò)與信息安全學(xué)報. 2017(03)
[3]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[4]基于圖的中文集成實體鏈接算法[J]. 劉嶠,鐘云,李楊,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(02)
[5]未來網(wǎng)絡(luò)的第三種思路[J]. 李幼平. 電信科學(xué). 2015(12)
[6]基于播存思想的未來互聯(lián)網(wǎng)次結(jié)構(gòu)[J]. 楊鵬,李幼平. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué). 2015(02)
[7]播存網(wǎng)絡(luò)體系結(jié)構(gòu)普適模型及實現(xiàn)模式[J]. 楊鵬,李幼平. 電子學(xué)報. 2015(05)
[8]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬. 自動化學(xué)報. 2014(08)
[9]信息中心網(wǎng)絡(luò)發(fā)展研究綜述[J]. 吳超,張堯?qū)W,周悅芝,傅曉明. 計算機學(xué)報. 2015(03)
[10]開放式信息抽取研究進展[J]. 楊博,蔡東風(fēng),楊華. 中文信息學(xué)報. 2014(04)
本文編號:2970879
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2970879.html
最近更新
教材專著