天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建技術(shù)及應(yīng)用研究

發(fā)布時間:2021-11-08 05:21
  隨著社交網(wǎng)絡(luò)的快速發(fā)展,社會輿論熱點(diǎn)事件備受網(wǎng)民關(guān)注。網(wǎng)民積極的參與社會輿論熱點(diǎn)事件的討論,加快了網(wǎng)絡(luò)輿情的傳播與擴(kuò)散。網(wǎng)絡(luò)輿情事件中蘊(yùn)含豐富的信息,有效的對其進(jìn)行管理及分析有助于掌握網(wǎng)絡(luò)輿情態(tài)勢。已有的網(wǎng)絡(luò)輿情事件研究分析不夠細(xì)致且深度不足,主要存在如下兩個方面的問題:(1)網(wǎng)絡(luò)輿情事件信息組織多是采用關(guān)系型數(shù)據(jù)庫存儲并管理,導(dǎo)致查詢檢索困難,無法高效地對網(wǎng)絡(luò)輿情事件進(jìn)行直觀地可視化展示及推理分析;(2)基于網(wǎng)絡(luò)輿情事件的傳播與擴(kuò)散分析多是采用仿真建模的方法,理論復(fù)雜,操作困難。解決這些問題的核心在于改進(jìn)網(wǎng)絡(luò)輿情事件的存儲和表示方式,并在此基礎(chǔ)上對網(wǎng)絡(luò)輿情事件進(jìn)行傳播分析和擴(kuò)散預(yù)測。知識圖譜作為以圖模型為基礎(chǔ)的新型數(shù)據(jù)表示和存儲工具,能夠有效解決或改善以上問題。本文研究網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建技術(shù)及應(yīng)用,主要研究成果如下:(1)研究了實(shí)體消歧方法。針對傳統(tǒng)的實(shí)體消歧方法中詞向量語義表達(dá)能力弱以及未考慮實(shí)體的局部特征等問題,本文提出一種基于上下文詞向量和主題模型的實(shí)體消歧方法。首先,在傳統(tǒng)詞向量模型上增加上下文語序向量,訓(xùn)練上下文詞向量;其次,分別計(jì)算上下文相似度、類別主題相似度以及主... 

【文章來源】:華僑大學(xué)福建省

【文章頁數(shù)】:99 頁

【學(xué)位級別】:碩士

【部分圖文】:

網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建技術(shù)及應(yīng)用研究


論文研究內(nèi)容結(jié)構(gòu)圖

流程圖,輿情,知識圖,事件


182.2網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建基礎(chǔ)網(wǎng)絡(luò)輿情事件知識圖譜屬于領(lǐng)域知識圖譜,領(lǐng)域知識圖譜的構(gòu)建通常采用自頂向下的構(gòu)建技術(shù)[84][85][86]。首先對網(wǎng)絡(luò)輿情事件進(jìn)行本體建模,梳理網(wǎng)絡(luò)輿情事件語料庫的概念、實(shí)體、屬性以及關(guān)系,為了保證圖譜的可靠性,對本體層進(jìn)行人工校驗(yàn);然后,依次完成知識獲娶實(shí)體鏈接與消歧和知識表示與推理;最后,對網(wǎng)絡(luò)輿情事件知識進(jìn)行質(zhì)量評估。網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建的流程如圖2.1所示。知識推理質(zhì)量評估實(shí)體消歧第三方知識庫知識圖譜本體構(gòu)建模式層實(shí)例層結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)知識獲取圖2.1網(wǎng)絡(luò)輿情事件知識圖譜構(gòu)建流程圖1.本體構(gòu)建本體構(gòu)建的目的是為知識圖譜構(gòu)建一個骨架,是知識圖譜構(gòu)建的基矗本文在網(wǎng)絡(luò)輿情事件語料庫上構(gòu)建了網(wǎng)絡(luò)輿情事件知識圖譜的本體,如圖2.2所示。用戶意見領(lǐng)袖普通用戶貼文子類子類發(fā)布轉(zhuǎn)發(fā)關(guān)注王芝芝會有狗的#太原師范學(xué)院校園暴力#215664905136524普通2019/5/2911:47http://weibo.com/2156649051/HwpFSFhqy原創(chuàng)/轉(zhuǎn)發(fā)實(shí)例用戶ID粉絲數(shù)類型發(fā)布時間地址原創(chuàng)/轉(zhuǎn)發(fā)小熊餅干釀603481992988普通用戶ID粉絲數(shù)類型實(shí)例關(guān)注發(fā)布轉(zhuǎn)發(fā)概念實(shí)例關(guān)系屬性屬性值圖2.2網(wǎng)絡(luò)輿情事件知識圖譜本體結(jié)構(gòu)圖

窗口大小,主題


31小的關(guān)系,實(shí)驗(yàn)結(jié)果如圖3.4所示,其中,橫坐標(biāo)表示窗口大小,縱坐標(biāo)表示模型的訓(xùn)練時間。圖3.4訓(xùn)練速度與不同窗口大小比較實(shí)驗(yàn)結(jié)果表明,本章方法詞向量的訓(xùn)練速度基本與SG模型相同,相比于SSG模型有較大的改進(jìn)。原因在于本章方法僅增加了表征詞序的上下文方向向量,相當(dāng)于只增加了一個輸入向量,沒有改變神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)。所以,SG模型的空間復(fù)雜度為O(2|V|d),本章方法的空間復(fù)雜度為O(3|V|d),而SSG由于為每個投影層設(shè)置不同的投影矩陣,其空間復(fù)雜度為O((2c1)|V|d),其中d表示詞向量的維度,c表示滑動窗口個數(shù)。另外,SG模型的時間復(fù)雜度為O(2c(n1)V),本章方法的時間復(fù)雜度為O(2c(n2)V),而SSG由于為每個投影層設(shè)置不同的投影矩陣,其時間復(fù)雜度為2O(4c(n1)V),其中,表示進(jìn)行一次詞嵌入更新需要的時間開銷,n表示負(fù)采樣樣本的個數(shù)。綜上所述,本章的詞向量訓(xùn)練方法可以在增加詞向量語義表達(dá)能力的同時,在時空復(fù)雜度基本與Skip-Gram模型相同,盡可能避免復(fù)雜度較高的問題。2.主題個數(shù)對于消歧結(jié)果的影響基于實(shí)體上下文主題的類別主題相似度方法中,為了獲取最優(yōu)的消歧結(jié)果,需要在類別主題相似度計(jì)算中確定主題n的個數(shù);诖诉M(jìn)行了10組不同的實(shí)驗(yàn),分別選取n=1,2,3,4,5,6,7,8,9,10時,研究主題個數(shù)對消歧結(jié)果的影響,結(jié)果如圖3.5所示。由圖3.5可知,當(dāng)主題個數(shù)n=7時,F(xiàn)1值達(dá)到最大值90.3%。原因在于,當(dāng)主題個數(shù)太少時,主題與類別之間的組合相對較少,相似性的度量僅僅局限在少有的幾個主題與類別之間,對于實(shí)體指稱項(xiàng)的描述不夠充分,在語義上區(qū)分不夠明顯,導(dǎo)致實(shí)體消歧


本文編號:3483088

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3483088.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶83ec2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com