基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)跨媒體大數(shù)據(jù)搜索研究
【學(xué)位單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.3;TP183
【部分圖文】:
LSTM是循環(huán)祌經(jīng)網(wǎng)絡(luò)的一個特例,使用獨(dú)特的設(shè)計來克服循環(huán)神經(jīng)網(wǎng)的梯度消失問題,使之能記住更為長期的語義信息。LSTM單元結(jié)構(gòu)如圖2-示,與傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)相比區(qū)別在于通過記憶單元來控制長期記憶和短期??行為。此外新增三個控制單元輸入門(i叩utgate),如式(2-1?),輸出門(output),如式(2-2)和遺忘門(forget?gate),如式(2-3)來控制信息的變換與消??門是一種讓信息選擇式通過的方法,包含一個sigmoid層和一個逐位乘法操??/(/)?=?cr(^x(/)?+?^(/-l)?+?^c(r-l)?+?/),)?(2-1)??〇(t)-cr(Wxox(t)?+?Whoh(t-\)?+?Wcoc(t)?+?b0)?(2-2)??/(/)?=?^K4/)?+?V(/-')?+?^/c(/-1)?+?ft/)?(2-3)??
據(jù)預(yù)先配置的DOM區(qū)塊規(guī)則解析區(qū)塊內(nèi)每一個詳情頁的鏈接地址,在詳情頁中??根據(jù)需要對頁面進(jìn)行瀏覽器渲染,然后根據(jù)預(yù)先定義的規(guī)則對特定DOM元素中??的內(nèi)容進(jìn)行采集。與之對應(yīng)的,設(shè)計了相應(yīng)的采集流程和架構(gòu),如圖3-2所示。??r?-?次采集^^>???-^???I???I???根據(jù)翻頁規(guī)則??采集全部內(nèi)容?A#?A?^1??渲染頁面js????????I???f?數(shù)據(jù)庫???提取內(nèi)容??\。??I—5?1—是——??1?——??結(jié)束?j?等待時間到?-??圖3-2采集節(jié)點(diǎn)流程??如圖3-3,整個采集系統(tǒng)分為以下幾個部分:調(diào)度器、列表頁解析器、詳情??頁解析器、消息隊列去重器和持久化組件。調(diào)度器負(fù)責(zé)啟動不同節(jié)點(diǎn)的解析器、??去重和持久化,將采集配置內(nèi)容傳遞給解析器,列表頁解析器根據(jù)配置內(nèi)容中的??起始URL對頁面列表進(jìn)行采集,將獲得的詳情頁URL放入待去重隊列,去重器??檢查待去重隊列中的URL是否已經(jīng)被抓取,如果尚未被抓取則加入詳情頁隊列,??詳情頁解析器從詳情頁隊列中取得URL后根據(jù)采集規(guī)則對頁面進(jìn)行渲染,并對??特定字段進(jìn)行定向獲取,將提取到的結(jié)構(gòu)化數(shù)據(jù)加入持久化隊列。持久化組件從??持久化隊列中獲取結(jié)構(gòu)化數(shù)據(jù)并保存到文檔數(shù)據(jù)庫?梢钥吹,消息隊列是系統(tǒng)??的中樞部分
CSEWE+LDA?2.065?1.870?2.086?1.979?2.120?1.948??CSEWE+BTM?2.125?2.117?2.199?2.123?2.181?2.176??在表5-2和圖5-3中,ToplO和Top20指的是主題中排在前面的詞數(shù)。在表??5-2中BTM通過引入專門為短文本設(shè)計的文本的雙詞模型表示來提高主題質(zhì)量,??因此比LDA表現(xiàn)更好。經(jīng)過CSEWE擴(kuò)充的聚類效果優(yōu)于兩種方法。這是因為??該方法使用了微博圖像和文本的語義?缒B(tài)信息的全面性有助于實(shí)現(xiàn)微博語義??的提取。當(dāng)主題數(shù)量增加時,LDA的語義稀疏性將更加明顯,并且生成的主題??的質(zhì)量將更差。在擴(kuò)展語料庫之后,主題的質(zhì)量得到提高,尤其是當(dāng)主題數(shù)較大??時。CSEWE擴(kuò)充方法可以提高兩個主題模型的主題質(zhì)量。????使用CSEWE方法對擴(kuò)展的微博文本進(jìn)行了微博內(nèi)容搜索實(shí)驗,并將結(jié)果與??WMD、BTM和BM25算法進(jìn)行了比較。使用MAP和NDCG指標(biāo)評估搜索效??果。實(shí)驗結(jié)果如表5-2和圖5-4所示。????表?5-3?CSEWE?的?top@N?MAP?和?NDCG?搜索結(jié)果???評價指標(biāo)?MAP?NDCG??算法?@10?@20?@30?@50?@10?@20?@30?@50??BTM?0.590?
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王超瓊;陳玥;;原生廣告在利基社交網(wǎng)絡(luò)中的傳播策略探析[J];現(xiàn)代營銷(信息版);2019年08期
2 張艷菊;楊明;;社交網(wǎng)絡(luò)時代下的企業(yè)營銷模式淺析[J];現(xiàn)代經(jīng)濟(jì)信息;2019年13期
3 陳健;周麗華;;大學(xué)生社交網(wǎng)絡(luò)自我表露的實(shí)證研究[J];高校輔導(dǎo)員學(xué)刊;2018年06期
4 譚洪旭;袁帥;代連奇;任利峰;;淺談社交網(wǎng)絡(luò)對當(dāng)代大學(xué)生的影響[J];產(chǎn)業(yè)與科技論壇;2018年24期
5 孫夏卿;;社交網(wǎng)絡(luò)媒體對大學(xué)生賦權(quán)的價值體現(xiàn)[J];傳播力研究;2018年31期
6 張曉飛;;以社交網(wǎng)絡(luò)為基礎(chǔ)的企業(yè)營銷策略[J];商場現(xiàn)代化;2018年22期
7 孫國強(qiáng);竇倩倩;張寶建;;西方社交網(wǎng)絡(luò)研究進(jìn)展與未來展望[J];情報科學(xué);2019年02期
8 陳文泰;李衛(wèi)東;;國際社交網(wǎng)絡(luò)中“國家實(shí)在”傳播與國家形象演化機(jī)制研究[J];新聞大學(xué);2018年06期
9 孫晉;沈紅;;社交網(wǎng)絡(luò)群體性迷失現(xiàn)象分析[J];電腦知識與技術(shù);2019年12期
10 鄧華闖;項祎麟;周楠;周子清;;社交網(wǎng)絡(luò)招聘有效性影響因素研究[J];中小企業(yè)管理與科技(上旬刊);2019年04期
相關(guān)博士學(xué)位論文 前10條
1 劉曉君;基于在線社交網(wǎng)絡(luò)的口碑信息傳播模型研究[D];大連理工大學(xué);2018年
2 杜雨露;活動社交網(wǎng)絡(luò)中上下文感知的群組推薦方法研究[D];北京郵電大學(xué);2019年
3 寇菲菲;基于語義學(xué)習(xí)與時空特性的在線社交網(wǎng)絡(luò)跨媒體搜索研究[D];北京郵電大學(xué);2019年
4 李曉;在線社交網(wǎng)絡(luò)中的影響力分析及應(yīng)用研究[D];北京郵電大學(xué);2019年
5 朱添田;基于數(shù)據(jù)驅(qū)動的移動互聯(lián)網(wǎng)異常用戶行為檢測方法及其應(yīng)用研究[D];浙江大學(xué);2019年
6 王健;突發(fā)公共事件背景下在線社交網(wǎng)絡(luò)信息擴(kuò)散及治理研究[D];南京師范大學(xué);2018年
7 唐興;線上社交網(wǎng)絡(luò)中用戶個體行為挖掘方法研究[D];西安電子科技大學(xué);2016年
8 陳偉;社交網(wǎng)絡(luò)與時空數(shù)據(jù)連接的關(guān)鍵技術(shù)及應(yīng)用研究[D];蘇州大學(xué);2018年
9 侯瑞琪;社交網(wǎng)絡(luò)情形下線上零售商的服務(wù)投資優(yōu)化研究[D];中國科學(xué)技術(shù)大學(xué);2018年
10 聶原平;面向社交網(wǎng)絡(luò)的文本分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 周玉江;謠言在社交網(wǎng)絡(luò)上的傳播與控制策略研究[D];深圳大學(xué);2018年
2 鄭赫慈;網(wǎng)絡(luò)空間中人格分析的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
3 毛雨;基于社交網(wǎng)絡(luò)的用戶人格分析研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
4 石巖松;基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)跨媒體大數(shù)據(jù)搜索研究[D];北京郵電大學(xué);2019年
5 翁羽軒;學(xué)術(shù)社交網(wǎng)絡(luò)多媒體數(shù)據(jù)加密方案的設(shè)計與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
6 薛航;基于內(nèi)容和社交網(wǎng)絡(luò)的文本推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
7 汪溯;基于社交網(wǎng)絡(luò)情感分析的股價實(shí)時預(yù)測系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
8 孫陳娜;在線社交網(wǎng)絡(luò)中社交廣告投放算法研究[D];北京郵電大學(xué);2019年
9 李智;面向社交網(wǎng)絡(luò)的熱點(diǎn)商品導(dǎo)購算法研究[D];北京郵電大學(xué);2019年
10 張克迪;基于文本分析的企業(yè)社交網(wǎng)絡(luò)員工互動方式探索[D];北京郵電大學(xué);2019年
本文編號:2879413
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2879413.html