天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 營銷論文 >

微博用戶興趣識(shí)別技術(shù)的研究與應(yīng)用

發(fā)布時(shí)間:2017-07-03 00:12

  本文關(guān)鍵詞:微博用戶興趣識(shí)別技術(shù)的研究與應(yīng)用


  更多相關(guān)文章: 主題模型 卷積神經(jīng)網(wǎng)絡(luò) 微博分類 用戶興趣識(shí)別


【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展及移動(dòng)終端的普及,網(wǎng)絡(luò)上出現(xiàn)了許多社交類的網(wǎng)站和應(yīng)用,微博由于其自身操作簡單,傳播快速等特性,聚集了大量用戶。每個(gè)用戶每天可以接收成百上千條微博,從而導(dǎo)致信息過載的問題,嚴(yán)重影響用戶對(duì)信息及知識(shí)的獲取。此外,越來越多的商家將微博作為營銷平臺(tái),因此如何完成高質(zhì)量的廣告定向投放也成為一個(gè)具有重要商業(yè)價(jià)值的問題。微博用戶的興趣識(shí)別可以幫助解決上述問題。本文的主要工作如下:本文首先嘗試了基于主題模型的用戶興趣識(shí)別。將用戶的微博集合看作一篇文檔,使用Labeled LDA主題模型對(duì)用戶微博文檔的主題進(jìn)行預(yù)測(cè),獲得的主題分布看作是用戶的興趣主題分布。該方法的問題是,當(dāng)興趣詞周圍存在大量噪聲詞時(shí),Labeled LDA主題模型對(duì)用戶興趣詞的主題分配會(huì)隨上下文而發(fā)生嚴(yán)重偏移,從而導(dǎo)致用戶興趣識(shí)別錯(cuò)誤。其次本文嘗試了基于微博分類的用戶興趣識(shí)別,通過對(duì)用戶的微博進(jìn)行逐條興趣分類,從而緩解噪聲詞對(duì)興趣詞的影響,然后通過用戶微博的興趣類別分布識(shí)別用戶興趣。嘗試了兩個(gè)分類器,一個(gè)是以二字串bigram作為特征單元的線性SVM,另一個(gè)是使用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的分類器。實(shí)驗(yàn)結(jié)果表明,基于微博分類的興趣識(shí)別方法的效果優(yōu)于基于主題模型的方法,但上述兩個(gè)分類器對(duì)于包含噪聲詞較多的微博分類效果還有提升空間。第三提出一種基于主題增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)的用戶興趣識(shí)別方法,通過構(gòu)建一個(gè)結(jié)合連續(xù)的語義特征和離散的主題特征的雙通道CNN作為微博分類器,對(duì)用戶的微博進(jìn)行興趣分類,通過極大似然估計(jì)得到微博用戶的興趣。實(shí)驗(yàn)結(jié)果表明使用融合主題信息的主題增強(qiáng)CNN將顯著提高用戶興趣識(shí)別的效果。最后一部分介紹了興趣模型的一個(gè)應(yīng)用,聊天機(jī)器人笨笨的新聞推薦模塊,該模塊基于LDA主題模型,負(fù)責(zé)為用戶提供個(gè)性化的新聞推薦服務(wù)。
【關(guān)鍵詞】:主題模型 卷積神經(jīng)網(wǎng)絡(luò) 微博分類 用戶興趣識(shí)別
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 緒論9-17
  • 1.1 課題背景及研究目的和意義9-11
  • 1.1.1 課題背景9-10
  • 1.1.2 課題研究的目的及意義10-11
  • 1.2 國內(nèi)外研究現(xiàn)狀11-14
  • 1.2.1 國外研究現(xiàn)狀11-13
  • 1.2.2 國內(nèi)研究現(xiàn)狀13-14
  • 1.3 本文的研究內(nèi)容及章節(jié)安排14-17
  • 1.3.1 本文的研究內(nèi)容14-15
  • 1.3.2 本文的章節(jié)安排15-17
  • 第2章 基于主題模型的用戶興趣識(shí)別17-27
  • 2.1 引言17
  • 2.2 Labeled LDA主題模型17-19
  • 2.2.1 主題生成過程17-19
  • 2.2.2 學(xué)習(xí)和預(yù)測(cè)19
  • 2.3 基于Labeled LDA主題模型的用戶興趣識(shí)別19-24
  • 2.3.1 興趣類別體系19-20
  • 2.3.2 實(shí)驗(yàn)數(shù)據(jù)20-21
  • 2.3.3 訓(xùn)練階段21-22
  • 2.3.4 預(yù)測(cè)階段22-23
  • 2.3.5 用戶興趣的獲取23-24
  • 2.4 實(shí)驗(yàn)結(jié)果及分析24-26
  • 2.4.1 評(píng)價(jià)標(biāo)準(zhǔn)24
  • 2.4.2 實(shí)驗(yàn)結(jié)果24-25
  • 2.4.3 實(shí)驗(yàn)結(jié)果分析25-26
  • 2.5 本章小結(jié)26-27
  • 第3章 基于微博分類的用戶興趣識(shí)別27-42
  • 3.1 引言27
  • 3.2 支持向量機(jī)27-32
  • 3.2.1 支持向量機(jī)簡介27-28
  • 3.2.2 線性支持向量機(jī)28-30
  • 3.2.3 多元分類SVM30-32
  • 3.3 卷積神經(jīng)網(wǎng)絡(luò)32-34
  • 3.3.1 卷積神經(jīng)網(wǎng)絡(luò)簡介32
  • 3.3.2 構(gòu)件32-34
  • 3.4 實(shí)驗(yàn)方法與數(shù)據(jù)34-36
  • 3.4.1 實(shí)驗(yàn)方法34-36
  • 3.4.2 實(shí)驗(yàn)數(shù)據(jù)36
  • 3.5 實(shí)驗(yàn)結(jié)果及分析36-40
  • 3.5.1 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)36-37
  • 3.5.2 微博分類實(shí)驗(yàn)結(jié)果37-38
  • 3.5.3 實(shí)例分析38-39
  • 3.5.4 用戶興趣識(shí)別實(shí)驗(yàn)結(jié)果39-40
  • 3.5.5 實(shí)驗(yàn)結(jié)果分析40
  • 3.6 本章小結(jié)40-42
  • 第4章 基于主題增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)的用戶興趣識(shí)別42-53
  • 4.1 引言42
  • 4.2 模型結(jié)構(gòu)42-44
  • 4.3 實(shí)驗(yàn)方法與數(shù)據(jù)44-45
  • 4.3.1 實(shí)驗(yàn)方法44-45
  • 4.3.2 實(shí)驗(yàn)數(shù)據(jù)45
  • 4.4 實(shí)驗(yàn)結(jié)果與分析45-52
  • 4.4.1 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)45
  • 4.4.2 微博分類實(shí)驗(yàn)結(jié)果45-46
  • 4.4.3 實(shí)例分析46-49
  • 4.4.4 用戶興趣識(shí)別實(shí)驗(yàn)結(jié)果49-51
  • 4.4.5 實(shí)驗(yàn)結(jié)果分析51-52
  • 4.5 本章小結(jié)52-53
  • 第5章 聊天機(jī)器人笨笨的新聞推薦模塊53-61
  • 5.1 引言53
  • 5.2 動(dòng)機(jī)53-54
  • 5.3 個(gè)性化新聞推薦54-55
  • 5.4 新聞推薦模塊的處理流程55-60
  • 5.5 新聞推薦模塊的效果60
  • 5.6 本章小結(jié)60-61
  • 結(jié)論61-62
  • 參考文獻(xiàn)62-67
  • 致謝67

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 王杰;使圖像的編輯更加容易[J];中文信息;1998年Z1期

2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期

3 董全德;;用戶興趣遷移模式與個(gè)性化服務(wù)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年17期

4 鄭運(yùn)剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報(bào)雜志;2008年01期

5 張濤;;基于瀏覽歷史的用戶興趣提取模型[J];軟件導(dǎo)刊;2009年06期

6 楊杰;陳恩紅;;面向個(gè)性化服務(wù)的用戶興趣偏移檢測(cè)及處理方法[J];電子技術(shù);2009年11期

7 陳圣兵;李龍澍;紀(jì)霞;;多層次用戶興趣模式的動(dòng)態(tài)捕捉[J];計(jì)算機(jī)工程與應(yīng)用;2009年36期

8 鄭曉健;龐淑英;何英;;一種面向主題的用戶興趣挖掘模型研究[J];昆明學(xué)院學(xué)報(bào);2010年03期

9 花青松;劉海峰;胡錚;;基于基尼系數(shù)的用戶興趣分布模式度量方法[J];計(jì)算機(jī)工程;2012年22期

10 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國內(nèi)用戶興趣建模研究進(jìn)展[J];情報(bào)雜志;2013年05期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條

1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(下)[C];2009年

2 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導(dǎo)航模型系統(tǒng)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年

4 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年

5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識(shí)別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年

6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

中國重要報(bào)紙全文數(shù)據(jù)庫 前1條

1 中國科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前8條

1 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個(gè)性化信息推薦[D];華東師范大學(xué);2012年

2 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2013年

3 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年

4 吳麗輝;個(gè)性化的Web信息采集技術(shù)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年

5 謝興;社會(huì)網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年

6 李東勝;基于興趣與保護(hù)隱私的在線社區(qū)推薦技術(shù)研究[D];復(fù)旦大學(xué);2012年

7 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年

8 姜邵巍;基于競爭關(guān)系的推薦技術(shù)研究[D];北京郵電大學(xué);2014年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 陳媛媛;用戶興趣圖譜演化機(jī)制研究[D];武漢理工大學(xué);2014年

2 梁潤庭(Runting Leung);面向微博用戶的興趣識(shí)別算法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年

3 俞忻峰;新浪微博的數(shù)據(jù)采集和推薦方案研究[D];南京理工大學(xué);2015年

4 楊梅;基于樹型網(wǎng)絡(luò)的多源用戶興趣數(shù)據(jù)融合方法研究[D];四川師范大學(xué);2015年

5 石光蓮;基于形式概念分析的Folksonomy用戶興趣識(shí)別研究[D];西南大學(xué);2015年

6 湯文清;微博用戶的興趣及性格分析[D];上海大學(xué);2015年

7 梅佩;基于瀏覽內(nèi)容的用戶興趣研究[D];北京化工大學(xué);2015年

8 張少杰;基于用戶興趣的微博廣告投放系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山西大學(xué);2015年

9 黃龍偉;基于蟻群算法的WEB日志用戶興趣路徑研究[D];江西師范大學(xué);2015年

10 方正;微博短文本分析技術(shù)研究及應(yīng)用[D];電子科技大學(xué);2014年


  本文關(guān)鍵詞:微博用戶興趣識(shí)別技術(shù)的研究與應(yīng)用


  更多相關(guān)文章: 主題模型 卷積神經(jīng)網(wǎng)絡(luò) 微博分類 用戶興趣識(shí)別




本文編號(hào):511772

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/yingxiaoguanlilunwen/511772.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶52085***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com