一種面向企業(yè)的行業(yè)微博信息推薦方法
【圖文】:
86計(jì)算機(jī)應(yīng)用與軟件2014年圖12012年2月新浪企業(yè)微博行業(yè)分布雖然微博平臺(tái)包含了各種行業(yè)信息,而且對(duì)于行業(yè)事件的反應(yīng)很快,但是在其上獲取較為全面的行業(yè)信息面臨諸多困難。微博平臺(tái)的興起和用戶的快速增長(zhǎng)帶來(lái)了信息過(guò)載問(wèn)題,隨著用戶關(guān)注數(shù)量的增加,與行業(yè)無(wú)關(guān)的內(nèi)容也越來(lái)越多地出現(xiàn)在用戶訂閱的微博中。加之微博平臺(tái)本身也具有主題分散和信息碎片化的特點(diǎn)。這就要求能夠識(shí)別企業(yè)微博用戶的行業(yè)興趣,并對(duì)微博信息依照行業(yè)相關(guān)度進(jìn)行提取和推薦。然而,現(xiàn)有的社交媒體管理與分析軟件在行業(yè)信息提取方面大多僅僅利用用戶自定義關(guān)鍵詞來(lái)進(jìn)行簡(jiǎn)單的文字匹配,這種方法存在較大缺陷。首先,個(gè)別關(guān)鍵詞并不能全面刻畫行業(yè)信息需求;其次,語(yǔ)言的豐富性使得簡(jiǎn)單的文字匹配效果很受限。本文針對(duì)以上問(wèn)題提出了一種基于行業(yè)語(yǔ)料的行業(yè)信息推薦方法。行業(yè)語(yǔ)料的來(lái)源方面,由于企業(yè)微博所發(fā)信息具有較強(qiáng)的行業(yè)相關(guān)性,所以行業(yè)相關(guān)用戶的歷史微博是行業(yè)語(yǔ)料的主要來(lái)源。對(duì)行業(yè)語(yǔ)料采用關(guān)鍵詞提取和用戶自定義關(guān)鍵詞擴(kuò)展技術(shù)相融合的方法建模用戶的行業(yè)興趣,從而兼顧了行業(yè)信息的全面刻畫與用戶興趣的動(dòng)態(tài)改變。最后,通過(guò)比較行業(yè)興趣與待過(guò)濾微博的相關(guān)性來(lái)提取和推薦行業(yè)相關(guān)微博信息。1相關(guān)工作微博等社交媒體促使了學(xué)術(shù)界一個(gè)新興的研究分支———社交媒體分析SMA(SocialMediaAnalytics)的興起。Melville等人提出了SMA需要解決的四大關(guān)鍵問(wèn)題[7],即相關(guān)挖掘、影響力識(shí)別、情感分析和話題檢測(cè),Leskovec又將SMA的問(wèn)題進(jìn)一步細(xì)化[8]。在國(guó)內(nèi),基于微博的研究工作近年來(lái)也獲得了越來(lái)越多的關(guān)注。文坤梅等人對(duì)基于中文微博的研究工作進(jìn)行了綜述[9]。在國(guó)內(nèi),計(jì)算機(jī)學(xué)科內(nèi)關(guān)于社交媒體分析的相關(guān)研究剛剛起步,相關(guān)研
保囝沒(méi)ё遠(yuǎn)ㄒ騫丶憧誓芄輝諞歡ǔ潭壬轄餼隼?啟動(dòng)現(xiàn)象。本方法主要分為數(shù)據(jù)獲取與預(yù)處理、行業(yè)關(guān)鍵詞提娶用戶自定義關(guān)鍵詞擴(kuò)展以及個(gè)性化微博推薦四大組成部分。首先,獲取用戶相關(guān)微博信息進(jìn)行數(shù)據(jù)預(yù)處理;之后數(shù)據(jù)分別交由關(guān)鍵詞提取與關(guān)鍵詞擴(kuò)展模塊,關(guān)鍵詞提取將基于TextRank算法無(wú)指導(dǎo)地進(jìn)行,關(guān)鍵詞擴(kuò)展將基于用戶自定義關(guān)鍵詞使用P-IOW算法進(jìn)行;之后將二者的結(jié)果根據(jù)用戶自定義權(quán)重進(jìn)行線性合并;合并結(jié)果供相關(guān)推薦模塊進(jìn)行相關(guān)度比較,以對(duì)待推薦微博生成相關(guān)性評(píng)分,從而達(dá)到推薦相關(guān)微博的目的。處理流程如圖2所示。圖2方法整體流程圖示2.1數(shù)據(jù)獲取與預(yù)處理本文基于行業(yè)相關(guān)語(yǔ)料進(jìn)行關(guān)鍵詞提取與關(guān)鍵詞擴(kuò)展。行業(yè)相關(guān)語(yǔ)料的來(lái)源可以是該用戶的歷史微博語(yǔ)料,也可以是用戶指定的若干個(gè)本行業(yè)相關(guān)企業(yè)用戶的歷史微博語(yǔ)料。在經(jīng)過(guò)對(duì)若干行業(yè)微博的分析后,本文發(fā)現(xiàn)名詞能夠較準(zhǔn)
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 宋雙永;李秋丹;;面向移動(dòng)終端的微博信息推薦方法[J];計(jì)算機(jī)科學(xué);2011年11期
2 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報(bào);2012年06期
3 程亮;邱云飛;孫魯;;微博謠言檢測(cè)方法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年02期
4 李瑩;;對(duì)于企業(yè)微博營(yíng)銷的發(fā)展現(xiàn)狀與展望[J];價(jià)值工程;2012年31期
5 趙春芳;;淺談中小企業(yè)如何走出微博營(yíng)銷困境[J];現(xiàn)代商業(yè);2012年21期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識(shí)別[J];系統(tǒng)工程;2013年09期
2 劉喜文;鄭昌興;王文龍;湯剛強(qiáng);;構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)過(guò)程中的數(shù)據(jù)清洗研究[J];圖書與情報(bào);2013年05期
3 季芳;;中小企業(yè)實(shí)施微博營(yíng)銷策略分析[J];四川職業(yè)技術(shù)學(xué)院學(xué)報(bào);2013年05期
4 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務(wù);2013年12期
5 潘善亮;茅琴嬌;韓露;;一種基于虛擬社交化的Web服務(wù)發(fā)現(xiàn)方法研究[J];電信科學(xué);2013年12期
6 易軍凱;田立康;;基于類別區(qū)分度的文本特征選擇算法研究[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年S1期
7 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁(yè)主題特征項(xiàng)抽取[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年01期
8 顧益軍;解易;張培晶;;面向有組織犯罪分析的人際關(guān)系網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)價(jià)研究[J];中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
9 吳瑞紅;呂學(xué)強(qiáng);;基于互聯(lián)網(wǎng)的術(shù)語(yǔ)定義辨析[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
10 羅琦;;一種最大分類間隔SVDD的多類文本分類算法[J];電訊技術(shù);2014年04期
相關(guān)會(huì)議論文 前1條
1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 劉馨月;Web挖掘中的鏈接分析與話題檢測(cè)研究[D];大連理工大學(xué);2012年
2 馬飛;云數(shù)據(jù)中心中虛擬機(jī)放置和實(shí)時(shí)遷移研究[D];北京交通大學(xué);2013年
3 樂(lè)承毅;企業(yè)知識(shí)與員工知識(shí)貢獻(xiàn)度集成評(píng)價(jià)方法及應(yīng)用研究[D];浙江大學(xué);2013年
4 孫甲申;基于主題模型和隨機(jī)游走的標(biāo)簽技術(shù)研究[D];北京郵電大學(xué);2013年
5 張鵬;數(shù)據(jù)中心網(wǎng)絡(luò)的流量管理和優(yōu)化問(wèn)題研究[D];北京郵電大學(xué);2013年
6 王寶勛;面向網(wǎng)絡(luò)社區(qū)問(wèn)答對(duì)的語(yǔ)義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
7 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
8 張俊三;Web中相關(guān)實(shí)體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年
9 尹莉;基礎(chǔ)數(shù)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)實(shí)證分析[D];西北大學(xué);2013年
10 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 高雅;微博新聞事件信息可信度評(píng)價(jià)[D];吉林大學(xué);2013年
2 耿玉嬌;MapReduce中基于抽樣技術(shù)的傾斜問(wèn)題研究[D];大連海事大學(xué);2013年
3 芮虎;比價(jià)購(gòu)物平臺(tái)中網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[D];華東理工大學(xué);2013年
4 王梓;林產(chǎn)品貿(mào)易信息用戶興趣模型及個(gè)性化搜索[D];北京林業(yè)大學(xué);2013年
5 牛雷;分布式多媒體平臺(tái)中視頻搜索技術(shù)的研究與應(yīng)用[D];北京郵電大學(xué);2013年
6 胡瑩;移動(dòng)微博持續(xù)使用行為影響因素研究[D];北京郵電大學(xué);2013年
7 林哲;面向行業(yè)的信息融合原型系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
8 萬(wàn)德穩(wěn);藏文搜索和搜索結(jié)果聚類研究及系統(tǒng)實(shí)現(xiàn)[D];西南交通大學(xué);2013年
9 閻正喜;H基金公司網(wǎng)上交易系統(tǒng)安全問(wèn)題研究[D];西南交通大學(xué);2013年
10 陳彥敏;基于聯(lián)合條件熵的文本特征提取算法的研究及其應(yīng)用[D];華東師范大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 閆瑞;曹先彬;李凱;;面向短文本的動(dòng)態(tài)組合分類算法[J];電子學(xué)報(bào);2009年05期
2 廖祥文;曹冬林;方濱興;許洪波;程學(xué)旗;;基于概率推理模型的博客傾向性檢索研究[J];計(jì)算機(jī)研究與發(fā)展;2009年09期
3 杜偉夫;譚松波;云曉春;程學(xué)旗;;一種新的情感詞匯語(yǔ)義傾向計(jì)算方法[J];計(jì)算機(jī)研究與發(fā)展;2009年10期
4 何菲;;微博營(yíng)銷第N種可能——超越粉絲[J];IT經(jīng)理世界;2011年09期
5 鄭斐然;苗奪謙;張志飛;高燦;;一種中文微博新聞話題檢測(cè)的方法[J];計(jì)算機(jī)科學(xué);2012年01期
6 陳可,張琴舜,陳培培,蔡日基;BP神經(jīng)網(wǎng)絡(luò)在證券分析預(yù)測(cè)中應(yīng)用[J];計(jì)算機(jī)工程;2001年11期
7 林小俊;張猛;暴筱;李軍;吳璽宏;;基于概念網(wǎng)絡(luò)的短文本分類方法[J];計(jì)算機(jī)工程;2010年21期
8 許曉東;肖銀濤;朱士瑞;;微博社區(qū)的謠言傳播仿真研究[J];計(jì)算機(jī)工程;2011年10期
9 李文波;孫樂(lè);張大鯤;;基于Labeled-LDA模型的文本分類新算法[J];計(jì)算機(jī)學(xué)報(bào);2008年04期
10 曹娟;張勇東;李錦濤;唐勝;;一種基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法[J];計(jì)算機(jī)學(xué)報(bào);2008年10期
,本文編號(hào):2584637
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2584637.html