基于短文本處理算法優(yōu)化的文本信息推薦系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于短文本處理算法優(yōu)化的文本信息推薦系統(tǒng)的設(shè)計與實現(xiàn) 出處:《北京交通大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 短文本 特征詞 K-means聚類算法 用戶興趣模型 文本推薦系統(tǒng)
【摘要】:"麥圈"作為推薦聚合類資訊產(chǎn)品,以"微博"用戶行為數(shù)據(jù)包括發(fā)布、分享、轉(zhuǎn)發(fā)等數(shù)據(jù)為基礎(chǔ),構(gòu)建用戶興趣模型,并依賴于該模型向用戶定向推薦資訊類內(nèi)容。如何為用戶精準的推薦信息成為了平臺新的研究方向,因此,用戶興趣模型的構(gòu)建是推薦系統(tǒng)中最重要的環(huán)節(jié),而微博所蘊含的海量文本信息為個性化推薦提供了分析用戶興趣模型的信息數(shù)據(jù)源。然而由于微博文本數(shù)據(jù)長度較短,用戶的興趣多樣化,系統(tǒng)推薦的效果不太理想,因此,對短文本處理算法的優(yōu)化是提升系統(tǒng)推薦準確度和穩(wěn)定性的關(guān)鍵點。本文設(shè)計的基于短文本的文本信息推薦系統(tǒng),首先依據(jù)用戶的微博行為數(shù)據(jù)構(gòu)建用戶興趣模型,其次將待推薦的文本信息進行聚類分析,并與興趣模型進行相似性計算,最后將結(jié)果推薦給用戶瀏覽,同時將用戶的評分數(shù)據(jù)反饋推薦系統(tǒng),用于用戶興趣模型的更新優(yōu)化。其中,向量空間模型是文本結(jié)構(gòu)化表示、用戶興趣模型構(gòu)建以及相似度計算的基礎(chǔ)模型。本文的文本推薦系統(tǒng)基于短文本處理算法的優(yōu)化以及用戶興趣模型的構(gòu)建實現(xiàn)。首先針對微博短文本數(shù)據(jù)特點,在短文本預(yù)處理階段,為了提升文本特征詞的表征能力,在詞項TF-IDF加權(quán)計算的基礎(chǔ)上提出基于語義相關(guān)聯(lián)的短文本特征詞提取算法。然后,在短文本的聚類算法中,本文針對K-means算法對噪聲敏感以及對初始中心選取存在依賴性問題,提出了將相似性度量作為初始中心計算的依據(jù)思路,并實現(xiàn)了基于相似中心的cK-means短文本聚類算法的設(shè)計方案,同時基于短文本算法的優(yōu)化構(gòu)建了用戶興趣模型。最后,本文將優(yōu)化后的用戶興趣模型應(yīng)用到具體的文本推薦系統(tǒng)中,給出了系統(tǒng)的整體框架,并詳細敘述了推薦系統(tǒng)核心模塊的實現(xiàn)細節(jié)以及系統(tǒng)測試分析。對短文本處理算優(yōu)化的驗證結(jié)果表明,本文提出的基于語義相關(guān)的文本特征詞提取算法以及cK-means文本聚類算法準確度均有所提升,同時基于短文本處理算法優(yōu)化的用戶興趣模型更適用于對短文本的興趣聚合。對文本推薦系統(tǒng)的橫向測試和縱向測試顯示,基于短文本處理算法優(yōu)化的用戶興趣模型應(yīng)用到文本推薦系統(tǒng)之后,推薦系統(tǒng)的準確度和穩(wěn)定性相比之前均有所提升。
[Abstract]:In this paper , based on the user ' s micro blog behavior data , this paper proposes a design scheme of user interest model based on the user ' s micro blog behavior data .
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前10條
1 黃賢英;陳紅陽;劉英濤;熊李媛;;一種新的微博短文本特征詞選擇算法[J];計算機工程與科學(xué);2015年09期
2 劉海峰;姚澤清;蘇展;;基于詞頻的優(yōu)化互信息文本特征選擇方法[J];計算機工程;2014年07期
3 程傳鵬;蘇安婕;;一種短文本特征詞提取的方法[J];計算機應(yīng)用與軟件;2014年06期
4 詹志建;楊小平;;基于語言網(wǎng)絡(luò)和語義信息的文本相似度計算[J];計算機工程與應(yīng)用;2014年05期
5 成衛(wèi)青;唐旋;;一種基于改進互信息和信息熵的文本特征選擇方法[J];南京郵電大學(xué)學(xué)報(自然科學(xué)版);2013年05期
6 朱國瑋;周利;;基于遺忘函數(shù)和領(lǐng)域最近鄰的混合推薦研究[J];管理科學(xué)學(xué)報;2012年05期
7 于洪;李轉(zhuǎn)運;;基于遺忘曲線的協(xié)同過濾推薦算法[J];南京大學(xué)學(xué)報(自然科學(xué)版);2010年05期
8 伊雯雯;何福男;;基于用戶瀏覽行為的用戶興趣模型的表示及更新[J];常州信息職業(yè)技術(shù)學(xué)院學(xué)報;2010年04期
9 王剛;邱玉輝;;基于本體及相似度的文本聚類研究[J];計算機應(yīng)用研究;2010年07期
10 黃國言;李有超;高建培;常旭亮;;基于項目屬性的用戶聚類協(xié)同過濾推薦算法[J];計算機工程與設(shè)計;2010年05期
相關(guān)碩士學(xué)位論文 前1條
1 倪衛(wèi)杰;基于用戶興趣模型的個性化論文推薦系統(tǒng)研究[D];天津大學(xué);2010年
,本文編號:1368518
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/1368518.html