基于機(jī)器學(xué)習(xí)的移動應(yīng)用推薦系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于機(jī)器學(xué)習(xí)的移動應(yīng)用推薦系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 推薦系統(tǒng) 機(jī)器學(xué)習(xí) 概率潛在語義分析 在線學(xué)習(xí)
【摘要】:隨著移動互聯(lián)網(wǎng)的發(fā)展,移動應(yīng)用(APP)累計數(shù)量達(dá)到百萬級別,其中長尾現(xiàn)象非常嚴(yán)重,大量的冷門APP掩蓋在熱門APP下,未能被用戶注意到。APP關(guān)聯(lián)推薦系統(tǒng)希望在用戶瀏覽當(dāng)前APP的同時,為其推薦與之相關(guān)的其他APP,進(jìn)而擴(kuò)大整體的分發(fā)數(shù)量。 本文所述的移動應(yīng)用推薦系統(tǒng)基于百度公司的移動應(yīng)用分發(fā)平臺,該平臺已經(jīng)完成了初版的APP關(guān)聯(lián)推薦系統(tǒng)。本文的工作正是在原有的APP推薦基礎(chǔ)上,提出新的APP推薦模型,具體包括以下幾個方面: 在APP推薦系統(tǒng)中引入機(jī)器學(xué)習(xí)技術(shù),將關(guān)聯(lián)APP的每次點(diǎn)擊與否作為兩類分類問題,借鑒了定向廣告系統(tǒng)點(diǎn)擊率預(yù)估的思路。對比了應(yīng)用廣泛的幾種機(jī)器學(xué)習(xí)分類算法在APP推薦問題上的效果,并且通過實(shí)驗結(jié)果來分析說明不同分類效果的差異,從而得出在處理APP推薦問題的一般性結(jié)論。為了在語義層面衡量APP之間的相似性,引入主題模型,采用概率潛在語義分析(pLSA)技術(shù)來獲取APP的文本語義特征。語義特征相比詞項特征的泛化能力更強(qiáng)。 本文設(shè)計并實(shí)現(xiàn)了新模型的離線策略和在線推薦系統(tǒng)。新系統(tǒng)可以完成一整套的數(shù)據(jù)獲取、特征構(gòu)造、模型訓(xùn)練和線上服務(wù)的流程。并引入了在線學(xué)習(xí)(onlinelearning)方法,實(shí)時根據(jù)用戶行為調(diào)整關(guān)聯(lián)結(jié)果,以獲得更好的推薦效果。 改進(jìn)后的APP關(guān)聯(lián)推薦系統(tǒng)已經(jīng)上線,,為百度移動應(yīng)用分發(fā)平臺,包括PC端和手機(jī)端提供更加準(zhǔn)確的APP相關(guān)推薦服務(wù)。
【關(guān)鍵詞】:推薦系統(tǒng) 機(jī)器學(xué)習(xí) 概率潛在語義分析 在線學(xué)習(xí)
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3;TP18
【目錄】:
- 摘要3-4
- Abstract4-8
- 第1章 引言8-11
- 1.1 背景與現(xiàn)狀8-9
- 1.2 本文的工作9-10
- 1.3 論文章節(jié)安排10-11
- 第2章 推薦系統(tǒng)相關(guān)研究11-16
- 2.1 推薦系統(tǒng)概述11-12
- 2.2 基于內(nèi)容的推薦12
- 2.3 協(xié)同過濾推薦12-15
- 2.4 本章小結(jié)15-16
- 第3章 推薦問題定義與屬性構(gòu)造16-27
- 3.1 APP 推薦問題——有監(jiān)督學(xué)習(xí)16-17
- 3.2 文本屬性構(gòu)造17-20
- 3.3 關(guān)鍵詞擴(kuò)展20
- 3.4 概率潛在語義分析20-23
- 3.5 基本特征構(gòu)造23-24
- 3.6 組合特征構(gòu)造24-25
- 3.7 本章小結(jié)25-27
- 第4章 機(jī)器學(xué)習(xí)模型技術(shù)原理27-39
- 4.1 支持向量機(jī)模型27-31
- 4.2 邏輯斯蒂回歸模型31-35
- 4.3 Online Learning35-38
- 4.4 本章小結(jié)38-39
- 第5章 實(shí)驗結(jié)果與分析39-45
- 5.1 離線評價指標(biāo)39-40
- 5.2 離線對比實(shí)驗40-43
- 5.3 線上效果對比43-44
- 5.4 本章小結(jié)44-45
- 第6章 系統(tǒng)設(shè)計與實(shí)現(xiàn)45-55
- 6.1 系統(tǒng)簡介45-48
- 6.2 數(shù)據(jù)處理模塊48-50
- 6.3 模型訓(xùn)練與預(yù)估模塊50-52
- 6.4 在線處理模塊52-53
- 6.5 本章小結(jié)53-55
- 第7章 總結(jié)與展望55-57
- 7.1 本文工作總結(jié)55-56
- 7.2 不足之處與進(jìn)一步工作56-57
- 參考文獻(xiàn)57-61
- 致謝61
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鐘志農(nóng);劉方馳;吳燁;伍江江;;主動學(xué)習(xí)與自學(xué)習(xí)的中文命名實(shí)體識別[J];國防科技大學(xué)學(xué)報;2014年04期
2 賈熹濱;張艷華;包錫元;;Kappa加權(quán)的子空間融合表情識別方法[J];北京工業(yè)大學(xué)學(xué)報;2014年06期
3 王樂;閉應(yīng)洲;;基于特征模板提取及SVM的觀點(diǎn)句識別[J];廣西師范學(xué)院學(xué)報(自然科學(xué)版);2014年03期
4 張吉文;陳笑蓉;;基于譜聚類的詞和文檔的聯(lián)合聚類[J];貴州大學(xué)學(xué)報(自然科學(xué)版);2014年05期
5 王秀華;秦振吉;;基于層次K-均值聚類的支持向量機(jī)模型[J];計算機(jī)應(yīng)用與軟件;2014年05期
6 許強(qiáng);馬登武;;基于傅立葉描述子主要系數(shù)的輪廓分類樹[J];計算機(jī)應(yīng)用;2014年S1期
7 吳秦;黃彥姣;;基于約束條件隨機(jī)場的Web對象屬性標(biāo)注[J];計算機(jī)科學(xué)與探索;2014年09期
8 謝慕哲;羅澤;閻保平;;視頻鳥類行為研究中基于尺度不變特征變換的形態(tài)分類算法[J];科研信息化技術(shù)與應(yīng)用;2014年03期
9 畢楷明;;碎紙片的拼接復(fù)原數(shù)學(xué)模型的構(gòu)建[J];價值工程;2014年25期
10 李浩騰;朱信忠;趙建民;曹存根;;基于EKEL的影評挖掘分析方法和系統(tǒng)[J];渤海大學(xué)學(xué)報(自然科學(xué)版);2014年03期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 顧奕哲;基于VSM模型的文檔表示和貝葉斯網(wǎng)絡(luò)的軟傳感器研究[D];華東理工大學(xué);2014年
2 張培倩;基于回歸策略的推薦算法研究[D];北京交通大學(xué);2014年
3 徐杰;基于超圖融合語義信息的圖像場景分類方法[D];北京交通大學(xué);2014年
4 翟強(qiáng);交通視覺中運(yùn)動目標(biāo)的魯棒性檢測[D];北京交通大學(xué);2014年
5 杜勝龍;地下植物根莖探測技術(shù)研究[D];南京理工大學(xué);2014年
6 趙峰;基于鑒別投影和回歸分類的人臉識別方法研究[D];南京理工大學(xué);2014年
7 彭新茗;基于多層學(xué)習(xí)的病歷實(shí)體識別算法設(shè)計與實(shí)現(xiàn)[D];東北大學(xué);2013年
8 羅凌;面向旅游領(lǐng)域的漢英統(tǒng)計機(jī)器翻譯關(guān)鍵技術(shù)研究[D];廈門大學(xué);2014年
9 張曉雪;基于概率圖模型的圖像語義分割技術(shù)研究[D];廈門大學(xué);2014年
10 胥光華;基于機(jī)器學(xué)習(xí)構(gòu)建的公司財務(wù)預(yù)警系統(tǒng)研究[D];廈門大學(xué);2014年
本文編號:1105337
本文鏈接:http://www.sikaile.net/wenyilunwen/guanggaoshejilunwen/1105337.html