基于分類模型的廣告推薦方法研究
發(fā)布時(shí)間:2017-05-17 16:20
本文關(guān)鍵詞:基于分類模型的廣告推薦方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:伴隨著互聯(lián)網(wǎng)數(shù)據(jù)爆炸式地增長(zhǎng),用戶面對(duì)的信息量和種類也越來越多,海量數(shù)據(jù)挖掘技術(shù)在個(gè)性化推薦系統(tǒng)中的應(yīng)用成為了一個(gè)研究熱點(diǎn)。 本文首先總結(jié)了常見的幾類推薦方法,主要包括協(xié)同過濾方法、基于內(nèi)容的推薦方法和混合推薦方法,以及它們涉及到的數(shù)據(jù)挖掘技術(shù),并分析了這幾類方法的優(yōu)點(diǎn)與不足。在此基礎(chǔ)上,本文從廣告推薦問題入手,介紹了計(jì)算廣告的相關(guān)概念和方法,并引出了兩種基于內(nèi)容的廣告推薦方法,即單標(biāo)記分類模型和多標(biāo)記分類模型。 論文的主要工作如下。第一,我們結(jié)合Hadoop平臺(tái)實(shí)現(xiàn)了針對(duì)某互聯(lián)網(wǎng)公司提供的廣告日志數(shù)據(jù)的可視化統(tǒng)計(jì)與分析工具,利用該工具對(duì)數(shù)據(jù)進(jìn)行分析并發(fā)現(xiàn)了特征之間和廣告之間的依賴關(guān)系。第二,提出了利用非廣告特征和廣告特征依賴關(guān)系的單標(biāo)記分類模型的一種改進(jìn)方法,其利用了互信息來選擇組合特征從而加入特征之間的依賴關(guān)系。第三,提出了利用廣告之間依賴關(guān)系的多標(biāo)記分類模型改進(jìn)方法,其通過一種啟發(fā)式的方法來構(gòu)建分類器鏈從而更好地利用廣告之間的依賴關(guān)系。最后,在Hadoop平臺(tái)上的設(shè)計(jì)了相關(guān)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明這兩種改進(jìn)方法都能夠比改進(jìn)前的方法得到更好的結(jié)果。因此,無論是特征之間還是廣告之間的依賴關(guān)系,都是廣告推薦問題中不可忽視的影響因素。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 推薦系統(tǒng) 多標(biāo)記分類
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 致謝5-6
- 中文摘要6-7
- ABSTRACT7-10
- 1 引言10-12
- 1.1 研究背景和意義10-11
- 1.2 本文主要工作11
- 1.3 本文組織結(jié)構(gòu)11-12
- 2 推薦系統(tǒng)綜述12-23
- 2.1 問題定義13-14
- 2.2 協(xié)同過濾推薦14-17
- 2.2.1 相似度計(jì)算15-16
- 2.2.2 冷啟動(dòng)問題16-17
- 2.2.3 數(shù)據(jù)稀疏性17
- 2.3 基于內(nèi)容的推薦17-20
- 2.3.1 特征提取18
- 2.3.2 效用函數(shù)與模型18-19
- 2.3.3 制約因素19-20
- 2.4 混合型推薦20-21
- 2.4.1 兩種獨(dú)立方法的結(jié)合20
- 2.4.2 協(xié)同過濾中加入內(nèi)容特性20
- 2.4.3 基于內(nèi)容方法中加入?yún)f(xié)同過濾20-21
- 2.4.4 建立單個(gè)統(tǒng)一的推薦模型21
- 2.5 本章總結(jié)21-23
- 3 在線廣告推薦23-33
- 3.1 計(jì)算廣告24-25
- 3.2 點(diǎn)擊率(CTR)預(yù)估25-28
- 3.2.1 點(diǎn)擊率預(yù)估的意義25-26
- 3.2.2 點(diǎn)擊率預(yù)估框架26-28
- 3.3 基于分類器的廣告推薦28-32
- 3.3.1 情景感知(Context-Aware)28-29
- 3.3.2 傳統(tǒng)分類模型29-30
- 3.3.3 多標(biāo)記分類模型30-32
- 3.4 本章總結(jié)32-33
- 4 基于分類器的方法改進(jìn)33-48
- 4.1 單標(biāo)記分類模型改進(jìn)——NBkPlus算法33-39
- 4.1.1 樸素貝葉斯33-35
- 4.1.2 特征間的依賴關(guān)系35-38
- 4.1.3 一種基于互信息的改進(jìn)38-39
- 4.2 多標(biāo)記分類模型改進(jìn)—OCC算法39-47
- 4.2.1 分類器鏈算法40-42
- 4.2.2 廣告間的依賴關(guān)系42-44
- 4.2.3 一種啟發(fā)式的改進(jìn)44-47
- 4.3 本章總結(jié)47-48
- 5 實(shí)驗(yàn)及結(jié)果分析48-59
- 5.1 實(shí)驗(yàn)平臺(tái)48-49
- 5.2 實(shí)驗(yàn)數(shù)據(jù)49-52
- 5.2.1 數(shù)據(jù)特征50
- 5.2.2 數(shù)據(jù)可視化工具50-52
- 5.3 評(píng)價(jià)指標(biāo)52-53
- 5.4 NBkPlus算法結(jié)果及分析53-55
- 5.4.1 特征間的互信息53-55
- 5.4.2 AUC結(jié)果及分析55
- 5.5 OCC算法結(jié)果及分析55-58
- 5.5.1 廣告數(shù)據(jù)集實(shí)驗(yàn)55-56
- 5.5.2 多標(biāo)記標(biāo)準(zhǔn)測(cè)試集實(shí)驗(yàn)56-58
- 5.6 本章總結(jié)58-59
- 6 總結(jié)與展望59-60
- 參考文獻(xiàn)60-64
- 作者簡(jiǎn)歷64-66
- 學(xué)位論文數(shù)據(jù)集66
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前2條
1 周傲英;周敏奇;宮學(xué)慶;;計(jì)算廣告:以數(shù)據(jù)為核心的Web綜合應(yīng)用[J];計(jì)算機(jī)學(xué)報(bào);2011年10期
2 李哲;王志海;何穎婧;付彬;;一種啟發(fā)式多標(biāo)記分類器選擇與排序策略[J];中文信息學(xué)報(bào);2013年04期
本文關(guān)鍵詞:基于分類模型的廣告推薦方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):373826
本文鏈接:http://www.sikaile.net/wenyilunwen/guanggaoshejilunwen/373826.html
最近更新
教材專著