基于大數(shù)據(jù)的網(wǎng)絡(luò)廣告推送服務(wù)研究
本文關(guān)鍵詞:基于大數(shù)據(jù)的網(wǎng)絡(luò)廣告推送服務(wù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來(lái),隨著互聯(lián)網(wǎng)的迅猛發(fā)展以及大數(shù)據(jù)時(shí)代的來(lái)臨,傳統(tǒng)互聯(lián)網(wǎng)廣告投放的粗放性和無(wú)目標(biāo)性弊端越來(lái)越明顯,使得市場(chǎng)對(duì)精準(zhǔn)互聯(lián)網(wǎng)廣告的需求變得十分迫切。于是在此背景下誕生了一種新的廣告模式—大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)定向廣告,即通過(guò)一定的技術(shù)將廣告定向推送給目標(biāo)用戶。而以定向廣告為核心的網(wǎng)絡(luò)廣告推送服務(wù)也隨之而來(lái),雖然學(xué)術(shù)界目前對(duì)其已經(jīng)取得了一些研究成果,但廣告與目標(biāo)用戶失配的情況依然大量存在,如何有效提高推送服務(wù)中廣告與目標(biāo)用戶匹配的準(zhǔn)確度成了一個(gè)迫切需要解決的問(wèn)題。 廣告與目標(biāo)用戶準(zhǔn)確匹配的一個(gè)關(guān)鍵在于準(zhǔn)確地分析出用戶的興趣點(diǎn),進(jìn)而才能向其投放與之興趣吻合的廣告。數(shù)據(jù)管理平臺(tái)(DMP)是一個(gè)用戶數(shù)據(jù)分析平臺(tái),也是整個(gè)網(wǎng)絡(luò)廣告推送服務(wù)體系的核心,其主要功能是分析出用戶的上網(wǎng)興趣特征。論文將目光集中在該平臺(tái)中的行為定向廣告模塊,對(duì)其中用戶行為特征分析所涉及的一些技術(shù)進(jìn)行了認(rèn)真研究,包括網(wǎng)頁(yè)特征詞提取技術(shù)、相似網(wǎng)頁(yè)聚合方法、用戶行為分析算法等,隨后提出在原有相似網(wǎng)頁(yè)聚合方法的基礎(chǔ)上融入一種基于Redis的網(wǎng)頁(yè)類別判定方法,形成一個(gè)旨在提高相似網(wǎng)頁(yè)聚合準(zhǔn)確性的優(yōu)化策略。其準(zhǔn)確性越好,分析出的用戶興趣越精確。該優(yōu)化策略首先搜集各熱門行業(yè)的詞匯及其行業(yè)類別屬性,統(tǒng)一建模,建立Redis知識(shí)庫(kù),然后依據(jù)該知識(shí)庫(kù)以及相關(guān)判定算法實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)特征詞的行業(yè)類別判定,之后綜合所有特征詞的行業(yè)類別并通過(guò)權(quán)重值計(jì)算得出網(wǎng)頁(yè)的行業(yè)類別,最后將其與原相似網(wǎng)頁(yè)聚合中用到的向量空間模型和聚類算法等結(jié)合,重新定義聚合標(biāo)準(zhǔn),進(jìn)而達(dá)到提高相似網(wǎng)頁(yè)聚合準(zhǔn)確性的目的。之后又參考該優(yōu)化策略,將基于Redis的網(wǎng)頁(yè)類別判定融入到用戶興趣與廣告匹配的過(guò)程中,同樣改善了廣告與目標(biāo)用戶的匹配效果。 最后,論文設(shè)計(jì)并實(shí)現(xiàn)了數(shù)據(jù)管理平臺(tái)子模塊,并選取北京交通大學(xué)信息中心部分網(wǎng)絡(luò)日志作為數(shù)據(jù)源,以網(wǎng)頁(yè)相似性聚合準(zhǔn)確率和召回率、廣告匹配準(zhǔn)確率和召回率作為評(píng)價(jià)指標(biāo),分別對(duì)優(yōu)化前后的相似網(wǎng)頁(yè)聚合效果以及優(yōu)化前后廣告匹配效果進(jìn)行對(duì)比分析,之后得出優(yōu)化后的四個(gè)評(píng)價(jià)指標(biāo)在一定程度上都有相應(yīng)提高,最終驗(yàn)證了論文提出的優(yōu)化方法對(duì)提高相似網(wǎng)頁(yè)聚合準(zhǔn)確性以及廣告與目標(biāo)用戶匹配的準(zhǔn)確度有所幫助。
【關(guān)鍵詞】:定向廣告匹配 行為特征分析 相似網(wǎng)頁(yè)聚合 網(wǎng)頁(yè)類別判定 Redis
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.52
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-12
- 1 引言12-21
- 1.1 選題背景和意義12-15
- 1.1.1 互聯(lián)網(wǎng)發(fā)展現(xiàn)狀12-13
- 1.1.2 聯(lián)網(wǎng)廣告13-15
- 1.1.3 研究意義15
- 1.2 研究現(xiàn)狀15-19
- 1.2.1 網(wǎng)絡(luò)定向廣告推送服務(wù)平臺(tái)15-16
- 1.2.2 網(wǎng)絡(luò)定向廣告種類16-17
- 1.2.3 網(wǎng)絡(luò)定向廣告投放技術(shù)17-19
- 1.3 研究?jī)?nèi)容與目標(biāo)19
- 1.4 論文組織結(jié)構(gòu)19-21
- 2 網(wǎng)絡(luò)定向廣告推送服務(wù)體系21-30
- 2.1 網(wǎng)絡(luò)定向廣告推送服務(wù)功能架構(gòu)21-22
- 2.2 數(shù)據(jù)管理平臺(tái)22-26
- 2.2.1 用戶上網(wǎng)數(shù)據(jù)預(yù)處理23-24
- 2.2.2 用戶行為特征分析24-26
- 2.2.3 數(shù)據(jù)更新26
- 2.3 需求方平臺(tái)26-29
- 2.3.1 廣告計(jì)價(jià)模式27-28
- 2.3.2 實(shí)時(shí)競(jìng)價(jià)(RTB)28-29
- 2.4 本章小結(jié)29-30
- 3 用戶行為特征分析關(guān)鍵技術(shù)30-40
- 3.1 Hadoop平臺(tái)30-32
- 3.1.1 Mapreduce并行計(jì)算框架30-31
- 3.1.2 HDFS分布式文件系統(tǒng)31-32
- 3.2 基于jsoup的HTML解析方法32-33
- 3.3 向量空間模型33-35
- 3.4 聚類算法35-37
- 3.5 用戶行為分析算法37-39
- 3.5.1 特征新鮮度37-38
- 3.5.2 特征離散度38-39
- 3.5.3 離散因子39
- 3.6 本章小結(jié)39-40
- 4 用戶行為特征分析相關(guān)技術(shù)優(yōu)化40-52
- 4.1 基于Redis的網(wǎng)頁(yè)類別判定40-49
- 4.1.1 Redis簡(jiǎn)介41-43
- 4.1.2 設(shè)計(jì)方案概述43-44
- 4.1.3 知識(shí)庫(kù)的建立44-46
- 4.1.4 網(wǎng)頁(yè)類別判定的實(shí)現(xiàn)46-49
- 4.2 相似網(wǎng)頁(yè)聚合優(yōu)化49-51
- 4.3 本章小結(jié)51-52
- 5 數(shù)據(jù)管理平臺(tái)子模塊的實(shí)現(xiàn)52-61
- 5.1 概要設(shè)計(jì)52-53
- 5.2 Hadoop平臺(tái)搭建53-55
- 5.3 功能模塊實(shí)現(xiàn)55-60
- 5.3.1 數(shù)據(jù)預(yù)處理55-56
- 5.3.2 網(wǎng)頁(yè)特征詞提取56-57
- 5.3.3 相似網(wǎng)頁(yè)聚合57-59
- 5.3.5 行為特征分析59-60
- 5.4 本章小結(jié)60-61
- 6 實(shí)驗(yàn)結(jié)果及分析61-68
- 6.1 實(shí)驗(yàn)數(shù)據(jù)選取61
- 6.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)61-62
- 6.3 實(shí)驗(yàn)結(jié)果分析62-67
- 6.4 本章小結(jié)67-68
- 7 總結(jié)與展望68-70
- 7.1 工作總結(jié)68
- 7.2 未來(lái)工作與展望68-70
- 參考文獻(xiàn)70-72
- 作者簡(jiǎn)介及攻讀碩士學(xué)位期間取得的研究成果72-74
- 學(xué)位論文數(shù)據(jù)集#@@
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前8條
1 王中華;;網(wǎng)絡(luò)廣告模式現(xiàn)存問(wèn)題及解決思路探討[J];經(jīng)濟(jì)研究導(dǎo)刊;2010年01期
2 劉遷;賈惠波;;中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年03期
3 熊文新;宋柔;;信息檢索用戶查詢語(yǔ)句的停用詞過(guò)濾[J];計(jì)算機(jī)工程;2007年06期
4 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計(jì)算機(jī)應(yīng)用;2009年S1期
5 俞淑平;陳剛;;一種高效的行為定向廣告投放算法[J];計(jì)算機(jī)應(yīng)用與軟件;2011年01期
6 沈維梅;;網(wǎng)絡(luò)精準(zhǔn)廣告的發(fā)展及困惑[J];新聞界;2010年01期
7 宮學(xué)慶;王立;何曉豐;;基于用戶分組的廣告定位(英文)[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年03期
8 謝桂蘭;羅省賢;;基于Hadoop MapReduce模型的應(yīng)用研究[J];微型機(jī)與應(yīng)用;2010年08期
本文關(guān)鍵詞:基于大數(shù)據(jù)的網(wǎng)絡(luò)廣告推送服務(wù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):349549
本文鏈接:http://www.sikaile.net/wenyilunwen/guanggaoshejilunwen/349549.html