移動(dòng)互聯(lián)網(wǎng)閱讀業(yè)務(wù)用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:移動(dòng)互聯(lián)網(wǎng)閱讀業(yè)務(wù)用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)以及新型業(yè)務(wù)的飛速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng)。這使得各大運(yùn)營(yíng)商的傳統(tǒng)業(yè)務(wù)受到很大的沖擊,也給ISP(Internet Service Provider,互聯(lián)網(wǎng)服務(wù)提供商)的管理工作帶來(lái)巨大壓力。在這種情況下,電信運(yùn)營(yíng)商提出“智能管道”的新要求,迫切需求分析用戶(hù)的群體構(gòu)成及其偏好,向用戶(hù)提供更具個(gè)性化的服務(wù)。如何獲取移動(dòng)互聯(lián)網(wǎng)用戶(hù)行為特征信息,對(duì)于運(yùn)營(yíng)商與ISP來(lái)說(shuō)具有非常重要的意義。本文在傳統(tǒng)的監(jiān)測(cè)系統(tǒng)的基礎(chǔ)上,以移動(dòng)閱讀為切入點(diǎn),重點(diǎn)研究了移動(dòng)互聯(lián)網(wǎng)用戶(hù)行為特征的精確識(shí)別與監(jiān)測(cè),實(shí)現(xiàn)一套基于DPI(Deep Packet Inspection,深度包檢測(cè))技術(shù)的移動(dòng)互聯(lián)網(wǎng)用戶(hù)行為分析系統(tǒng)。本文主要工作內(nèi)容有以下幾點(diǎn):第一、通過(guò)研究國(guó)內(nèi)外用戶(hù)行為分析現(xiàn)狀,提出一套針對(duì)移動(dòng)閱讀業(yè)務(wù)的用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)思路和實(shí)現(xiàn)方法,對(duì)ISP與運(yùn)營(yíng)商分析用戶(hù)行為特征具有參考意義;第二、通過(guò)研究Hadoop分布式系統(tǒng)框架與主題爬蟲(chóng)技術(shù),實(shí)現(xiàn)了基于Hadoop的分布式主題爬蟲(chóng),并利用分布式主題爬蟲(chóng)訪問(wèn)互聯(lián)網(wǎng)各大閱讀網(wǎng)站,獲取互聯(lián)網(wǎng)閱讀作品詳細(xì)信息;第三、采用DPI技術(shù)對(duì)移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)進(jìn)行識(shí)別,并且為滿(mǎn)足不同識(shí)別需求,將業(yè)務(wù)識(shí)別劃分為實(shí)時(shí)DPI業(yè)務(wù)識(shí)別和Senior DPI業(yè)務(wù)識(shí)別兩個(gè)功能模塊,其中實(shí)時(shí)DPI業(yè)務(wù)識(shí)別主要負(fù)責(zé)識(shí)別業(yè)務(wù)類(lèi)型與流量統(tǒng)計(jì),Senior DPI業(yè)務(wù)識(shí)別主要負(fù)責(zé)識(shí)別業(yè)務(wù)的詳細(xì)信息,如作品名稱(chēng)、作品類(lèi)型、作者等信息;第四、根據(jù)不同的專(zhuān)題應(yīng)用,對(duì)相應(yīng)指標(biāo)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并結(jié)合標(biāo)準(zhǔn)差離法與H-Index算法,對(duì)移動(dòng)閱讀用戶(hù)偏好程度進(jìn)行分析,從海量的用戶(hù)數(shù)據(jù)中挖掘移動(dòng)互聯(lián)網(wǎng)用戶(hù)的閱讀習(xí)慣與偏好。本文將采集的現(xiàn)網(wǎng)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),對(duì)系統(tǒng)的功能與性能進(jìn)行驗(yàn)證,并展示幾種專(zhuān)題應(yīng)用分析場(chǎng)景。該系統(tǒng)能對(duì)海量用戶(hù)數(shù)據(jù)進(jìn)行業(yè)務(wù)識(shí)別,并通過(guò)用戶(hù)偏好程度分析算法獲取用戶(hù)的閱讀行為特征,對(duì)各個(gè)ISP與電信運(yùn)營(yíng)商制定相應(yīng)的營(yíng)銷(xiāo)策略具有參考價(jià)值。
【關(guān)鍵詞】:用戶(hù)行為 移動(dòng)閱讀 深度包檢測(cè) 主題爬蟲(chóng) 業(yè)務(wù)識(shí)別
【學(xué)位授予單位】:重慶郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN929.5;TP393.0
【目錄】:
- 摘要3-4
- Abstract4-11
- 注釋表11-12
- 第1章 緒論12-17
- 1.1 研究背景及意義12-13
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-15
- 1.3 課題來(lái)源及研究?jī)?nèi)容15
- 1.4 論文組織與結(jié)構(gòu)15-17
- 第2章 相關(guān)理論基礎(chǔ)17-25
- 2.1 移動(dòng)互聯(lián)網(wǎng)概述17-18
- 2.2 深度包檢測(cè)技術(shù)18-19
- 2.3 主題爬蟲(chóng)技術(shù)19-21
- 2.4 Hadoop分布式系統(tǒng)框架21-24
- 2.4.1 Hadoop分布式文件系統(tǒng)22-23
- 2.4.2 MapReduce分布式計(jì)算模型23-24
- 2.5 本章小結(jié)24-25
- 第3章 用戶(hù)行為分析系統(tǒng)總體設(shè)計(jì)25-38
- 3.1 系統(tǒng)需求分析25-26
- 3.1.1 系統(tǒng)功能需求25
- 3.1.2 系統(tǒng)性能需求25-26
- 3.2 系統(tǒng)總體架構(gòu)設(shè)計(jì)26-27
- 3.3 協(xié)議解析模塊設(shè)計(jì)27-28
- 3.4 主題爬蟲(chóng)模塊設(shè)計(jì)28-32
- 3.4.1 主題爬蟲(chóng)模塊整體需求28-29
- 3.4.2 主題爬蟲(chóng)架構(gòu)29-30
- 3.4.3 分布式主題爬蟲(chóng)的Map/Reduce設(shè)計(jì)30-32
- 3.5 業(yè)務(wù)識(shí)別模塊設(shè)計(jì)32-37
- 3.5.1 業(yè)務(wù)識(shí)別模塊需求分析32-33
- 3.5.2 業(yè)務(wù)識(shí)別方案設(shè)計(jì)33-34
- 3.5.3 業(yè)務(wù)特征庫(kù)設(shè)計(jì)34-37
- 3.6 本章小結(jié)37-38
- 第4章 用戶(hù)行為分析系統(tǒng)的實(shí)現(xiàn)38-55
- 4.1 協(xié)議解析模塊實(shí)現(xiàn)38-39
- 4.2 爬蟲(chóng)模塊實(shí)現(xiàn)39-44
- 4.2.1 存儲(chǔ)結(jié)構(gòu)的定義39-40
- 4.2.2 主題爬蟲(chóng)的實(shí)現(xiàn)40-44
- 4.3 業(yè)務(wù)識(shí)別模塊實(shí)現(xiàn)44-54
- 4.3.1 業(yè)務(wù)特征分析歸類(lèi)44-46
- 4.3.2 實(shí)時(shí)DPI模塊實(shí)現(xiàn)46-51
- 4.3.3 Senior DPI業(yè)務(wù)識(shí)別的實(shí)現(xiàn)51-54
- 4.4 本章小結(jié)54-55
- 第5章 系統(tǒng)環(huán)境搭建與結(jié)果分析55-72
- 5.1 搭建Hadoop分布式系統(tǒng)環(huán)境55-58
- 5.2 用戶(hù)行為專(zhuān)題分析58-70
- 5.2.1 市場(chǎng)份額占比分析59-60
- 5.2.2 熱點(diǎn)作品TopN分析60-62
- 5.2.3 用戶(hù)偏好分析62-70
- 5.3 本章小結(jié)70-72
- 第6章 總結(jié)與展望72-74
- 6.1 全文工作總結(jié)72
- 6.2 后續(xù)工作展望72-74
- 參考文獻(xiàn)74-78
- 致謝78-79
- 攻讀碩士學(xué)位期間從事的科研工作及取得的成果79
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 劉亞秋;李海濤;景維鵬;;基于Hadoop的海量嘈雜數(shù)據(jù)決策樹(shù)算法的實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2015年04期
2 龔宏程;方曉明;龔宏銳;;移動(dòng)互聯(lián)網(wǎng)現(xiàn)狀和發(fā)展趨勢(shì)淺析[J];江西通信科技;2014年04期
3 劉俊杉;田丹;林琳;;移動(dòng)互聯(lián)網(wǎng)時(shí)代計(jì)費(fèi)系統(tǒng)的變革[J];通信管理與技術(shù);2014年04期
4 梅華威;米增強(qiáng);吳廣磊;;基于MapReduce模型的間歇性能源海量數(shù)據(jù)處理技術(shù)[J];電力系統(tǒng)自動(dòng)化;2014年15期
5 張學(xué)亮;陳金勇;陳勇;;基于Hadoop云計(jì)算平臺(tái)的海量文本處理研究[J];無(wú)線(xiàn)電通信技術(shù);2014年01期
6 吳斌;劉心光;;一種基于改進(jìn)的鏈?zhǔn)組apReduce的并行ETL應(yīng)用[J];電信科學(xué);2013年12期
7 劉山;李憲彬;;運(yùn)營(yíng)商移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展分析[J];信息通信技術(shù);2011年04期
8 張晶;黃京華;陳俊全;;Empirical Research on User Acceptance of Mobile Searches[J];Tsinghua Science and Technology;2010年02期
9 韓宇;黃青松;;基于改進(jìn)PageRank的情報(bào)主題相關(guān)度預(yù)測(cè)策略[J];微型電腦應(yīng)用;2010年03期
本文關(guān)鍵詞:移動(dòng)互聯(lián)網(wǎng)閱讀業(yè)務(wù)用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):284355
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/284355.html