基于運營商管道大數(shù)據(jù)的智能電商推薦系統(tǒng)
發(fā)布時間:2020-03-18 22:03
【摘要】:隨著現(xiàn)代互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和不斷完善,以及家庭固定寬帶越來越高的穩(wěn)定性和越來越快的網(wǎng)絡(luò)速度,越來越多的用戶通過各種電子終端(電腦、平板、電視盒子,尤其是移動手機)接入家庭固定寬帶來獲得各種豐富的互聯(lián)網(wǎng)內(nèi)容;诨ヂ(lián)網(wǎng)技術(shù)、信息網(wǎng)絡(luò)技術(shù)等基礎(chǔ)之上的電子商務(wù)展現(xiàn)出了巨大的發(fā)展?jié)摿?尤其是網(wǎng)絡(luò)購物受到了極大用戶的青睞。而當(dāng)下正是大數(shù)據(jù)飛速發(fā)展的時候,通過收集累積家庭固定寬帶下用戶的電子商務(wù)平臺上的網(wǎng)絡(luò)購物數(shù)據(jù)和行為,對未來電子商務(wù)平臺企業(yè)的用戶挖掘、廣告投放、商品推薦等方面提供巨大的數(shù)據(jù)支持,也為未來大數(shù)據(jù)發(fā)展提供了長遠(yuǎn)的開發(fā)和利用價值。運營商在擁有相較于其他電子商務(wù)平臺更完整的用戶網(wǎng)絡(luò)購物流量的獨特優(yōu)勢的基礎(chǔ)之上,對家庭寬帶用戶進行網(wǎng)絡(luò)購物更精準(zhǔn)的個性化推薦,不但為運營商提供流量變現(xiàn)的可靠方式,更為家庭寬帶用戶提供高質(zhì)量的大數(shù)據(jù)服務(wù),在電子商務(wù)領(lǐng)域中是具有十分深遠(yuǎn)的意義與價值。據(jù)此,本文提出了一種基于運營商管道大數(shù)據(jù)的智能電商推薦系統(tǒng)。由于大多數(shù)電商網(wǎng)站不是全網(wǎng)加密,本文推薦系統(tǒng)采用DPI技術(shù)對非加密數(shù)據(jù)包進行數(shù)據(jù)采集,感知用戶身份信息和用戶行為,即可描繪家庭畫像。同時,推薦系統(tǒng)通過預(yù)先建立的統(tǒng)一標(biāo)簽融合信息庫對用戶行為進行標(biāo)簽提取。最終,推薦系統(tǒng)通過混合推薦算法針對用戶提取的標(biāo)簽進行用戶興趣的預(yù)測。針對此推薦系統(tǒng),本文的主要創(chuàng)新如下:1、利用特征關(guān)鍵字自動提取技術(shù)挖掘HTTP數(shù)據(jù)包內(nèi)容的關(guān)鍵字集合,通過大數(shù)據(jù)平臺進行清洗去噪以提升關(guān)鍵字集合的準(zhǔn)確度,取代傳統(tǒng)的人工肉眼挖掘關(guān)鍵字的方式。2、基于改進的TF-IDF算法計算詞條相關(guān)度,利用詞條相關(guān)度所組成的特征向量進行K-means聚類,依據(jù)向量間余弦相似度融合各電商近義標(biāo)簽形成統(tǒng)一標(biāo)簽庫。3、根據(jù)用戶的以往興趣商品以及提取的得到商品分類,利用加權(quán)融合基于改進SVD的協(xié)同過濾算法和引入用戶興趣熱度因子、日期熱門度因子的改進梯度提升預(yù)測算法為用戶產(chǎn)生推薦。
【圖文】:
Hyperscan 以自動機理論為基礎(chǔ),其工作流程主要分成兩個部分:編譯期(compile-time)和運行期(run-time)。Hyperscan 自帶 C++編寫的正則表達(dá)式編譯器。如圖 2.1 所示,它將正則表達(dá)式作為輸入,,
圖 2.1 Hyperscan 編譯流程Hyperscan 的運行期是通過 C 語言來開發(fā)的。圖 2.2 展示了 Hyperscan 在運行期的主要。用戶需要預(yù)先分配一段內(nèi)存來存儲臨時匹配狀態(tài)信息,之后利用編譯生成的數(shù)據(jù)庫調(diào)yperscan 內(nèi)部的匹配引擎(NFA, DFA 等)來對輸入進行模式匹配。Hyperscan 在引擎中使tel 處理器所具有的 SIMD 指令進行加速。同時,用戶可以通過回調(diào)函數(shù)來自定義匹配發(fā)采取的行為。由于生成的數(shù)據(jù)庫是只讀的,用戶可以在多個 CPU 核或多線程場景下共享庫來提升匹配擴展性。
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.3
本文編號:2589250
【圖文】:
Hyperscan 以自動機理論為基礎(chǔ),其工作流程主要分成兩個部分:編譯期(compile-time)和運行期(run-time)。Hyperscan 自帶 C++編寫的正則表達(dá)式編譯器。如圖 2.1 所示,它將正則表達(dá)式作為輸入,,
圖 2.1 Hyperscan 編譯流程Hyperscan 的運行期是通過 C 語言來開發(fā)的。圖 2.2 展示了 Hyperscan 在運行期的主要。用戶需要預(yù)先分配一段內(nèi)存來存儲臨時匹配狀態(tài)信息,之后利用編譯生成的數(shù)據(jù)庫調(diào)yperscan 內(nèi)部的匹配引擎(NFA, DFA 等)來對輸入進行模式匹配。Hyperscan 在引擎中使tel 處理器所具有的 SIMD 指令進行加速。同時,用戶可以通過回調(diào)函數(shù)來自定義匹配發(fā)采取的行為。由于生成的數(shù)據(jù)庫是只讀的,用戶可以在多個 CPU 核或多線程場景下共享庫來提升匹配擴展性。
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前2條
1 陳曉天;陳望都;王攀;張順頤;;基于用戶行為分析的移動互聯(lián)網(wǎng)流量經(jīng)營研究[J];電信快報;2013年04期
2 王亞;;分析Libpcap-mmap機制改進之處[J];數(shù)字技術(shù)與應(yīng)用;2012年04期
本文編號:2589250
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/2589250.html
最近更新
教材專著