天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于寬深度模型的廣告點擊率預估方法

發(fā)布時間:2020-04-19 18:59
【摘要】:隨著互聯(lián)網(wǎng)技術發(fā)展的日新月異,傳統(tǒng)廣告行業(yè)正在向新興的互聯(lián)網(wǎng)市場轉移,與互聯(lián)網(wǎng)企業(yè)營收息息相關的廣告點擊率相關研究成為了各個互聯(lián)網(wǎng)企業(yè)最為熱衷的領域,同時也是學術研究在工業(yè)界落地的重要應用場景。面向海量的用戶行為數(shù)據(jù),如何根據(jù)用戶行為數(shù)據(jù)向用戶推薦更符合用戶需求的廣告顯得尤為必要。本文著眼于實際的應用場景,利用了用戶信息、廣告信息和用戶歷史行為信息,從寬度、深度這兩個模型切入,提出了基于寬深度模型的廣告點擊率預估算法,本文稱之為RD-FM算法,從而能更好地對針對不同用戶的喜好進行廣告推送,提升廣告點擊率。本文的主要工作包括以下幾個方面:(1)調研了有關廣告點擊率相關國內外研究現(xiàn)狀,并分析了它們的優(yōu)勢和存在的缺陷。(2)廣告點擊率數(shù)據(jù)預處理:本文分析了點擊率預估原始數(shù)據(jù)存在的問題,提出了一套完整的點擊率預估流程,包括對采集到的用戶屬性、廣告信息、用戶歷史行為的數(shù)據(jù)清洗、數(shù)據(jù)采樣、數(shù)據(jù)規(guī)約和數(shù)據(jù)轉換。(3)基于寬深度模型的廣告點擊率預估算法:本文依據(jù)谷歌提出的寬深度模型模型,結合Deep-FM算法及廣告點擊率預估數(shù)據(jù)集的時序特點,設計了RD-FM算法。該算法分為基于因子分解機模型的寬度層、融合時序特征的深度層以及兩者共享的Embedding層和輸出層等部分。(4)本文對比多個算法,對算法的有效性進行實驗。本文提出的RD-FM算法在AUC、RMSE兩個評價指標上與傳統(tǒng)的點擊率預估算法進行了對比,實驗結果表明本文算法相比傳統(tǒng)點擊率預估算法在AUC和RMSE等指標上具有更好的表現(xiàn),說明該算法充分發(fā)揮了因子分解機模型和時序深度模型的優(yōu)勢。
【圖文】:

模型結構


圖 2-1 DNN 模型結構圖其中第一層為輸入層,一般為特征值,在點擊率預估中,尤其特征的稀疏性,一般 Embedding 后的特征。每條神經(jīng)元的連線代表一個輸入的權值,此外還會有一個偏置一個激活函數(shù)。從輸入層開始,然后經(jīng)過第一層神經(jīng)元的運算,得到輸出,作為第二的輸入,重復這個過程,最后一直到輸出層運算,然后得到結果。通過合理地改變權和偏置一點點,可以讓這個神經(jīng)網(wǎng)絡最后的結果向預期的結果進軍,這整個過程即神網(wǎng)絡的訓練過程。.2.2 循環(huán)神經(jīng)網(wǎng)絡普通的 DNN 模型雖然對大多數(shù)線性函數(shù)的擬合取得了不錯的效果,但是實際的情遠比實驗中要復雜,而且在其訓練的過程中也會出現(xiàn)各種情況。在預訓練不充分的情下,DNN 模型也很難得到充分的發(fā)揮。針對處理問題時紛繁復雜的情況,許多不同構的深度網(wǎng)絡模型被提出。它們通常被運用在各自的細分領域。對于特定的任務,根[37]

序列,模型結構


圖 2-2 RNN 模型結構圖從圖中可以看到,每個圓圈可以看作是一個單元,每一個單元對應一個時間節(jié)點 t,此時的網(wǎng)絡都有個一個輸入和一個輸出,隱藏層的值為。其中的值不僅由此刻的輸入值決定,而且還受到之前節(jié)點隱藏層的值影響。因此,前面的時序特征會隨著序列化的網(wǎng)絡一層一層的傳遞下去,對于所有的節(jié)點,當前時刻的輸出結果會包含所有之前時刻的特征。所以 RNN 是一個序列到序列的模型,循環(huán)神經(jīng)網(wǎng)絡會將前一個神經(jīng)元的狀態(tài)層層傳遞,同時輸出本神經(jīng)的狀態(tài),所以可以將循環(huán)神經(jīng)網(wǎng)絡的這種特性比喻成人類的記憶力。對于某個廣告 V,獨熱編碼后的特征記為。這個向量會作為 t+1 時刻的狀態(tài)輸入到RNN 中,而輸出結果就是一個概率向量,代表了被點擊的概率。由于 RNN 的特點,,輸出結果會綜合用戶之前的點擊信息。通常為了提高 RNN 模型的效率,算法設計者會限制參數(shù)傳遞的時長,假設模型只考慮最近兩個會話訪問,并將其余的訪問記錄整合成歷史狀態(tài)節(jié)點,其公式可以如下公式(2-11)所示:
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP301.6;F713.8

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 方敏;;集成學習的多分類器動態(tài)融合方法研究[J];系統(tǒng)工程與電子技術;2006年11期

2 于玲;吳鐵軍;;集成學習:Boosting算法綜述[J];模式識別與人工智能;2004年01期

中國碩士學位論文全文數(shù)據(jù)庫 前4條

1 楊志燁;展示廣告點擊率預估方法研究[D];哈爾濱工業(yè)大學;2018年

2 田源;基于深度學習的中文命名實體識別方法研究[D];湖南大學;2018年

3 張茜;移動互聯(lián)網(wǎng)廣告營銷研究[D];黑龍江大學;2014年

4 李志;互聯(lián)網(wǎng)廣告精準投放平臺的研究[D];華中師范大學;2013年



本文編號:2633630

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/guojimaoyilunwen/2633630.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f1067***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com