基于行為和視頻評(píng)論的移動(dòng)用戶畫(huà)像
發(fā)布時(shí)間:2021-05-19 02:54
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,越來(lái)越多的用戶通過(guò)移動(dòng)終端,使用數(shù)據(jù)流量觀看視頻。用戶在觀看移動(dòng)視頻的同時(shí),產(chǎn)生了大量的行為數(shù)據(jù)。從用戶的行為數(shù)據(jù)中分析用戶的屬性信息,挖掘用戶的興趣和偏好,會(huì)幫助網(wǎng)絡(luò)運(yùn)營(yíng)商和視頻提供商改進(jìn)服務(wù)質(zhì)量。本文提出了一種基于用戶行為數(shù)據(jù)和視頻評(píng)論文本的移動(dòng)用戶畫(huà)像構(gòu)建方案。該方案不依賴特征工程準(zhǔn)確預(yù)測(cè)用戶的個(gè)人屬性,并且設(shè)計(jì)了層次標(biāo)簽體系描述用戶的興趣偏好。提出了一種共嵌入注意力網(wǎng)絡(luò)模型用于預(yù)測(cè)用戶的年齡和性別。該模型首先分別從用戶觀看記錄和視頻評(píng)論文檔中,學(xué)習(xí)視頻的觀看向量和評(píng)論向量;之后結(jié)合兩個(gè)向量作為視頻特征,并引入注意力機(jī)制,構(gòu)建共嵌入注意力網(wǎng)絡(luò);最后將用戶的視頻觀看記錄輸入到網(wǎng)絡(luò)中預(yù)測(cè)用戶的屬性信息。在性別預(yù)測(cè)和年齡預(yù)測(cè)兩個(gè)任務(wù)中,共嵌入注意力網(wǎng)絡(luò)分別取得了91.6%和56.4%的F1-score。提出了一種視頻的粗粒度標(biāo)簽獲取算法。該算法構(gòu)建了層次注意力網(wǎng)絡(luò),學(xué)習(xí)評(píng)論文本中單詞和評(píng)論的權(quán)重;最后預(yù)測(cè)所有標(biāo)簽的置信度并確定視頻的一級(jí)標(biāo)簽。此外還提出了基于文檔重構(gòu)的樣本均衡法,解決樣本分布不均衡問(wèn)題的同時(shí)利用了更多的文本信息。視頻粗粒度標(biāo)簽獲取算法在標(biāo)簽推薦任務(wù)...
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 用戶屬性畫(huà)像的研究現(xiàn)狀
1.2.2 標(biāo)簽推薦算法的研究現(xiàn)狀
1.3 論文的主要研究?jī)?nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 數(shù)據(jù)集
2.1 移動(dòng)視頻用戶數(shù)據(jù)
2.1.1 移動(dòng)端用戶視頻觀看數(shù)據(jù)
2.1.2 移動(dòng)端用戶屬性特征數(shù)據(jù)
2.2 視頻文本數(shù)據(jù)
第3章 移動(dòng)視頻用戶屬性畫(huà)像
3.1 視頻特征向量訓(xùn)練
3.1.1 基于skip-gram和用戶觀看序列的視頻嵌入
3.1.2 基于Doc2Vec和視頻評(píng)論文本的視頻嵌入
3.1.3 視頻特征向量生成
3.1.4 用戶特征畫(huà)像構(gòu)建
3.2 共嵌入注意力網(wǎng)絡(luò)
3.2.1 網(wǎng)絡(luò)模型框架
3.2.2 門(mén)控循環(huán)單元
3.2.3 注意力機(jī)制層
3.2.4 全連接輸出層
3.3 實(shí)驗(yàn)設(shè)置和結(jié)果分析
3.3.1 實(shí)驗(yàn)設(shè)置
3.3.2 實(shí)驗(yàn)結(jié)果與分析
3.3.3 視頻嵌入對(duì)比實(shí)驗(yàn)
3.3.4 注意力機(jī)制可視化
3.4 本章小結(jié)
第4章 移動(dòng)視頻用戶興趣畫(huà)像
4.1 基于層次注意力網(wǎng)絡(luò)的視頻一級(jí)標(biāo)簽分類
4.1.1 基于文檔重構(gòu)的樣本均衡
4.1.2 層次注意力網(wǎng)絡(luò)
4.1.3 基準(zhǔn)模型介紹
4.1.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.2 基于融合標(biāo)簽抽取算法的視頻二級(jí)標(biāo)簽提取
4.2.1 基于TF-IDF的關(guān)鍵詞提取
4.2.2 基于Text Rank的關(guān)鍵詞提取
4.2.3 基于融合標(biāo)簽抽取算法的關(guān)鍵詞提取
4.3 基于視頻層次標(biāo)簽體系的用戶興趣畫(huà)像構(gòu)建
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
作者簡(jiǎn)歷
本文編號(hào):3194974
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 用戶屬性畫(huà)像的研究現(xiàn)狀
1.2.2 標(biāo)簽推薦算法的研究現(xiàn)狀
1.3 論文的主要研究?jī)?nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 數(shù)據(jù)集
2.1 移動(dòng)視頻用戶數(shù)據(jù)
2.1.1 移動(dòng)端用戶視頻觀看數(shù)據(jù)
2.1.2 移動(dòng)端用戶屬性特征數(shù)據(jù)
2.2 視頻文本數(shù)據(jù)
第3章 移動(dòng)視頻用戶屬性畫(huà)像
3.1 視頻特征向量訓(xùn)練
3.1.1 基于skip-gram和用戶觀看序列的視頻嵌入
3.1.2 基于Doc2Vec和視頻評(píng)論文本的視頻嵌入
3.1.3 視頻特征向量生成
3.1.4 用戶特征畫(huà)像構(gòu)建
3.2 共嵌入注意力網(wǎng)絡(luò)
3.2.1 網(wǎng)絡(luò)模型框架
3.2.2 門(mén)控循環(huán)單元
3.2.3 注意力機(jī)制層
3.2.4 全連接輸出層
3.3 實(shí)驗(yàn)設(shè)置和結(jié)果分析
3.3.1 實(shí)驗(yàn)設(shè)置
3.3.2 實(shí)驗(yàn)結(jié)果與分析
3.3.3 視頻嵌入對(duì)比實(shí)驗(yàn)
3.3.4 注意力機(jī)制可視化
3.4 本章小結(jié)
第4章 移動(dòng)視頻用戶興趣畫(huà)像
4.1 基于層次注意力網(wǎng)絡(luò)的視頻一級(jí)標(biāo)簽分類
4.1.1 基于文檔重構(gòu)的樣本均衡
4.1.2 層次注意力網(wǎng)絡(luò)
4.1.3 基準(zhǔn)模型介紹
4.1.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.2 基于融合標(biāo)簽抽取算法的視頻二級(jí)標(biāo)簽提取
4.2.1 基于TF-IDF的關(guān)鍵詞提取
4.2.2 基于Text Rank的關(guān)鍵詞提取
4.2.3 基于融合標(biāo)簽抽取算法的關(guān)鍵詞提取
4.3 基于視頻層次標(biāo)簽體系的用戶興趣畫(huà)像構(gòu)建
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
作者簡(jiǎn)歷
本文編號(hào):3194974
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3194974.html
最近更新
教材專著