基于深度學(xué)習(xí)的視頻UCL自動(dòng)標(biāo)引及智能化推薦研究
發(fā)布時(shí)間:2021-07-04 12:16
隨著互聯(lián)網(wǎng)中視頻資源量的快速增長(zhǎng),信息過載問題日益突出,雖然各大視頻門戶會(huì)利用視頻特征與用戶數(shù)據(jù)特征向用戶推薦視頻,但仍存在以下兩個(gè)問題:第一,缺乏完備且規(guī)范的視頻語義特征標(biāo)引標(biāo)準(zhǔn),且常用的特征自動(dòng)提取算法對(duì)視頻的語義特征提取不夠充分,導(dǎo)致視頻推薦效果不佳;第二,傳統(tǒng)單一的視頻推薦算法難以結(jié)合視頻特征和用戶特征,雖然深度學(xué)習(xí)算法可以部分解決該問題,但是在分析上述兩種特征的隱式關(guān)系方面仍存不足。針對(duì)上述問題,本文借助具有豐富語義特征的統(tǒng)一內(nèi)容標(biāo)簽(Uniform Content Label,UCL),對(duì)視頻UCL自動(dòng)標(biāo)引及智能化推薦技術(shù)進(jìn)行研究,提出基于特征靈活采樣與注意力機(jī)制的視頻UCL自動(dòng)標(biāo)引方法AUIMV-FFSA(Automatic UCL Indexing Method for Video based on Flexible Feature Sampling and Attention mechanism)和基于自注意力機(jī)制與模型融合的視頻推薦算法RAV-SAMF(Recommendation Algorithm for Video based on Self-Attentio...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
012-2018網(wǎng)絡(luò)視頻、手機(jī)網(wǎng)絡(luò)視頻用戶規(guī)模使用率
東南大學(xué)碩士學(xué)位論文2故將語義特征作為視頻標(biāo)引中一部分至關(guān)重要。如果通過人工的方式抽取視頻高層語義特征,不僅費(fèi)時(shí)費(fèi)力,而且受人的主觀影響較大;現(xiàn)有的算法對(duì)視頻進(jìn)行高級(jí)語義特征提取,其準(zhǔn)確度仍有待提高。UCL是一種標(biāo)引互聯(lián)網(wǎng)資源語義信息的元數(shù)據(jù),由國(guó)家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》(GB/T35304-2017)所定義[3]。其結(jié)構(gòu)如圖1-2所示,它包含UCL代碼部分和UCL屬性部分,代碼部分為面向讀者的內(nèi)容導(dǎo)引,屬性部分為被標(biāo)引內(nèi)容的語義信息和管理信息。UCL具有以下三個(gè)特點(diǎn):第一,UCL具有規(guī)范性,被標(biāo)引的各類、各級(jí)信息嚴(yán)格遵從UCL格式規(guī)范,存放在標(biāo)引的指定位置中。第二,UCL具有結(jié)構(gòu)靈活的特點(diǎn),雖然代碼部分為固定的32字節(jié),但屬性部分除了目前所定義的一些域之外,也可以根據(jù)具體的領(lǐng)域和應(yīng)用場(chǎng)景自由地?cái)U(kuò)展。第三,UCL能夠標(biāo)引豐富語義信息,包括被標(biāo)引資源的關(guān)鍵詞、作者等。基于此,UCL被應(yīng)用在現(xiàn)行的互聯(lián)網(wǎng)結(jié)構(gòu)中,為產(chǎn)品溯源系統(tǒng)、內(nèi)容治理系統(tǒng)等應(yīng)用場(chǎng)景提供資源標(biāo)引,同時(shí)也能夠支持音視頻的各層次特征標(biāo)引。圖1-2統(tǒng)一內(nèi)容標(biāo)簽UCL格式示意圖[3]推薦系統(tǒng)能夠關(guān)聯(lián)用戶和信息,解決互聯(lián)網(wǎng)中信息過載的問題,使用戶發(fā)現(xiàn)自己感興趣信息的同時(shí),也能夠使信息展現(xiàn)在對(duì)它感興趣的用戶面前。相較于搜索引擎需要用戶明確地輸入信息,被動(dòng)地向用戶反饋信息,推薦系統(tǒng)無需用戶對(duì)自己的需求進(jìn)行描述,依賴用戶的歷史行為數(shù)據(jù),主動(dòng)地向用戶推薦信息,同時(shí)會(huì)根據(jù)不同時(shí)間階段用戶的喜好以及被推薦資源的更新實(shí)時(shí)更換。對(duì)于海量的視頻資源,推薦系統(tǒng)的重要性不言而喻,對(duì)于YouTube視頻網(wǎng)站,個(gè)性化推薦視頻的點(diǎn)擊率為熱門視頻點(diǎn)擊率的2.07倍,個(gè)性化推薦能夠?yàn)榛ヂ?lián)網(wǎng)的各種網(wǎng)站帶來巨大的經(jīng)濟(jì)效益。基于此,如圖1-3所示,根據(jù)對(duì)中國(guó)知?
第一章緒論3的統(tǒng)計(jì),國(guó)內(nèi)外對(duì)“個(gè)性化推薦”的關(guān)注度逐年提高。圖1-3“個(gè)性化推薦”的學(xué)術(shù)關(guān)注趨勢(shì)目前推薦常用的推薦方式有基于內(nèi)容的推薦、協(xié)同過濾推薦、基于規(guī)則的推薦以及混合模型推薦[4]。基于內(nèi)容的推薦是最早被使用的推薦算法,它首先分析物品的相似性,然后將用戶喜歡的相似商品推薦給用戶,因此需要對(duì)商品進(jìn)行完整和全面的建模以分析商品的相似性,并且存在新用戶的冷啟動(dòng)問題[5]。基于協(xié)同過濾的推薦方式,根據(jù)用戶與物體之間的關(guān)系,在不考慮用戶或者物品自身屬性的前提下分析商品或者用戶的相似性,進(jìn)而為用戶推薦商品,雖然不需要對(duì)商品進(jìn)行建模,能夠處理非結(jié)構(gòu)化的數(shù)據(jù),但是存在數(shù)據(jù)稀疏性和冷啟動(dòng)的問題。基于規(guī)則的推薦通過分析用戶購(gòu)買商品的行為,得到不同商品之間的聯(lián)系規(guī)則,進(jìn)而向用戶推薦相關(guān)的商品,不存在用戶冷啟動(dòng)問題,但隨著規(guī)則的增加,存在時(shí)效性不高的問題[6];诨旌夏P偷耐扑]的原理是建立多個(gè)推薦算法模型,通過投票法確定最后的推薦結(jié)果,雖然理論上混合模型的最終效果不會(huì)比單一模型的效果差,但是其算法的復(fù)雜度要高于單個(gè)模型[7]。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,得益于GPU等硬件水平的快速發(fā)展,近些年一直是學(xué)術(shù)界的研究熱點(diǎn)。深度學(xué)習(xí)算法是對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的發(fā)展,含有多個(gè)隱藏層的非線性網(wǎng)絡(luò)結(jié)構(gòu),無需手動(dòng)構(gòu)造特征,能夠自動(dòng)抽取數(shù)據(jù)更抽象和更本質(zhì)的特征描述。2006年,圖靈獎(jiǎng)獲得者Hinton及其團(tuán)隊(duì)第一次提出了深度學(xué)習(xí)的思想和深度學(xué)習(xí)的訓(xùn)練方法,并于2012年與學(xué)生提出基于卷積神經(jīng)網(wǎng)絡(luò)的AlexNet模型[8],在imageNet競(jìng)賽中取得了優(yōu)異的成績(jī),引起了學(xué)術(shù)界的廣泛關(guān)注。除了在圖像處理領(lǐng)域,近些年深度學(xué)習(xí)在語音識(shí)別、自然語言處理和個(gè)性化推薦等領(lǐng)域取得了突破性的進(jìn)展,也被應(yīng)用于推薦?
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶的協(xié)同過濾(UserCF)新聞推薦算法研究[J]. 潘麗芳,張大龍,李慧. 山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[4]顏色紋理形狀特征分層融合圖像檢索方法研究[J]. 李冰. 西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[5]優(yōu)化稀疏數(shù)據(jù)集提高協(xié)同過濾推薦系統(tǒng)質(zhì)量的方法[J]. 劉慶鵬,陳明銳. 計(jì)算機(jī)應(yīng)用. 2012(04)
碩士論文
[1]視頻語義標(biāo)注研究及原型實(shí)現(xiàn)[D]. 鞠峰.山東大學(xué) 2012
本文編號(hào):3264772
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
012-2018網(wǎng)絡(luò)視頻、手機(jī)網(wǎng)絡(luò)視頻用戶規(guī)模使用率
東南大學(xué)碩士學(xué)位論文2故將語義特征作為視頻標(biāo)引中一部分至關(guān)重要。如果通過人工的方式抽取視頻高層語義特征,不僅費(fèi)時(shí)費(fèi)力,而且受人的主觀影響較大;現(xiàn)有的算法對(duì)視頻進(jìn)行高級(jí)語義特征提取,其準(zhǔn)確度仍有待提高。UCL是一種標(biāo)引互聯(lián)網(wǎng)資源語義信息的元數(shù)據(jù),由國(guó)家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》(GB/T35304-2017)所定義[3]。其結(jié)構(gòu)如圖1-2所示,它包含UCL代碼部分和UCL屬性部分,代碼部分為面向讀者的內(nèi)容導(dǎo)引,屬性部分為被標(biāo)引內(nèi)容的語義信息和管理信息。UCL具有以下三個(gè)特點(diǎn):第一,UCL具有規(guī)范性,被標(biāo)引的各類、各級(jí)信息嚴(yán)格遵從UCL格式規(guī)范,存放在標(biāo)引的指定位置中。第二,UCL具有結(jié)構(gòu)靈活的特點(diǎn),雖然代碼部分為固定的32字節(jié),但屬性部分除了目前所定義的一些域之外,也可以根據(jù)具體的領(lǐng)域和應(yīng)用場(chǎng)景自由地?cái)U(kuò)展。第三,UCL能夠標(biāo)引豐富語義信息,包括被標(biāo)引資源的關(guān)鍵詞、作者等。基于此,UCL被應(yīng)用在現(xiàn)行的互聯(lián)網(wǎng)結(jié)構(gòu)中,為產(chǎn)品溯源系統(tǒng)、內(nèi)容治理系統(tǒng)等應(yīng)用場(chǎng)景提供資源標(biāo)引,同時(shí)也能夠支持音視頻的各層次特征標(biāo)引。圖1-2統(tǒng)一內(nèi)容標(biāo)簽UCL格式示意圖[3]推薦系統(tǒng)能夠關(guān)聯(lián)用戶和信息,解決互聯(lián)網(wǎng)中信息過載的問題,使用戶發(fā)現(xiàn)自己感興趣信息的同時(shí),也能夠使信息展現(xiàn)在對(duì)它感興趣的用戶面前。相較于搜索引擎需要用戶明確地輸入信息,被動(dòng)地向用戶反饋信息,推薦系統(tǒng)無需用戶對(duì)自己的需求進(jìn)行描述,依賴用戶的歷史行為數(shù)據(jù),主動(dòng)地向用戶推薦信息,同時(shí)會(huì)根據(jù)不同時(shí)間階段用戶的喜好以及被推薦資源的更新實(shí)時(shí)更換。對(duì)于海量的視頻資源,推薦系統(tǒng)的重要性不言而喻,對(duì)于YouTube視頻網(wǎng)站,個(gè)性化推薦視頻的點(diǎn)擊率為熱門視頻點(diǎn)擊率的2.07倍,個(gè)性化推薦能夠?yàn)榛ヂ?lián)網(wǎng)的各種網(wǎng)站帶來巨大的經(jīng)濟(jì)效益。基于此,如圖1-3所示,根據(jù)對(duì)中國(guó)知?
第一章緒論3的統(tǒng)計(jì),國(guó)內(nèi)外對(duì)“個(gè)性化推薦”的關(guān)注度逐年提高。圖1-3“個(gè)性化推薦”的學(xué)術(shù)關(guān)注趨勢(shì)目前推薦常用的推薦方式有基于內(nèi)容的推薦、協(xié)同過濾推薦、基于規(guī)則的推薦以及混合模型推薦[4]。基于內(nèi)容的推薦是最早被使用的推薦算法,它首先分析物品的相似性,然后將用戶喜歡的相似商品推薦給用戶,因此需要對(duì)商品進(jìn)行完整和全面的建模以分析商品的相似性,并且存在新用戶的冷啟動(dòng)問題[5]。基于協(xié)同過濾的推薦方式,根據(jù)用戶與物體之間的關(guān)系,在不考慮用戶或者物品自身屬性的前提下分析商品或者用戶的相似性,進(jìn)而為用戶推薦商品,雖然不需要對(duì)商品進(jìn)行建模,能夠處理非結(jié)構(gòu)化的數(shù)據(jù),但是存在數(shù)據(jù)稀疏性和冷啟動(dòng)的問題。基于規(guī)則的推薦通過分析用戶購(gòu)買商品的行為,得到不同商品之間的聯(lián)系規(guī)則,進(jìn)而向用戶推薦相關(guān)的商品,不存在用戶冷啟動(dòng)問題,但隨著規(guī)則的增加,存在時(shí)效性不高的問題[6];诨旌夏P偷耐扑]的原理是建立多個(gè)推薦算法模型,通過投票法確定最后的推薦結(jié)果,雖然理論上混合模型的最終效果不會(huì)比單一模型的效果差,但是其算法的復(fù)雜度要高于單個(gè)模型[7]。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,得益于GPU等硬件水平的快速發(fā)展,近些年一直是學(xué)術(shù)界的研究熱點(diǎn)。深度學(xué)習(xí)算法是對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的發(fā)展,含有多個(gè)隱藏層的非線性網(wǎng)絡(luò)結(jié)構(gòu),無需手動(dòng)構(gòu)造特征,能夠自動(dòng)抽取數(shù)據(jù)更抽象和更本質(zhì)的特征描述。2006年,圖靈獎(jiǎng)獲得者Hinton及其團(tuán)隊(duì)第一次提出了深度學(xué)習(xí)的思想和深度學(xué)習(xí)的訓(xùn)練方法,并于2012年與學(xué)生提出基于卷積神經(jīng)網(wǎng)絡(luò)的AlexNet模型[8],在imageNet競(jìng)賽中取得了優(yōu)異的成績(jī),引起了學(xué)術(shù)界的廣泛關(guān)注。除了在圖像處理領(lǐng)域,近些年深度學(xué)習(xí)在語音識(shí)別、自然語言處理和個(gè)性化推薦等領(lǐng)域取得了突破性的進(jìn)展,也被應(yīng)用于推薦?
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶的協(xié)同過濾(UserCF)新聞推薦算法研究[J]. 潘麗芳,張大龍,李慧. 山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[4]顏色紋理形狀特征分層融合圖像檢索方法研究[J]. 李冰. 西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[5]優(yōu)化稀疏數(shù)據(jù)集提高協(xié)同過濾推薦系統(tǒng)質(zhì)量的方法[J]. 劉慶鵬,陳明銳. 計(jì)算機(jī)應(yīng)用. 2012(04)
碩士論文
[1]視頻語義標(biāo)注研究及原型實(shí)現(xiàn)[D]. 鞠峰.山東大學(xué) 2012
本文編號(hào):3264772
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3264772.html
最近更新
教材專著