基于深度典型相關(guān)分析的跨媒體語義挖掘研究
發(fā)布時(shí)間:2021-12-10 21:59
從九十年代的門戶網(wǎng)站時(shí)代,歷經(jīng)各種發(fā)展,到當(dāng)下的大數(shù)據(jù)時(shí)代,多媒體研究被賦予了越來越大的科學(xué)、社會(huì)和商業(yè)價(jià)值。如何最大化挖掘不同類型的媒體信息中所蘊(yùn)含的隱藏信息,顯得尤為重要。克服不同媒體之間的語義鴻溝,完成不同媒體之間的語義挖掘,一般需要先將不同維度的媒體映射到一個(gè)公共的媒體空間中去。現(xiàn)有的基于典型相關(guān)分析、核典型相關(guān)分析、深度典型相關(guān)分析等跨媒體語義挖掘方法,僅利用了不同媒體之間的相關(guān)特征,但是忽略了媒體樣本自身所帶的語義信息,并且沒有利用數(shù)據(jù)的標(biāo)簽信息,僅僅通過無監(jiān)督學(xué)習(xí)完成語義挖掘,這不僅不利于理解媒體本身的所表達(dá)的意義,也限制了多種媒體數(shù)據(jù)之間的語義理解。為了解決上述問題,本文在深度典型相關(guān)分析的基礎(chǔ)上,提出深度語義典型相關(guān)分析算法。通過在其損失函數(shù)中引入媒體數(shù)據(jù)關(guān)于類別的語義信息,獲得同時(shí)包含相關(guān)信息和語義信息的特征。提出組合語義空間算法,利用邏輯斯蒂回歸,對各種媒體數(shù)據(jù)進(jìn)行分類,獲得類別特征,在深度語義典型相關(guān)分析算法的基礎(chǔ)上構(gòu)建組合語義空間,進(jìn)一步挖掘媒體數(shù)據(jù)所包含的語義信息。本文利用跨媒體檢索的效果來驗(yàn)證算法的有效性。在兩個(gè)權(quán)威的跨媒體數(shù)據(jù)集上將本文提出的深度語義典型...
【文章來源】:武漢科技大學(xué)湖北省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
CMDN算法流程圖
驗(yàn)數(shù)據(jù)集選用兩個(gè)標(biāo)準(zhǔn)的跨媒體數(shù)據(jù)集來完成在文本、圖像數(shù)據(jù)上的語義挖 Wikipedia 數(shù)據(jù)集、Xmedia 數(shù)據(jù)集。ipedia 數(shù)據(jù)集,該數(shù)據(jù)集是從收集的 2700 篇“專題文章”中挑選出來 29 類,Wikipedia 數(shù)據(jù)集由其中最熱門的前 10 類組成。每篇文章都個(gè)來自維基百科的圖片。根據(jù)章節(jié)的標(biāo)題,每篇文章被分成幾個(gè)章料庫包含總共 2866 個(gè)文檔,并且被隨機(jī)分成 2173 個(gè)文檔的訓(xùn)練集和測試集。edia 數(shù)據(jù)集,該數(shù)據(jù)集由 5000 個(gè)文本、5000 個(gè)圖像、500 個(gè)視頻、 500 個(gè) 3D 模型組成。所有的媒體數(shù)據(jù)都是從互聯(lián)網(wǎng)網(wǎng)站上抓取的,,YouTube,自由之聲,3D 倉庫和普林斯頓 3D 模型搜索引擎等等?棾 20 個(gè)類別,每個(gè)類別有 600 個(gè)媒體數(shù)據(jù),并且隨機(jī)分成 9600訓(xùn)練集和 2400 個(gè)媒體數(shù)據(jù)的測試集。本文在實(shí)驗(yàn)過程中只用到了其本數(shù)據(jù)。
XMedia數(shù)據(jù)集前10個(gè)類別
【參考文獻(xiàn)】:
期刊論文
[1]基于圖結(jié)構(gòu)的文本表示方法研究[J]. 任浩,羅森林,潘麗敏,高君豐. 信息網(wǎng)絡(luò)安全. 2017(03)
[2]采用空間詞袋模型的圖像分類方法[J]. 陳瑩,高含. 小型微型計(jì)算機(jī)系統(tǒng). 2016(09)
[3]應(yīng)用圖學(xué)習(xí)算法的跨媒體相關(guān)模型圖像語義標(biāo)注[J]. 李玲,宋瑩瑋,楊秀華,陳逸杰. 光學(xué)精密工程. 2016(01)
[4]利用深度玻爾茲曼機(jī)與典型相關(guān)分析的自動(dòng)圖像標(biāo)注算法[J]. 劉凱,張立民,孫永威,林雪原. 西安交通大學(xué)學(xué)報(bào). 2015(06)
[5]核典型相關(guān)分析算法的多特征融合情感識別[J]. 劉付民,張治斌,沈記全. 計(jì)算機(jī)工程與應(yīng)用. 2014(09)
[6]方向梯度直方圖及其擴(kuò)展[J]. 傅紅普,鄒北驥. 計(jì)算機(jī)工程. 2013(05)
[7]局部二值模式方法研究與展望[J]. 宋克臣,顏云輝,陳文輝,張旭. 自動(dòng)化學(xué)報(bào). 2013(06)
[8]一種結(jié)合詞項(xiàng)語義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[9]光照不均圖像增強(qiáng)方法綜述[J]. 梁琳,何衛(wèi)平,雷蕾,張維,王紅霄. 計(jì)算機(jī)應(yīng)用研究. 2010(05)
[10]基于語義的跨媒體信息檢索技術(shù)研究[J]. 蔡平,王志強(qiáng),傅向華. 微電子學(xué)與計(jì)算機(jī). 2010(03)
碩士論文
[1]基于布爾模型的網(wǎng)頁查重算法研究[D]. 連浩.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號:3533465
【文章來源】:武漢科技大學(xué)湖北省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
CMDN算法流程圖
驗(yàn)數(shù)據(jù)集選用兩個(gè)標(biāo)準(zhǔn)的跨媒體數(shù)據(jù)集來完成在文本、圖像數(shù)據(jù)上的語義挖 Wikipedia 數(shù)據(jù)集、Xmedia 數(shù)據(jù)集。ipedia 數(shù)據(jù)集,該數(shù)據(jù)集是從收集的 2700 篇“專題文章”中挑選出來 29 類,Wikipedia 數(shù)據(jù)集由其中最熱門的前 10 類組成。每篇文章都個(gè)來自維基百科的圖片。根據(jù)章節(jié)的標(biāo)題,每篇文章被分成幾個(gè)章料庫包含總共 2866 個(gè)文檔,并且被隨機(jī)分成 2173 個(gè)文檔的訓(xùn)練集和測試集。edia 數(shù)據(jù)集,該數(shù)據(jù)集由 5000 個(gè)文本、5000 個(gè)圖像、500 個(gè)視頻、 500 個(gè) 3D 模型組成。所有的媒體數(shù)據(jù)都是從互聯(lián)網(wǎng)網(wǎng)站上抓取的,,YouTube,自由之聲,3D 倉庫和普林斯頓 3D 模型搜索引擎等等?棾 20 個(gè)類別,每個(gè)類別有 600 個(gè)媒體數(shù)據(jù),并且隨機(jī)分成 9600訓(xùn)練集和 2400 個(gè)媒體數(shù)據(jù)的測試集。本文在實(shí)驗(yàn)過程中只用到了其本數(shù)據(jù)。
XMedia數(shù)據(jù)集前10個(gè)類別
【參考文獻(xiàn)】:
期刊論文
[1]基于圖結(jié)構(gòu)的文本表示方法研究[J]. 任浩,羅森林,潘麗敏,高君豐. 信息網(wǎng)絡(luò)安全. 2017(03)
[2]采用空間詞袋模型的圖像分類方法[J]. 陳瑩,高含. 小型微型計(jì)算機(jī)系統(tǒng). 2016(09)
[3]應(yīng)用圖學(xué)習(xí)算法的跨媒體相關(guān)模型圖像語義標(biāo)注[J]. 李玲,宋瑩瑋,楊秀華,陳逸杰. 光學(xué)精密工程. 2016(01)
[4]利用深度玻爾茲曼機(jī)與典型相關(guān)分析的自動(dòng)圖像標(biāo)注算法[J]. 劉凱,張立民,孫永威,林雪原. 西安交通大學(xué)學(xué)報(bào). 2015(06)
[5]核典型相關(guān)分析算法的多特征融合情感識別[J]. 劉付民,張治斌,沈記全. 計(jì)算機(jī)工程與應(yīng)用. 2014(09)
[6]方向梯度直方圖及其擴(kuò)展[J]. 傅紅普,鄒北驥. 計(jì)算機(jī)工程. 2013(05)
[7]局部二值模式方法研究與展望[J]. 宋克臣,顏云輝,陳文輝,張旭. 自動(dòng)化學(xué)報(bào). 2013(06)
[8]一種結(jié)合詞項(xiàng)語義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[9]光照不均圖像增強(qiáng)方法綜述[J]. 梁琳,何衛(wèi)平,雷蕾,張維,王紅霄. 計(jì)算機(jī)應(yīng)用研究. 2010(05)
[10]基于語義的跨媒體信息檢索技術(shù)研究[J]. 蔡平,王志強(qiáng),傅向華. 微電子學(xué)與計(jì)算機(jī). 2010(03)
碩士論文
[1]基于布爾模型的網(wǎng)頁查重算法研究[D]. 連浩.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號:3533465
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3533465.html
最近更新
教材專著