視頻概念檢測中的領(lǐng)域自適應(yīng)和語義關(guān)聯(lián)研究
本文關(guān)鍵詞:視頻概念檢測中的領(lǐng)域自適應(yīng)和語義關(guān)聯(lián)研究 出處:《北京交通大學(xué)》2016年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 視頻標(biāo)注 概念檢測 領(lǐng)域自適應(yīng) 多特征融合 概念關(guān)聯(lián) 語義模型
【摘要】:當(dāng)今社會,智能設(shè)備正以前所未有的速度進(jìn)行普及,日漸完善的互聯(lián)網(wǎng)和移動網(wǎng)絡(luò)將來自全世界的信息匯總和連接,人們從信息的接受者逐漸變成了信息的創(chuàng)造者和傳播者。視頻作為一種信息的常見載體,融合了圖像、時序、音頻等多種特征,具有直觀生動的特點(diǎn),被廣泛地應(yīng)用。然而視頻中所包含的復(fù)雜的語義層級信息對高效的管理和準(zhǔn)確的檢索提出了更為嚴(yán)苛的挑戰(zhàn)。在視頻人工標(biāo)注過于昂貴的情況下,為了從視頻內(nèi)容中直接讀取出其中包含的物體、人物、場景等語義層概念,發(fā)展出了基于內(nèi)容的視頻概念檢測技術(shù)。然而,當(dāng)前的視頻概念檢測技術(shù)尚且面臨著種種困難,還無法很好地在實際中得到應(yīng)用。比如訓(xùn)練庫與測試庫不同領(lǐng)域之間廣泛存在的樣本分布差異導(dǎo)致檢測器的性能下降、找尋視頻中多種特征之間靈活高效的融合方式、低層特征與高層特征之間存在的“語義鴻溝”等問題。本文以上述三方面中的研究難點(diǎn)為出發(fā)點(diǎn),對視頻概念檢測中的特征層領(lǐng)域自適應(yīng)問題、多特征融合中的領(lǐng)域自適應(yīng)問題以及視頻概念間的語義關(guān)聯(lián)進(jìn)行了探討和創(chuàng)新,主要取得的成果如下:(1)針對目前特征層的不同領(lǐng)域間樣本分布差異的問題,本文基于Adaboost提出了領(lǐng)域自適應(yīng)boosting算法(DAB)。它主要解決的是當(dāng)前TrAdaBoost算法中存在的目標(biāo)領(lǐng)域(測試庫)與源領(lǐng)域(訓(xùn)練庫)數(shù)據(jù)分配不合理的問題,分為兩個主要步驟:首先對源領(lǐng)域的數(shù)據(jù)在特征空間內(nèi)進(jìn)行無監(jiān)督分類;然后在迭代訓(xùn)練中,將目標(biāo)領(lǐng)域驗證集中選擇出的樣本映射到已分類的源領(lǐng)域特征空間中,匹配出一定數(shù)量的源領(lǐng)域樣本。最后,兩個領(lǐng)域選擇出的數(shù)據(jù)共同進(jìn)行弱分類器的訓(xùn)練。作為TrAdaBoost算法的一種改進(jìn)型算法,DAB算法能夠很好地解決大規(guī)模領(lǐng)域定義和小尺寸驗證集的情況。DAB算法有兩個主要優(yōu)點(diǎn):在訓(xùn)練中能夠突出目標(biāo)領(lǐng)域數(shù)據(jù)的重要性,在實驗中獲得了更好性能表現(xiàn);由于不需要對源領(lǐng)域的數(shù)據(jù)進(jìn)行判別和權(quán)值計算,因而減小了計算量。(2)針對當(dāng)前多特征融合研究中的領(lǐng)域自適應(yīng)能力缺失的問題,本文提出了領(lǐng)域自適應(yīng)的線性融合方法(DALC).它是一種后期融合方法,基于多特征分類器的輸出分值進(jìn)行融合。該算法以線性融合模型(LC)為基礎(chǔ),通過分析源領(lǐng)域和目標(biāo)領(lǐng)域之間的差異,來自適應(yīng)更新LC模型的融合參數(shù)。它的原理是找尋領(lǐng)域樣本與LC融合參數(shù)之間的關(guān)聯(lián)關(guān)系,利用源領(lǐng)域中已經(jīng)建立的關(guān)聯(lián)關(guān)系去指導(dǎo)目標(biāo)領(lǐng)域的關(guān)聯(lián)關(guān)系,通過優(yōu)化搜索來找尋更新后的融合參數(shù),使得兩個領(lǐng)域中存在的關(guān)聯(lián)關(guān)系距離最小。DALC模型是一種通用的非監(jiān)督式方法,不需要訓(xùn)練,有著很快的自適應(yīng)速度。與當(dāng)前一些沒有考慮領(lǐng)域自適應(yīng)的多特征融合方法相比,有著更好的融合性能。(3)針對視頻概念間的語義關(guān)聯(lián)問題,本文提出了基于節(jié)點(diǎn)平衡(NE)的概念關(guān)聯(lián)模型,它與DALC模型共同構(gòu)成了一個兩級語義模型。該方法以物理模型為基礎(chǔ),將概念之間的關(guān)聯(lián)性用物理性的引力和斥力進(jìn)行建模,而將一個個鏡頭-概念對看作是物理節(jié)點(diǎn),它們的分值則是它們所處的位置。對不同類別的概念關(guān)聯(lián)方式,可以定義不同種類的力,它們可以共同作用在一個節(jié)點(diǎn)之上,從而達(dá)到使用多種概念關(guān)聯(lián)共同作用的結(jié)果。與現(xiàn)有的方法相比,它可以使用多種概念間的關(guān)聯(lián)關(guān)系同時進(jìn)行構(gòu)建復(fù)雜的語義關(guān)系,文中使用了三種關(guān)聯(lián):共存關(guān)聯(lián)、層級關(guān)聯(lián)和時序關(guān)聯(lián)。它是一種啟發(fā)式模型,對概念的關(guān)聯(lián)過程以模擬人的先驗知識為主導(dǎo),因此具有直觀性的特點(diǎn)。此外,它有著簡潔的關(guān)聯(lián)方程,求解過程快速;并且可以根據(jù)先驗知識或訓(xùn)練數(shù)據(jù)的有無,應(yīng)用監(jiān)督式或無監(jiān)督式的關(guān)聯(lián)參數(shù)。
[Abstract]:In the present society , the intelligent equipment is popularized in unprecedented speed , and the increasingly perfect Internet and mobile network bring about information summarization and connection from the whole world . In this paper , a concept association model based on node balance ( NE ) is proposed based on the correlation between the source domain and the target field .
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊富強(qiáng);愛維德在中國拓展新視頻領(lǐng)域[J];今日電子;1996年04期
2 王縵縵;愛維德技術(shù)公司在中國拓展新視頻領(lǐng)域[J];現(xiàn)代電信科技;1996年04期
3 陳永東;;2010年網(wǎng)絡(luò)視頻領(lǐng)域發(fā)展趨勢[J];軟件工程師;2010年Z1期
4 蘇巖;;微視頻發(fā)展歷史研究[J];軟件導(dǎo)刊(教育技術(shù));2011年11期
5 瞬雨;;視頻突破:聚合的開放性意義[J];軟件工程師;2009年06期
6 吳勇毅;;以創(chuàng)新破困局——2012視頻網(wǎng)業(yè)之嬗變[J];軟件工程師;2012年05期
7 李蕭然;;三視頻巨頭棄成見結(jié)盟 二三線陣營面臨生死抉擇[J];IT時代周刊;2012年10期
8 賈志宏 ,康文萱;1993年《國際音視頻》雜志視頻大獎賽[J];今日電子;1994年01期
9 莫黎,方驊;多媒體技術(shù)在視頻領(lǐng)域中的應(yīng)用[J];計算機(jī)與數(shù)字工程;2002年05期
10 ;2008年市場規(guī)模超15億 網(wǎng)絡(luò)視頻業(yè)格局漸明[J];中國傳媒科技;2008年01期
相關(guān)重要報紙文章 前10條
1 西平;億萬財富百日造 網(wǎng)絡(luò)視頻的現(xiàn)實抉擇[N];中國經(jīng)濟(jì)時報;2006年
2 薛娟;網(wǎng)絡(luò)視頻:燒錢不賺錢?[N];中國經(jīng)濟(jì)時報;2007年
3 張牧涵;網(wǎng)絡(luò)視頻挑戰(zhàn)電視[N];市場報;2007年
4 張亞萍;“新規(guī)”加速視頻業(yè)健康發(fā)展[N];光明日報;2009年
5 本報記者 黃智軍;第一視頻 出擊微視頻 打造明星團(tuán)隊[N];計算機(jī)世界;2010年
6 本報記者 劉燕;第一視頻主推微視頻[N];科技日報;2010年
7 實習(xí)記者 俞悅;網(wǎng)絡(luò)視頻試圖聯(lián)姻傳統(tǒng)行業(yè) 基因成本眾多因素左右其抉擇[N];中國計算機(jī)報;2008年
8 商報實習(xí)記者 魏蔚;新浪推微視頻趕搭行業(yè)末班車[N];北京商報;2011年
9 本報記者 王榮;激動網(wǎng)首推視頻云計劃[N];中國證券報;2011年
10 本報記者 任曉寧;微視頻一路升溫:產(chǎn)業(yè)前景日見清晰[N];中國新聞出版報;2012年
相關(guān)博士學(xué)位論文 前10條
1 趙敏丞;無線網(wǎng)絡(luò)中視頻跨層傳輸關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2015年
2 耿杰;視頻概念檢測中的領(lǐng)域自適應(yīng)和語義關(guān)聯(lián)研究[D];北京交通大學(xué);2016年
3 劉桂清;視頻摘要技術(shù)的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2004年
4 梅濤;家用視頻內(nèi)容分析方法研究[D];中國科學(xué)技術(shù)大學(xué);2006年
5 宋彥;視頻語義標(biāo)注方法和理論的研究[D];中國科學(xué)技術(shù)大學(xué);2006年
6 付暢儉;基于內(nèi)容的視頻結(jié)構(gòu)挖掘方法研究[D];國防科學(xué)技術(shù)大學(xué);2008年
7 白亮;本體支持的視頻情報分析方法與技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年
8 羅青山;面向視頻挖掘的視覺內(nèi)容分析[D];上海交通大學(xué);2009年
9 張靜;視頻信息檢索研究[D];復(fù)旦大學(xué);2006年
10 郭戈;數(shù)字視頻語義信息提取與分析[D];解放軍信息工程大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 王嫣然;視頻的美學(xué)和有趣性計算角度[D];復(fù)旦大學(xué);2014年
2 陳倬;3D視頻c\索引擎中3D視頻識別和聚類的研究[D];電子科技大學(xué);2014年
3 范玉憲;視頻監(jiān)控中人體跟蹤的研究與實現(xiàn)[D];浙江工業(yè)大學(xué);2015年
4 黃吉羊;基于視頻非接觸技術(shù)的身份識別、追蹤及異常預(yù)警[D];浙江大學(xué);2016年
5 姜麗秋;視頻網(wǎng)站傳播模式及發(fā)展策略研究[D];湖南師范大學(xué);2015年
6 李亞;解析新浪視頻的成功運(yùn)作[D];華中科技大學(xué);2009年
7 陳錦星;視頻監(jiān)控云系統(tǒng)架構(gòu)及運(yùn)營模式的研究[D];大連理工大學(xué);2013年
8 李春亮;廣告視頻探測技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年
9 郭婧;中國視頻網(wǎng)站現(xiàn)狀探析[D];上海交通大學(xué);2011年
10 汪芬;壓縮域內(nèi)視頻切換檢測的研究[D];北京郵電大學(xué);2006年
,本文編號:1362310
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/1362310.html