近重復(fù)視頻檢測(cè)算法研究
本文選題:近重復(fù)視頻檢測(cè) + 相似性查詢 ; 參考:《復(fù)旦大學(xué)》2012年博士論文
【摘要】:隨著寬帶傳輸網(wǎng)絡(luò)的日益完善和視頻軟、硬件處理技術(shù)的快速發(fā)展和廣泛應(yīng)用,尤其隨著WEB2.0技術(shù)的快速發(fā)展,使得網(wǎng)絡(luò)視頻內(nèi)容呈爆炸性增長(zhǎng)的同時(shí)也伴隨著產(chǎn)生了大量的近重復(fù)視頻。大量近重復(fù)視頻的產(chǎn)生給版權(quán)保護(hù)、視頻內(nèi)容監(jiān)管和視頻搜索引擎結(jié)果排序等多方面帶來技術(shù)性的挑戰(zhàn)。在此背景下,基于內(nèi)容的近重復(fù)視頻檢測(cè)技術(shù)應(yīng)運(yùn)而生。 本文對(duì)目前主要的近重復(fù)視頻檢測(cè)技術(shù)進(jìn)行了總結(jié)。盡管這些方法有各自的應(yīng)用場(chǎng)景,其技術(shù)細(xì)節(jié)也不僅相同,但其檢測(cè)流程可以用四個(gè)主要的步驟進(jìn)行概括:1)抽取視頻關(guān)鍵幀;2)提取視頻關(guān)鍵幀特征;3)執(zhí)行基于視頻關(guān)鍵幀特征的相似性查詢;4)在關(guān)鍵幀特征相似性查詢結(jié)果的基礎(chǔ)上執(zhí)行視頻子序列匹配,實(shí)現(xiàn)對(duì)近重復(fù)視頻的判別和定位。在這四個(gè)步驟中,關(guān)鍵幀的抽取方法已相對(duì)成熟,因此,目前對(duì)基于內(nèi)容的近重復(fù)視頻檢測(cè)的研究主要集中在穩(wěn)定的、高區(qū)分度的視頻特征抽取,高效的特征相似性查詢和準(zhǔn)確的視頻子序列匹配這三個(gè)方面。本文對(duì)這三方面的相關(guān)技術(shù)進(jìn)行了總結(jié),并在此基礎(chǔ)上提出了我們的方法。 在近重復(fù)視頻檢測(cè)中的特征研究方面,本文做了兩方面的工作:1)在SIFT(Scale Invariant Feature Transform)特征點(diǎn)集合基礎(chǔ)上,提出了利用奇異值分解方法獲取SVD-SIFT(Singular Value Decomposition-SIFT)特征。2)對(duì)SIFT描述子的描述方法進(jìn)行了改進(jìn),提出了梯度序數(shù)特征,簡(jiǎn)稱GOS(Gradient Ordinal Sig-nature)。相比于標(biāo)準(zhǔn)的SIFT描述子,在特征描述能力方面,SVD-SIFT和GOS基本上保存了原始SIFT描述子所具有的尺度不變性、旋轉(zhuǎn)不變性等良好特性。其中GOS還新添了鏡像不變特性,具有更好的適應(yīng)性。但SVD-SIFT和GOS的計(jì)算更加簡(jiǎn)單,維數(shù)也大大降低,因而有效提高了系統(tǒng)的檢測(cè)速度。 在近重復(fù)視頻檢測(cè)中的關(guān)鍵幀特征相似性查詢研究方面,本文在分析排序類特征的一些內(nèi)在特性的基礎(chǔ)上,結(jié)合度量空間嵌入理論。提出了一種高效的相似性查詢方法,基于固定點(diǎn)嵌入的相似性查詢方法,簡(jiǎn)稱FE(Fixed point-based Embedding)。FE源于一個(gè)簡(jiǎn)單的思想:如果原始空間中兩個(gè)靠得很近的點(diǎn),經(jīng)過“嵌入”后在嵌入空間中可能仍然會(huì)靠得很近。而FE的收斂性能確保這種假設(shè)的成立。通過固定點(diǎn)嵌入后,高維空間中相似的數(shù)據(jù)點(diǎn)會(huì)投影到相同槽中,然后通過建立一個(gè)倒排索引結(jié)構(gòu)執(zhí)行高效的相似性查詢。 在近重復(fù)視頻檢測(cè)中的視頻子序列匹配研究方面,本文提出了基于圖的視頻子序列匹配算法。該方法將基于關(guān)鍵幀特征的相似性查詢結(jié)果構(gòu)建成匹配結(jié)果圖,進(jìn)而將近重復(fù)視頻檢測(cè)轉(zhuǎn)換成了一一個(gè)在匹配結(jié)果圖中查找最長(zhǎng)路徑的問題。該方法有三個(gè)主要優(yōu)勢(shì):1)它能在眾多雜亂的匹配結(jié)果中找到最佳的匹配序列,有效剔除了某些假“高相似度”匹配帶來的噪聲,因而它能在一定程度上彌補(bǔ)底層特征描述力的不足。2)由于它充分考慮和利用了視頻序列的時(shí)序特性,從而具有很高的近重復(fù)視頻定位準(zhǔn)確度。3)它能自動(dòng)檢測(cè)出匹配結(jié)果圖中存在的多條離散路徑,從而能一次性檢測(cè)出兩段視頻中可能存在多段近重復(fù)視頻的情形。 最后,通過實(shí)驗(yàn)對(duì)本文提出的方法進(jìn)行了評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明:本文提出的方法,在單個(gè)技術(shù)指標(biāo)方面獲得了接近于最好方法的性能。但將這些方法綜合應(yīng)用于近重復(fù)視頻檢測(cè)中,獲得了更好的表現(xiàn)。
[Abstract]:With the improvement of broadband transmission network and the rapid development and wide application of video soft, hardware processing technology, especially with the rapid development of WEB2.0 technology, the content of network video is explosively growing and a large number of near repeated video are produced. A large number of near repetition video is produced to copyright protection, video content supervision In this context, the content based near duplicate video detection technology arises at the historic moment.
In this paper, the main near repetition video detection techniques are summarized. Although these methods have their own application scenes, their technical details are not only the same, but the detection process can be summarized in four main steps: 1) extracting video key frames; 2) extracting the feature of the video key frame; 3) executing the key frame feature based on the video. Similarity query; 4) performing video subsequence matching on the basis of the result of key frame feature similarity query to realize the discrimination and location of near repeated video. In these four steps, the extraction method of key frames is relatively mature, so the current research on content based near duplicate video detection is mainly concentrated in stable, high area The video feature extraction of indexing, efficient feature similarity query and accurate video subsequence matching are three aspects. This paper summarizes the related technologies of these three aspects and proposes our methods on the basis of this.
In the feature research of near repetition video detection, two aspects are done in this paper: 1) on the basis of SIFT (Scale Invariant Feature Transform) feature point set, we propose a singular value decomposition method to obtain SVD-SIFT (Singular Value Decomposition-SIFT) special.2) to improve the description of the SIFT descriptor. The gradient ordinal number feature, called GOS (Gradient Ordinal Sig-nature). Compared to the standard SIFT descriptor, the SVD-SIFT and GOS basically preserve the good properties of the scale invariance and rotation invariance of the original SIFT descriptors. In addition, GOS also adds a new image invariant feature, but has better adaptability. The computation of SVD-SIFT and GOS is simpler and the dimension is greatly reduced, which improves the detection speed of the system effectively.
In the research of key frame feature similarity query in near repetition video detection, this paper, based on the analysis of some inherent characteristics of the sort feature, combined with the metric space embedding theory, proposes an efficient similarity query method based on the fixed point embedded similarity query method, called FE (Fixed point-based Embedding).F. E comes from a simple idea that if two very close points in the original space are "embedded" in the embedded space, it may still be very close. And the convergence performance of the FE ensures the assumption that the similar data points in the high dimensional space will be projected into the same slot after a fixed point is embedded, and then by establishing one The inverted index structure performs an efficient similarity query.
In the research of video subsequence matching in near repetition video detection, this paper proposes a graph based video subsequence matching algorithm, which constructs a matching result map based on the similarity of key frame features, and then converts nearly repeated video detection into one of the longest paths in the matching result graph. This method has three main advantages: 1) it can find the best matching sequence in a large number of chaotic matching results, effectively eliminate the noise caused by some false "high similarity" matching, so it can make up for the insufficient.2 of the underlying feature description to a certain extent. Because it fully considers and uses the temporal characteristics of video sequence. In this way, it has a high accuracy of near repetition video positioning (.3). It can automatically detect multiple discrete paths that exist in the matching result graph, and can detect the possibility of multi segment near repetition video in two segments of video in one time.
Finally, the method is evaluated by the experiment. The experimental results show that the method proposed in this paper obtains the performance close to the best method in a single technical index. However, these methods are applied to the near repetition video detection and get a better appearance.
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李向明;沈夏;;基于視頻檢測(cè)的電子警察前端系統(tǒng)設(shè)計(jì)[J];通信電源技術(shù);2010年02期
2 劉智勇,謝長(zhǎng)壽;基于D-S證據(jù)理論的車輛視頻檢測(cè)方法[J];計(jì)算機(jī)工程;2003年12期
3 劉相瑩;;智能交通中的車輛檢測(cè)技術(shù)及其發(fā)展[J];科技信息(學(xué)術(shù)研究);2007年28期
4 高新波;田春娜;張娜;;一種基于SVM主動(dòng)學(xué)習(xí)的卡通視頻檢測(cè)方法[J];電子與信息學(xué)報(bào);2007年06期
5 蔣立正 ,吳群 ,張立民;串口聯(lián)網(wǎng)技術(shù)在交通信息系統(tǒng)中的應(yīng)用[J];電子產(chǎn)品世界;2004年04期
6 王命延;朱明峰;王昊;;機(jī)動(dòng)車視頻測(cè)速中關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2006年05期
7 楊一麟;楊晨暉;;一種基于位置預(yù)判和模板匹配的車輛跟蹤算法[J];福建電腦;2007年02期
8 杜蕾;;車輛視頻檢測(cè)算法的研究[J];科技資訊;2008年11期
9 曹潔;徐永勝;;基于D-S證據(jù)理論的車輛視頻檢測(cè)的研究[J];計(jì)算機(jī)仿真;2007年07期
10 閆富江;王東勝;王俊;;機(jī)器視覺技術(shù)在交通領(lǐng)域的應(yīng)用探討[J];黑龍江交通科技;2008年09期
相關(guān)會(huì)議論文 前10條
1 林文永;石志國(guó);薛為民;陳鋒軍;;隱馬爾可夫模型實(shí)現(xiàn)語音和視頻識(shí)別[A];第一屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2002年
2 郭競(jìng);;視頻檢測(cè)技術(shù)的應(yīng)用[A];湖北省公路學(xué)會(huì)——2004年機(jī)電工程研討會(huì)論文集[C];2004年
3 邢恩輝;王銳;賈元華;;視頻檢測(cè)技術(shù)在寒區(qū)城市快速路交通流特性研究的應(yīng)用[A];第十二屆中國(guó)體視學(xué)與圖像分析學(xué)術(shù)會(huì)議論文集[C];2008年
4 秦鐘;王法勝;;交叉口排隊(duì)長(zhǎng)度的視頻檢測(cè)[A];第二十九屆中國(guó)控制會(huì)議論文集[C];2010年
5 李志慧;勞云騰;王殿海;祁宏生;;混合交通流視頻檢測(cè)中區(qū)域選擇更新混合高斯背景模型研究[A];可持續(xù)發(fā)展的中國(guó)交通——2005全國(guó)博士生學(xué)術(shù)論壇(交通運(yùn)輸工程學(xué)科)論文集(上冊(cè))[C];2005年
6 呂同玲;任洪娥;馬巖;;長(zhǎng)條薄片刨花視頻檢測(cè)方法的探討[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
7 張盈盈;姚丹亞;呂克遜;;實(shí)時(shí)視頻檢測(cè)技術(shù)在城市交通管理規(guī)劃中的應(yīng)用[A];2008第四屆中國(guó)智能交通年會(huì)論文集[C];2008年
8 史迎春;周獻(xiàn)中;辛動(dòng)軍;駱文;張峰;;一種基于時(shí)空切片邊緣分析的WIPE檢測(cè)算法[A];2005中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集(上)[C];2005年
9 陳喜群;楊新苗;史其信;;城市道路車牌識(shí)別系統(tǒng)在交通管理中的應(yīng)用[A];2008第四屆中國(guó)智能交通年會(huì)論文集[C];2008年
10 柯剛鎧;胡堅(jiān)明;姚丹亞;;一種適用于嵌入式平臺(tái)的交通流視頻檢測(cè)方法[A];2008第四屆中國(guó)智能交通年會(huì)論文集[C];2008年
相關(guān)重要報(bào)紙文章 前10條
1 毅力;Micro-Check視頻檢測(cè)系統(tǒng)[N];中國(guó)包裝報(bào);2002年
2 雷曉;用視頻檢測(cè)完成智能監(jiān)控[N];中國(guó)交通報(bào);2003年
3 徐穎 編譯;視頻檢測(cè)系統(tǒng)幫我們得到接近完美的雕刻網(wǎng)穴[N];中國(guó)包裝報(bào);2002年
4 ;金屬包裝罐卷封質(zhì)量視頻檢測(cè)儀[N];中國(guó)包裝報(bào);2005年
5 吳曉征;專家研討高速公路信息化[N];安徽日?qǐng)?bào);2007年
6 記者 侯莎莎 通訊員 宋澤宇;6.6萬人昨天上網(wǎng)查詢路況[N];北京日?qǐng)?bào);2006年
7 本報(bào)記者 王力;加強(qiáng)管理和提高素質(zhì) 為緩解交通兩難“破題”[N];杭州日?qǐng)?bào);2007年
8 記者 朱盈潔;大企業(yè)申報(bào)數(shù)量增加[N];首都建設(shè)報(bào);2006年
9 邢夢(mèng)宇 汪秀芬;“美的”風(fēng)扇:吹開快速通關(guān)大門[N];中國(guó)貿(mào)易報(bào);2007年
10 記者 馬瑜;昌吉市區(qū)道路安裝“電子眼”[N];昌吉日?qǐng)?bào);2007年
相關(guān)博士學(xué)位論文 前10條
1 劉紅;近重復(fù)視頻檢測(cè)算法研究[D];復(fù)旦大學(xué);2012年
2 江晟;混合交通視頻檢測(cè)關(guān)鍵技術(shù)研究[D];吉林大學(xué);2013年
3 馬增強(qiáng);運(yùn)動(dòng)車輛視頻檢測(cè)與分割方法研究[D];北京交通大學(xué);2011年
4 朱諾;基于視頻檢測(cè)和元胞自動(dòng)機(jī)的人群疏散機(jī)理研究[D];北京交通大學(xué);2012年
5 李娟;城市交通系統(tǒng)中行人交通視頻檢測(cè)的理論與方法[D];北京交通大學(xué);2010年
6 吳駿;智能交通系統(tǒng)中的信息處理關(guān)鍵技術(shù)研究[D];天津大學(xué);2007年
7 曲昭偉;混合交通視頻檢測(cè)算法研究[D];吉林大學(xué);2009年
8 李晗;同步檢測(cè)線方法及其在軌道交通中的應(yīng)用[D];浙江大學(xué);2005年
9 李琦;面向行人群信息提取的視頻圖像目標(biāo)跟蹤算法研究[D];北京交通大學(xué);2013年
10 洪曉鵬;新型二階統(tǒng)計(jì)描述子及其在物體檢測(cè)與跟蹤方面的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 趙茵茵;基于FPGA的視頻檢測(cè)系統(tǒng)的設(shè)計(jì)[D];北京交通大學(xué);2010年
2 沈濤;基于視頻檢測(cè)的行人交通參數(shù)提取技術(shù)研究[D];北京交通大學(xué);2011年
3 劉艷民;基于運(yùn)動(dòng)特征的不良視頻檢測(cè)算法研究[D];蘭州大學(xué);2010年
4 李楊;視頻檢測(cè)中高斯分布模型的應(yīng)用[D];吉林大學(xué);2008年
5 劉永祥;基于視頻檢測(cè)的電子警察前端系統(tǒng)研究與設(shè)計(jì)[D];武漢科技大學(xué);2010年
6 陳攀;基于特征部位和膚色的不良視頻檢測(cè)的算法研究[D];華中師范大學(xué);2011年
7 謝恩;基于視頻檢測(cè)的闖紅燈記錄儀研究與設(shè)計(jì)[D];華中科技大學(xué);2005年
8 林濤;視覺交通檢測(cè)技術(shù)的研究[D];天津大學(xué);2005年
9 李愛軍;基于幀差法的交通圖像形態(tài)學(xué)濾波處理方法的研究[D];沈陽工業(yè)大學(xué);2006年
10 蔡光明;高速鐵路橋梁底面裂縫的視頻檢測(cè)系統(tǒng)研究[D];北京交通大學(xué);2011年
,本文編號(hào):1893745
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1893745.html