天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

視覺(jué)分析中的層次化結(jié)構(gòu)關(guān)聯(lián)特性研究

發(fā)布時(shí)間:2018-06-15 02:14

  本文選題:結(jié)構(gòu)化分析 + 先驗(yàn)知識(shí) ; 參考:《合肥工業(yè)大學(xué)》2016年博士論文


【摘要】:通過(guò)對(duì)大樣本數(shù)據(jù)進(jìn)行有效的表征、學(xué)習(xí)和推理,實(shí)現(xiàn)對(duì)圖像、視頻等在內(nèi)的多媒體信息的自動(dòng)理解是計(jì)算機(jī)視覺(jué)的主要研究?jī)?nèi)容之一。不同的視覺(jué)分析處理過(guò)程具有天然的層次特性和內(nèi)在關(guān)聯(lián)。低層視覺(jué)任務(wù)通常直接對(duì)二維像素點(diǎn)陣進(jìn)行處理,求解結(jié)果可以為中高層分析理解過(guò)程奠定有效的基礎(chǔ);中層視覺(jué)任務(wù)主要圍繞圖像視頻中所包含的興趣目標(biāo)展開(kāi)研究,分析獲得靜態(tài)目標(biāo)的固有屬性和動(dòng)態(tài)目標(biāo)的運(yùn)動(dòng)狀態(tài)。作為低層與高層任務(wù)之間的橋梁,中層視覺(jué)分析過(guò)程既可以為低層操作提供新的信息指導(dǎo),同時(shí)也可以為高層理解提供有效的視覺(jué)線索。高層視覺(jué)任務(wù)進(jìn)一步通過(guò)研究各目標(biāo)之間的基本性質(zhì)和相互關(guān)聯(lián),獲得對(duì)整個(gè)輸入視覺(jué)信息的客觀解釋和知識(shí)描述,所得到的理解結(jié)果可以通過(guò)自頂向下的反饋過(guò)程,形成對(duì)中低層視覺(jué)任務(wù)的引導(dǎo)和約束,提高中低層操作的計(jì)算效能。圍繞不同層次的視覺(jué)分析任務(wù),現(xiàn)有多數(shù)研究方法通常遵循樣本獨(dú)立同分布假設(shè),通過(guò)使用機(jī)器學(xué)習(xí)算法對(duì)所獲取得到的視覺(jué)感知信息進(jìn)行建模和分析,從而獲得基于計(jì)算的理解結(jié)果。由于所獲取的原始特征通常存在大量的冗余和噪音,因此很難建立魯棒的分布表達(dá);更重要地,由于視覺(jué)信息之間的內(nèi)在邏輯和結(jié)構(gòu)關(guān)系被忽略,僅依靠低階統(tǒng)計(jì)量無(wú)法準(zhǔn)確的描述出真實(shí)數(shù)據(jù)的內(nèi)在關(guān)聯(lián),從而導(dǎo)致求解結(jié)果容易陷入局部最優(yōu),引起信息的錯(cuò)誤理解。分析樣本間結(jié)構(gòu)信息的高階統(tǒng)計(jì)特性,在多層次計(jì)算機(jī)視覺(jué)任務(wù)的分析求解中,以先驗(yàn)或約束的形式融入視覺(jué)信息的結(jié)構(gòu)化關(guān)聯(lián)表達(dá),建立原始特征數(shù)據(jù)與中高層語(yǔ)義知識(shí)之間的相互關(guān)聯(lián),為解決上述問(wèn)題提供了有效的途徑,因此具有重要的研究意義;诖,本文從結(jié)構(gòu)化分析的角度入手,重點(diǎn)圍繞多要素多模態(tài)視覺(jué)數(shù)據(jù)間的結(jié)構(gòu)關(guān)聯(lián)問(wèn)題展開(kāi)研究。通過(guò)在不同層次的視覺(jué)任務(wù)分析求解過(guò)程中,融入有效的結(jié)構(gòu)化描述,捕捉不同視覺(jué)要素間的相互影響與約束,建立原始特征數(shù)據(jù)與結(jié)構(gòu)知識(shí)描述之間的內(nèi)在聯(lián)系,從而指導(dǎo)不同物理實(shí)體下的視覺(jué)分析求解過(guò)程。論文的具體研究?jī)?nèi)容如下:(1)圍繞低層視覺(jué)分析處理任務(wù),針對(duì)像素點(diǎn)陣標(biāo)簽求取過(guò)程由于缺少先驗(yàn)信息指導(dǎo),導(dǎo)致對(duì)應(yīng)圖像分割結(jié)果破碎無(wú)實(shí)際意義這一問(wèn)題,提出多尺度馬爾科夫隨機(jī)場(chǎng)模型下的標(biāo)簽重標(biāo)記及映射法則。通過(guò)構(gòu)建視覺(jué)特征與無(wú)向圖模型節(jié)點(diǎn)之間的相互關(guān)聯(lián),從而將原始數(shù)據(jù)的結(jié)構(gòu)關(guān)系轉(zhuǎn)化為模型計(jì)算下的先驗(yàn)信息表達(dá)。通過(guò)分析同一尺度內(nèi)節(jié)點(diǎn)在空間鄰域中的一致性和不同尺度間節(jié)點(diǎn)在特征關(guān)聯(lián)下的相似性,設(shè)計(jì)不同尺度下的先驗(yàn)標(biāo)記獲取算法。通過(guò)分析立體結(jié)構(gòu)模型節(jié)點(diǎn)之間的內(nèi)在聯(lián)系,有效的融入先驗(yàn)信息的表達(dá),提高圖像分割的準(zhǔn)確性、魯棒性和普適性。(2)圍繞中層視覺(jué)分析處理任務(wù),針對(duì)靜態(tài)目標(biāo)識(shí)別過(guò)程由于缺少有效的生成結(jié)構(gòu)描述,導(dǎo)致特征相似目標(biāo)存在大量誤識(shí)別現(xiàn)象這一問(wèn)題,提出一種新的時(shí)序關(guān)聯(lián)隱狄利克雷分配模型。通過(guò)建立不同層次視覺(jué)要素與有向概率圖模型中不同節(jié)點(diǎn)間的對(duì)應(yīng)關(guān)聯(lián),獲得待識(shí)別目標(biāo)在有限個(gè)組成成分下的生成描述。進(jìn)一步,通過(guò)引入后驗(yàn)判別和開(kāi)關(guān)變量,建立特征數(shù)據(jù)在連續(xù)采樣運(yùn)算中生成表達(dá)的時(shí)空關(guān)聯(lián)約束。通過(guò)構(gòu)建不同視覺(jué)要素更加有效的生成式結(jié)構(gòu)表達(dá),指導(dǎo)中高層知識(shí)的推理運(yùn)算,提高目標(biāo)識(shí)別的準(zhǔn)確性和計(jì)算效率。(3)圍繞中層視覺(jué)分析處理任務(wù),針對(duì)目標(biāo)在運(yùn)動(dòng)過(guò)程中不同類(lèi)別標(biāo)簽下的動(dòng)作存在大量相似的運(yùn)動(dòng)形態(tài),影響動(dòng)作檢測(cè)的判別性能這一問(wèn)題,提出多視角下的判別字典學(xué)習(xí)框架。通過(guò)構(gòu)建同時(shí)包含共享字典和特定類(lèi)別子字典的通用字典,從而更好的刻畫(huà)不同動(dòng)作的特有屬性。通過(guò)引入組稀疏和局部限制性稀疏約束項(xiàng),從而在編碼描述中保存視覺(jué)特征的相互關(guān)聯(lián)和內(nèi)在結(jié)構(gòu)。此外,多視角下的特征表達(dá)進(jìn)一步通過(guò)稀疏編碼的方式被更好的融合在一起,從而獲得更加魯邦的運(yùn)動(dòng)形態(tài)描述。通過(guò)分析不同類(lèi)別運(yùn)動(dòng)特征之間的內(nèi)在關(guān)聯(lián)和結(jié)構(gòu)關(guān)系,提高動(dòng)作描述的判別特性和動(dòng)作識(shí)別的準(zhǔn)確率。(4)圍繞高層視覺(jué)分析處理任務(wù),針對(duì)有限樣本下判別模型對(duì)訓(xùn)練樣本敏感,導(dǎo)致分類(lèi)器學(xué)習(xí)結(jié)果泛化性能較弱,影響場(chǎng)景分類(lèi)性能這一問(wèn)題,提出貝葉斯先驗(yàn)約束下的混合判別方法。通過(guò)在判別學(xué)習(xí)框架下引入完整的生成學(xué)習(xí)過(guò)程,建立待分類(lèi)場(chǎng)景在有限個(gè)組成目標(biāo)下的生成結(jié)構(gòu)描述。通過(guò)定義反饋推理融合機(jī)制,對(duì)不同質(zhì)分類(lèi)器下的預(yù)測(cè)結(jié)果進(jìn)行樣本篩選和標(biāo)簽決策,從而自動(dòng)擴(kuò)展訓(xùn)練樣本集,實(shí)現(xiàn)模型的有效更新。通過(guò)構(gòu)建不同質(zhì)分類(lèi)器在決策層的融合,指導(dǎo)場(chǎng)景層中高層知識(shí)的推理求解過(guò)程,提高模型判別性能,從而獲得更高的場(chǎng)景分類(lèi)精度。
[Abstract]:The automatic understanding of multimedia information, such as image and video, is one of the main research contents of computer vision through the effective representation of large sample data, learning and reasoning, and realizing automatic understanding of multimedia information, such as images and video. Different visual analysis processes have natural layer characteristics and intrinsic relationships. The solution results can lay an effective foundation for the middle and high level analysis and understanding process. The middle layer vision task mainly focuses on the interest target contained in the image video, and analyzes the inherent property of the static target and the motion state of the dynamic target. As a bridge between the low level and the high-level tasks, the middle level visual analysis is over. The process can provide new information guidance for low level operation, and also provide effective visual cues for high level understanding. High level visual tasks further study the basic properties and interconnections between the targets, and obtain the objective interpretation and knowledge description of the entire input visual information. The top down feedback process forms the guidance and constraint of the middle and low level visual tasks to improve the computational efficiency of the middle and low level operation. Around the different levels of visual analysis tasks, most of the existing research methods usually follow the hypothesis of sample independence and distribution, modeling and modeling the acquired visual perception information by using machine learning algorithms. It is difficult to establish robust distribution expression, and more importantly, the internal logic and structural relationship between the visual information is ignored, and the real data can not be accurately described by the lower order statistics. In relation, the results can easily fall into the local optimal and cause the error understanding of the information. The high order statistical characteristics of the structural information between the samples are analyzed. In the analysis and solution of the multi-level computer vision tasks, the structural association expression of the visual information is integrated into the visual information in the form of prior or constraint, and the original feature data and the middle upper language are established. The interrelation between semantic knowledge provides an effective way to solve the above problems, so it has important research significance. Based on this, this paper focuses on the structure association of multi element and multi-modal visual data from the perspective of structural analysis. It integrates the effective structural description to capture the mutual influence and constraint between different visual elements, and establishes the inner connection between the original feature data and the structure knowledge description, so as to guide the visual analysis and solving process under different physical entities. The specific research contents of the thesis are as follows: (1) the tasks surrounding the low level visual analysis and the pixels are aimed at the pixels. Because of the lack of prior information guidance in the process of dot matrix labeling, the problem that the corresponding image segmentation results are broken and no practical significance, the label weight and mapping rule under the multi-scale Markov random field model are proposed. By constructing the correlation between the visual features and the undirected graph model nodes, the structure of the original data is constructed. By analyzing the consistency of the nodes in the space neighborhood in the same scale and the similarity between the nodes of different scales in the same scale and the similarity between the different scales of the nodes in the same scale, a priori mark acquisition algorithm under different scales is designed. The expression of information improves the accuracy, robustness and universality of the image segmentation. (2) a new time series associated hidden Dirichlet assignment model is proposed to solve the problem of a large number of false recognition in the static target recognition process because of the lack of effective generation structure description in the middle layer vision analysis process. By establishing the corresponding correlation between different layers of visual elements and different nodes in the directed probability graph model, the generation description of the target to be identified under limited components is obtained. Further, by introducing the posteriori discrimination and switching variables, the spatio-temporal Association constraints of the feature data in continuous sampling and transportation are created. The construction of different visual elements is more efficient, which guides the reasoning operation of the middle and high level knowledge and improves the accuracy and efficiency of the target recognition. (3) around the middle level visual analysis and processing task, the action of the target under the different categories of the target in the motion process is stored in a large number of similar movements, affecting the detection of action. A discriminatory dictionary learning framework from multiple perspectives is proposed. By constructing a common dictionary including shared dictionaries and specific class dictionaries, the unique attributes of different actions are better depicted. By introducing group sparse and locally restrictive sparse constraints, the interaction of visual features is preserved in the coding description. In addition, the feature expression in multiple perspectives is further integrated through sparse coding to obtain a more rubby movement form description. By analyzing the internal relations and structural relationships between different categories of motion features, the discriminant characteristics and the accuracy of movement recognition are improved. (4) around the high-level visual analysis and processing task, the discriminant model under the finite sample is sensitive to the training sample, which leads to the weak generalization performance of the classifier learning results and the impact of the performance of the scene classification. The mixed discriminant method under the Bias priori constraints is proposed. By defining the feedback inference fusion mechanism, the prediction results under the heterogeneous classifier are selected and the label decision is made to automatically expand the training sample set and realize the effective updating of the model. The reasoning process of the high-level knowledge in the scene layer improves the discriminant performance of the model and achieves higher classification accuracy.
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.41

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張曉璐;潘楊;謝凌云;;視覺(jué)任務(wù)對(duì)聽(tīng)覺(jué)掩蔽效應(yīng)影響的實(shí)驗(yàn)分析[J];電聲技術(shù);2010年09期

2 孔斌;人類(lèi)視覺(jué)與計(jì)算機(jī)視覺(jué)的比較[J];自然雜志;2002年01期

3 高美真;姜曉峰;;人類(lèi)視覺(jué)與計(jì)算機(jī)視覺(jué)的比較[J];焦作師范高等?茖W(xué)校學(xué)報(bào);2007年01期

4 徐光yP;;以人為中心的計(jì)算機(jī)視覺(jué)應(yīng)用[J];中國(guó)圖象圖形學(xué)報(bào);2009年02期

5 韓紅;焦李成;;談?dòng)?jì)算機(jī)視覺(jué)課程的教學(xué)創(chuàng)新[J];計(jì)算機(jī)教育;2010年19期

6 王振華;胡占義;;2011國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)簡(jiǎn)介[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2012年02期

7 劉兵;;關(guān)于計(jì)算機(jī)視覺(jué)成像的研究分析[J];煤炭技術(shù);2013年06期

8 顧偉康;計(jì)算機(jī)視覺(jué)學(xué)的發(fā)展概況[J];浙江大學(xué)學(xué)報(bào);1986年04期

9 蔡愉祖;計(jì)算機(jī)視覺(jué)概述[J];系統(tǒng)工程與電子技術(shù);1986年01期

10 戰(zhàn)德臣;陳景春;李仲榮;;計(jì)算機(jī)視覺(jué)研究的一種分布式專家系統(tǒng)模型[J];航天控制;1989年02期

相關(guān)會(huì)議論文 前10條

1 宋小華;歐陽(yáng)丹彤;;時(shí)空推理在計(jì)算機(jī)視覺(jué)的應(yīng)用[A];2006年全國(guó)理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2006年

2 謝麗欣;牟會(huì);王歡;劉明霞;;基于計(jì)算機(jī)視覺(jué)的人臉檢測(cè)與識(shí)別綜述[A];第三屆全國(guó)軟件測(cè)試會(huì)議與移動(dòng)計(jì)算、柵格、智能化高級(jí)論壇論文集[C];2009年

3 陳強(qiáng);孫振國(guó);;計(jì)算機(jī)視覺(jué)在焊接中的應(yīng)用[A];第十次全國(guó)焊接會(huì)議論文集(第1冊(cè))[C];2001年

4 田涌濤;洪錫軍;王有慶;李從心;;計(jì)算機(jī)視覺(jué)在先進(jìn)制造技術(shù)中的應(yīng)用[A];面向制造業(yè)的自動(dòng)化與信息化技術(shù)創(chuàng)新設(shè)計(jì)的基礎(chǔ)技術(shù)——2001年中國(guó)機(jī)械工程學(xué)會(huì)年會(huì)暨第九屆全國(guó)特種加工學(xué)術(shù)年會(huì)論文集[C];2001年

5 劉敏娟;洪添勝;李震;吳偉斌;劉志壯;;基于計(jì)算機(jī)視覺(jué)的荔枝檢測(cè)與分級(jí)方法[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

6 孫潔瓊;孫明;;基于計(jì)算機(jī)視覺(jué)的水果外觀品質(zhì)檢測(cè)分級(jí)研究現(xiàn)狀[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

7 王劃一;王效良;;計(jì)算機(jī)視覺(jué)在絎縫機(jī)自動(dòng)編程及控制中的應(yīng)用[A];第二十屆中國(guó)控制會(huì)議論文集(下)[C];2001年

8 周紅;劉光蓉;;計(jì)算機(jī)視覺(jué)及其在谷物籽粒檢測(cè)分級(jí)中的應(yīng)用[A];中國(guó)糧油學(xué)會(huì)第三屆學(xué)術(shù)年會(huì)論文選集(下冊(cè))[C];2004年

9 吳彥紅;劉木華;楊君;鄭華東;;大米外觀品質(zhì)的計(jì)算機(jī)視覺(jué)在線檢測(cè)技術(shù)研究[A];農(nóng)業(yè)機(jī)械化與新農(nóng)村建設(shè)——中國(guó)農(nóng)業(yè)機(jī)械學(xué)會(huì)2006年學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2006年

10 張慶敏;于龍;;計(jì)算機(jī)視覺(jué)在接觸網(wǎng)定位器坡度識(shí)別中的應(yīng)用[A];高速鐵路接觸網(wǎng)零部件安全可靠性技術(shù)論文集[C];2013年

相關(guān)重要報(bào)紙文章 前8條

1 記者 李大慶;我在國(guó)際計(jì)算機(jī)視覺(jué)算法競(jìng)賽中摘金[N];科技日?qǐng)?bào);2011年

2 滕繼濮;不放過(guò)一個(gè)“壞蛋”[N];糧油市場(chǎng)報(bào);2011年

3 黎驪/文 [美] Tom M.Mitchell 著;機(jī)器學(xué)習(xí)與智能化社會(huì)[N];中國(guó)郵政報(bào);2003年

4 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;機(jī)器學(xué)習(xí)已成為大數(shù)據(jù)基石[N];網(wǎng)絡(luò)世界;2014年

5 本報(bào)記者 房琳琳;合久必分:分布式“機(jī)器學(xué)習(xí)”應(yīng)運(yùn)而生[N];科技日?qǐng)?bào);2014年

6 雨辰;機(jī)器學(xué)習(xí)類(lèi)圖書(shū)為什么火爆[N];中華讀書(shū)報(bào);2014年

7 ;生活中的計(jì)算機(jī)視覺(jué)[N];中國(guó)計(jì)算機(jī)報(bào);2006年

8 王悅承;逾30篇中國(guó)論文入選ICCV[N];中國(guó)計(jì)算機(jī)報(bào);2005年

相關(guān)博士學(xué)位論文 前10條

1 姚婷婷;視覺(jué)分析中的層次化結(jié)構(gòu)關(guān)聯(lián)特性研究[D];合肥工業(yè)大學(xué);2016年

2 王強(qiáng);基于幾何代數(shù)的計(jì)算機(jī)視覺(jué)問(wèn)題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

3 王任大;基于計(jì)算機(jī)視覺(jué)的手勢(shì)交互技術(shù)及其在航海中的應(yīng)用[D];大連海事大學(xué);2014年

4 賀文驊;基于計(jì)算機(jī)視覺(jué)的復(fù)雜場(chǎng)景下目標(biāo)跟蹤研究[D];西安電子科技大學(xué);2015年

5 王愛(ài)麗;基于計(jì)算機(jī)視覺(jué)的行人交通信息智能檢測(cè)理論和關(guān)鍵技術(shù)研究[D];北京交通大學(xué);2016年

6 潘磊慶;基于計(jì)算機(jī)視覺(jué)和聲學(xué)技術(shù)融合檢測(cè)雞蛋品質(zhì)的研究[D];南京農(nóng)業(yè)大學(xué);2007年

7 孔明;顆粒粒徑和形態(tài)計(jì)算機(jī)視覺(jué)測(cè)量方法研究[D];東南大學(xué);2005年

8 劉釗;基于計(jì)算智能的計(jì)算機(jī)視覺(jué)及其應(yīng)用研究[D];武漢科技大學(xué);2011年

9 李慶中;蘋(píng)果自動(dòng)分級(jí)中計(jì)算機(jī)視覺(jué)信息快速獲取與處理技術(shù)的研究[D];中國(guó)農(nóng)業(yè)大學(xué);2000年

10 謝存;計(jì)算機(jī)視覺(jué)中若干問(wèn)題實(shí)現(xiàn)技術(shù)和算法的研究[D];大連理工大學(xué);2002年

相關(guān)碩士學(xué)位論文 前10條

1 傅凱峰;質(zhì)地與形狀的視覺(jué)辨別中的觸覺(jué)成分[D];浙江大學(xué);2009年

2 陳姍;情緒面孔刺激及其對(duì)后續(xù)視覺(jué)任務(wù)影響的時(shí)程特性研究[D];上海交通大學(xué);2011年

3 王福香;基于計(jì)算機(jī)視覺(jué)的馬鈴薯外部缺陷檢測(cè)方法研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2015年

4 余饒東;基于腦波與計(jì)算機(jī)視覺(jué)的注意力檢測(cè)技術(shù)在E-Learning中的應(yīng)用研究[D];昆明理工大學(xué);2015年

5 李想;基于計(jì)算機(jī)視覺(jué)的花卉分級(jí)系統(tǒng)研究[D];天津理工大學(xué);2015年

6 吳林林;基于計(jì)算機(jī)視覺(jué)的皮革測(cè)配色研究[D];陜西科技大學(xué);2015年

7 龍怡霖;基于計(jì)算機(jī)視覺(jué)的雜草種子鑒別[D];西北農(nóng)林科技大學(xué);2015年

8 謝艷鵬;面向細(xì)胞行為辨識(shí)的計(jì)算機(jī)視覺(jué)研究與應(yīng)用[D];沈陽(yáng)理工大學(xué);2015年

9 丁僑俊;基于計(jì)算機(jī)視覺(jué)的智能停車(chē)場(chǎng)引導(dǎo)系統(tǒng)研究[D];福建師范大學(xué);2015年

10 王鵬博;多態(tài)并行機(jī)上的OpenVX系統(tǒng)實(shí)現(xiàn)[D];西安郵電大學(xué);2015年

,

本文編號(hào):2020100

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/2020100.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f13c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com