基于生物視覺機制的視頻顯著目標檢測算法研究
發(fā)布時間:2021-11-20 05:41
隨著計算機科學及其人工智能的高速發(fā)展,計算機視覺領域的研究工作邁向了一個空前火熱的高潮。相比于人類視覺系統(tǒng)對外界信息的優(yōu)秀的處理機制,計算機還遠遠不足以與之相比。因此,通過對人類以及動物的視覺系統(tǒng)的不斷實驗研究,計算機視覺領域的專家們在最近幾十年提出了大量的計算機模型。同時,隨著智能監(jiān)控,智能機器人,無人機導航等飛速發(fā)展,針對圖像和視頻中的基于目標的分析和研究工作具有巨大的價值。本文分析研究了生物視覺注意機制的計算模型,提出了基于生物視覺機制的視頻運動目標以及顯著目標檢測算法。本文的主要工作如下。第一,研究發(fā)現(xiàn)飛行昆蟲由于復眼構(gòu)造特殊,利用光流來控制自身的各種飛行行為,模仿飛行昆蟲視覺機理的基于光流的計算機視覺算法成為當前研究熱點。因此,在本文第三章中我們提出了一種改進的光流法計算視頻序列中運動目標的算法。首先,我們提出了一種時空梯度定義來指導對比度計算,它可以在前景目標周圍分配高的顯著值,同時避免了難以克服的空洞效應。其次,我們根據(jù)運動梯度的幅度值的比較,來自適應的融合時間梯度和空間梯度信息。最后,我們在超像素的水平上計算平均光流直方圖,通過超像素塊間的運動信息的對比計算來提取運動目...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
人類視覺系統(tǒng)的視覺通路眼睛視神經(jīng)外側(cè)膝狀體視皮層
電子科技大學碩士學位論文10圖2-1人類視覺系統(tǒng)的視覺通路眼睛作為視覺系統(tǒng)的前端,接收外部的視覺刺激即光信號,并在眼底視網(wǎng)膜形成光學影像,同時,視網(wǎng)膜將光學影像轉(zhuǎn)變?yōu)樯窠?jīng)信號,以神經(jīng)信號的形式通過視覺神經(jīng)傳入大腦的視覺中樞進行更高級的處理和分析,使得靈長類動物包括人類都具有視覺認知能力。自從上世界末期,隨著計算機硬件和軟件技術的快速提高,及生物神經(jīng)科學的蓬勃發(fā)展,科學家們能夠定性、定量地對眼睛和大腦中視網(wǎng)膜、腦皮層等這些重要的視覺認知部位的各個區(qū)域,從生理結(jié)構(gòu)到功能特點進行深入的科學實驗和分析。經(jīng)過多年不懈努力,研究者們不僅發(fā)現(xiàn)了視覺信息通路,而且也了解了視皮層的每個子區(qū)域的功能特征,并根據(jù)視覺系統(tǒng)的形成過程,將視覺信息處理分為視網(wǎng)膜階段、早期視覺信息處理階段和中后期視覺信息處理階段,這個模型框架被應用到很多機器計算模型中[44]。從低層視覺信息到高級視覺信息處理框架如圖2-2所示。圖2-2視覺信息處理的一般框架[44]眼睛視神經(jīng)外側(cè)膝狀體視皮層
第二章視覺系統(tǒng)的生理基礎及其理論模型11圖2-3大腦的兩條視覺通路[45]2.2.2大腦的視覺通路簡介1983年,Mishkin和Ungerleider等人根據(jù)對猴子的大腦損傷研究,首次提出視覺平行加工理論[46],認為靈長類動物的視覺系統(tǒng)中存在兩個信息流,一個是腹側(cè)流(VentralStream),一個是背側(cè)流(DorsalStream),具體結(jié)構(gòu)如圖2-3所示。這兩個信息流對應著兩條視覺通路。一條視覺通路(腹側(cè)流)將從視網(wǎng)膜上接收到的視覺信號轉(zhuǎn)變?yōu)樯窠?jīng)信號,沿腹側(cè)傳遞到膝狀體(LGN),再到初級視皮層區(qū)域(V1,V2,V4)、下顳葉皮層(IT),最終視覺神經(jīng)信號到達腹外側(cè)額葉前部皮層,這條通路往往被認為是“內(nèi)容通路”(WhatPathway),用來進行形狀、顏色等靜態(tài)特征檢測,并在目標識別中發(fā)揮作用,而且人類大腦的長期記憶也和該通路有關。另一條視覺通路(背側(cè)流),也是從視網(wǎng)膜開始,將視覺神經(jīng)信號沿背部傳遞到側(cè)膝體(LGN),再經(jīng)過初級視皮層區(qū)域(V1,V2)、中顳葉區(qū)(MT或V5)、后頂葉皮層(PPC),最終視覺神經(jīng)信號到達背外側(cè)額葉前部皮層,這條通路通常簡稱為“空間通路”(WherePathway),用來處理空間中位置、動作及其他和空間有關的信息[44]。腹側(cè)通路和背側(cè)通路的視覺信號,最終在前額葉皮層(FEF)交匯,然后傳遞到上丘(SC)等與控制眼球運動有關的大腦區(qū)域,從而引發(fā)選擇性注意。兩條視覺通路的信息流如圖2-4所示。從行為經(jīng)驗看,知覺過程中what通路和where通路總是伴隨出現(xiàn)、聯(lián)系在一塊的(同時激活)。腹側(cè)流(what通路)感知機制的關鍵貢獻是識別可能的和實際的目標對象,并選擇適當?shù)男袨槁肪來處理這些對象。但是這個動作的后續(xù)實現(xiàn)是背側(cè)流(where通路)的工作。Where通路在選擇目標對象時不起任何作用,背側(cè)流腹側(cè)流
【參考文獻】:
博士論文
[1]基于視覺認知理論的視頻目標檢測及分割研究[D]. 涂錚錚.安徽大學 2015
碩士論文
[1]基于時空特征的視覺顯著性檢測方法研究[D]. 馮思琴.重慶郵電大學 2019
本文編號:3506685
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
人類視覺系統(tǒng)的視覺通路眼睛視神經(jīng)外側(cè)膝狀體視皮層
電子科技大學碩士學位論文10圖2-1人類視覺系統(tǒng)的視覺通路眼睛作為視覺系統(tǒng)的前端,接收外部的視覺刺激即光信號,并在眼底視網(wǎng)膜形成光學影像,同時,視網(wǎng)膜將光學影像轉(zhuǎn)變?yōu)樯窠?jīng)信號,以神經(jīng)信號的形式通過視覺神經(jīng)傳入大腦的視覺中樞進行更高級的處理和分析,使得靈長類動物包括人類都具有視覺認知能力。自從上世界末期,隨著計算機硬件和軟件技術的快速提高,及生物神經(jīng)科學的蓬勃發(fā)展,科學家們能夠定性、定量地對眼睛和大腦中視網(wǎng)膜、腦皮層等這些重要的視覺認知部位的各個區(qū)域,從生理結(jié)構(gòu)到功能特點進行深入的科學實驗和分析。經(jīng)過多年不懈努力,研究者們不僅發(fā)現(xiàn)了視覺信息通路,而且也了解了視皮層的每個子區(qū)域的功能特征,并根據(jù)視覺系統(tǒng)的形成過程,將視覺信息處理分為視網(wǎng)膜階段、早期視覺信息處理階段和中后期視覺信息處理階段,這個模型框架被應用到很多機器計算模型中[44]。從低層視覺信息到高級視覺信息處理框架如圖2-2所示。圖2-2視覺信息處理的一般框架[44]眼睛視神經(jīng)外側(cè)膝狀體視皮層
第二章視覺系統(tǒng)的生理基礎及其理論模型11圖2-3大腦的兩條視覺通路[45]2.2.2大腦的視覺通路簡介1983年,Mishkin和Ungerleider等人根據(jù)對猴子的大腦損傷研究,首次提出視覺平行加工理論[46],認為靈長類動物的視覺系統(tǒng)中存在兩個信息流,一個是腹側(cè)流(VentralStream),一個是背側(cè)流(DorsalStream),具體結(jié)構(gòu)如圖2-3所示。這兩個信息流對應著兩條視覺通路。一條視覺通路(腹側(cè)流)將從視網(wǎng)膜上接收到的視覺信號轉(zhuǎn)變?yōu)樯窠?jīng)信號,沿腹側(cè)傳遞到膝狀體(LGN),再到初級視皮層區(qū)域(V1,V2,V4)、下顳葉皮層(IT),最終視覺神經(jīng)信號到達腹外側(cè)額葉前部皮層,這條通路往往被認為是“內(nèi)容通路”(WhatPathway),用來進行形狀、顏色等靜態(tài)特征檢測,并在目標識別中發(fā)揮作用,而且人類大腦的長期記憶也和該通路有關。另一條視覺通路(背側(cè)流),也是從視網(wǎng)膜開始,將視覺神經(jīng)信號沿背部傳遞到側(cè)膝體(LGN),再經(jīng)過初級視皮層區(qū)域(V1,V2)、中顳葉區(qū)(MT或V5)、后頂葉皮層(PPC),最終視覺神經(jīng)信號到達背外側(cè)額葉前部皮層,這條通路通常簡稱為“空間通路”(WherePathway),用來處理空間中位置、動作及其他和空間有關的信息[44]。腹側(cè)通路和背側(cè)通路的視覺信號,最終在前額葉皮層(FEF)交匯,然后傳遞到上丘(SC)等與控制眼球運動有關的大腦區(qū)域,從而引發(fā)選擇性注意。兩條視覺通路的信息流如圖2-4所示。從行為經(jīng)驗看,知覺過程中what通路和where通路總是伴隨出現(xiàn)、聯(lián)系在一塊的(同時激活)。腹側(cè)流(what通路)感知機制的關鍵貢獻是識別可能的和實際的目標對象,并選擇適當?shù)男袨槁肪來處理這些對象。但是這個動作的后續(xù)實現(xiàn)是背側(cè)流(where通路)的工作。Where通路在選擇目標對象時不起任何作用,背側(cè)流腹側(cè)流
【參考文獻】:
博士論文
[1]基于視覺認知理論的視頻目標檢測及分割研究[D]. 涂錚錚.安徽大學 2015
碩士論文
[1]基于時空特征的視覺顯著性檢測方法研究[D]. 馮思琴.重慶郵電大學 2019
本文編號:3506685
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3506685.html
最近更新
教材專著