物體分割與識別方法的研究和實現(xiàn)
本文選題:物體分割 切入點:物體識別 出處:《南京大學(xué)》2017年碩士論文
【摘要】:靜態(tài)圖片中物體的分割和識別是計算機視覺任務(wù)中兩個非常重要的話題,二者之間緊密聯(lián)系,彼此可以相互利用。然而對靜態(tài)圖片進(jìn)行像素級的分割是一件很有難度的任務(wù),這是因為現(xiàn)實中拍攝的照片往往受到光照和噪聲的影響,除此以外,圖片的背景有時也會很復(fù)雜,可能會和要分割的物體在顏色和紋理上相似。另一方面,對于靜態(tài)圖片的物體識別,目前很多方法都是基于滑動窗口+物體特征+分類器這種組合,該方法主要的缺點在于需要不斷通過滑動窗口來掃描整張圖片,然后對每一個窗口進(jìn)行分類,所以會導(dǎo)致速度很慢。為了解決這些問題,我們先后設(shè)計了幾種能夠?qū)o態(tài)圖片中物體進(jìn)行分割和識別的解決方案并進(jìn)行了實驗和對比分析。我們首先提出一個交互的分割方法,該方法基于Adaboost的分類思想,把超像素作為被處理的單元進(jìn)行分類,而不再是單個像素,用戶只需要提供少量的樣本種子點即可。在該方法的基礎(chǔ)上,我們結(jié)合了人體的姿勢信息,從而可以對靜態(tài)圖片中的人體進(jìn)行自動化分割,它可以對圖片中人體的任意姿勢進(jìn)行分割,相較于一些需要通過人臉來定位人體位置再進(jìn)行人體分割的方法,我們的方法不僅可以處理人體正面,也可以處理側(cè)面和背面。此外,我們還利用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行物體分割,該框架由兩個神經(jīng)網(wǎng)絡(luò)組成,其中定位網(wǎng)絡(luò)負(fù)責(zé)定位圖片中物體的位置,分割網(wǎng)絡(luò)則負(fù)責(zé)對圖片進(jìn)行分割。對于以上得到的分割結(jié)果,往往會比較粗糙,我們使用了兩種方法來進(jìn)行優(yōu)化,分別是高斯背景建模和bayse matting,其中我們對bayse matting算法進(jìn)行了改進(jìn)。對于物體識別任務(wù),我們借鑒了基于區(qū)域的物體識別方法,即利用圖割先對圖片分割成多個區(qū)域,然后不斷合并相似的區(qū)域,最后對得到的每一個區(qū)域進(jìn)行分類。對于單個區(qū)域內(nèi)的物體分類,我們分別使用HOG和CNN兩種方式進(jìn)行特征提取,再用SVM來進(jìn)行訓(xùn)練,后者達(dá)到了更好的效果。但CNN提取特征的方式需要對每個區(qū)域進(jìn)行一次卷積過程,所以很耗費時間,因此我們又參考了 FastRCNN的方法,在卷積層后面加入一個池化層,從而只需對整張圖片進(jìn)行一次卷積過程,該方法大大縮短了運行時間。最后我們在多個廣泛使用的數(shù)據(jù)集上完成了物體分割和識別的多項實驗,我們的方法在準(zhǔn)確率和性能上都取得了不錯的效果。
[Abstract]:The segmentation and recognition of objects in static images are two very important topics in the task of computer vision. They are closely related and can be used each other.However, it is a difficult task to segment static images at the pixel level, because the pictures taken in reality are often affected by illumination and noise. Besides, the background of the images is sometimes very complex.May be similar to the object to be segmented in color and texture.On the other hand, for the object recognition of static images, many methods are based on the combination of sliding window object feature classifier. The main disadvantage of this method is the need to scan the whole picture through sliding window.Each window is then sorted, so the speed is slow.In order to solve these problems, we have designed several solutions for segmentation and recognition of objects in static images, and carried out experiments and comparative analysis.We first propose an interactive segmentation method, which is based on the idea of Adaboost, and classifies super-pixels as processed units instead of single pixels. Users only need to provide a small number of sample seed points.On the basis of this method, we combine the posture information of human body, so we can automatically segment the human body in the static picture, and it can segment any pose of the human body in the picture.Compared with some methods which need to locate the position of human body by human face, our method can not only deal with the front of the human body, but also deal with the side and back.In addition, we use convolution neural network to segment objects. The framework consists of two neural networks, in which the location network is responsible for locating the position of the object in the picture, and the segmentation network is responsible for the image segmentation.For the above segmentation results, often rough, we use two methods to optimize, namely Gao Si background modeling and bayse matting, in which we improve the bayse matting algorithm.For the object recognition task, we draw lessons from the area-based object recognition method, that is, the image is divided into several regions by graph cutting, and then the similar regions are continuously merged, and finally each region is classified.For the classification of objects in a single region, we use HOG and CNN for feature extraction, and then use SVM for training, the latter achieves better results.But the way CNN extracts features requires a convolution process for each region, so it's time-consuming, so we refer to the FastRCNN method and add a pool layer after the convolution layer.Thus, only one convolution process is needed for the whole picture, and the running time is greatly reduced.Finally, we have completed many experiments of object segmentation and recognition on a number of widely used datasets, and our method has achieved good results in accuracy and performance.
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 代松;李偉生;;基于親和傳遞聚類的多類物體識別方法[J];計算機工程;2009年14期
2 鄒利華;;三種基于特征的物體識別算法對比與分析[J];軟件導(dǎo)刊;2010年05期
3 連靈;游旭群;;三維物體識別的心理表征:角度依賴還是角度獨立[J];心理學(xué)報;2011年09期
4 王喜順;劉曦;史忠植;隋紅建;;一種基于特征整合理論的物體識別模型(英文)[J];中國科學(xué)院研究生院學(xué)報;2012年03期
5 胡敏;齊梅;王曉華;許良鳳;;基于顯著區(qū)域詞袋模型的物體識別方法[J];電子測量與儀器學(xué)報;2013年07期
6 余少波;鞠發(fā)平;肖英明;;物體識別不變性方法比較分析(Ⅱ)——解析方法[J];海軍工程學(xué)院學(xué)報;1993年01期
7 曾建超,柳慧群,林學(xué);基于規(guī)則的物體識別定位方法[J];高技術(shù)通訊;1995年04期
8 李育賢,王洪波,趙莉;二維物體識別的暫態(tài)混沌神經(jīng)網(wǎng)絡(luò)方法[J];陜西師范大學(xué)學(xué)報(自然科學(xué)版);2000年01期
9 邵潔;董楠;;基于相關(guān)向量機的物體識別[J];上海電力學(xué)院學(xué)報;2011年02期
10 楊雄;彭剛;徐濤;劉利;蘭遠(yuǎn)東;;物體識別的精神物理學(xué)實驗測試[J];惠州學(xué)院學(xué)報(自然科學(xué)版);2012年03期
相關(guān)會議論文 前10條
1 陳柘;趙榮椿;;幾何不變性及其在3D物體識別中的應(yīng)用[A];信號與信息處理技術(shù)——第一屆信號與信息處理聯(lián)合學(xué)術(shù)會議論文集[C];2002年
2 連靈;張敏;;三維物體識別的心理表征:角度依賴還是角度獨立[A];增強心理學(xué)服務(wù)社會的意識和功能——中國心理學(xué)會成立90周年紀(jì)念大會暨第十四屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2011年
3 周程;吳飛;莊越挺;;基于層次反饋機制的物體識別[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
4 孫彥良;任衍具;;真實場景中朝向和背景對物體識別的影響[A];第十二屆全國心理學(xué)學(xué)術(shù)大會論文摘要集[C];2009年
5 郭明瑋;朱明清;趙宇宙;王建;陳宗海;;基于生物視覺的物體識別方法研究現(xiàn)狀分析[A];第13屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會論文集[C];2011年
6 艾浩軍;朱榮;張敏;李俊;方禹;王紅霞;;基于SIFT尺度分量的兩級匹配物體識別算法研究[A];第七屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2011)論文集【poster】[C];2011年
7 熊英;馬惠敏;;SIFT特征在三維物體識別中的應(yīng)用[A];圖像圖形技術(shù)研究與應(yīng)用2009——第四屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2009年
8 魯?shù)?姜志國;;基于圖元檢測的物體識別方法研究[A];全國第一屆信號處理學(xué)術(shù)會議暨中國高科技產(chǎn)業(yè)化研究會信號處理分會籌備工作委員會第三次工作會議專刊[C];2007年
9 杜建洪;梁子長;;車輛走向定位技術(shù)的研究[A];通信理論與信號處理新進(jìn)展——2005年通信理論與信號處理年會論文集[C];2005年
10 宋廣青;高莉;孫秀萍;劉新民;;物體識別實驗在東莨菪堿致大鼠學(xué)習(xí)記憶障礙中的應(yīng)用[A];2013年全國老年性癡呆與相關(guān)疾病學(xué)術(shù)會議論文匯編[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 陸王天宇;受生物啟發(fā)的物體識別算法研究[D];復(fù)旦大學(xué);2013年
2 王靜;視網(wǎng)膜假體中人工視覺信息處理及優(yōu)化表達(dá)研究[D];上海交通大學(xué);2014年
3 齊勇剛;基于草圖和邊緣的物體識別[D];北京郵電大學(xué);2015年
4 黃穎;基于圖理論的圖像處理與物體識別算法的研究[D];電子科技大學(xué);2012年
5 劉光燦;基于機器學(xué)習(xí)的物體識別[D];上海交通大學(xué);2013年
6 徐勝;三維物體識別研究[D];電子科技大學(xué);2010年
7 王興剛;物體識別中的形狀建模和弱監(jiān)督學(xué)習(xí)[D];華中科技大學(xué);2014年
8 王利明;機器視覺中物體識別方法的研究與探討[D];復(fù)旦大學(xué);2009年
9 彭紹武;基于形狀與語義建模的物體識別[D];華中科技大學(xué);2009年
10 陶維東;非面孔物體識別倒置效應(yīng)[D];西南大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 周淼;物體識別中與特征整合相關(guān)的腦電活動研究[D];電子科技大學(xué);2012年
2 劉杰;小型地面移動機器人視覺圖像特征提取[D];新疆大學(xué);2015年
3 王沁波;基于分層結(jié)構(gòu)的多物體圖像識別系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年
4 李元輝;換墊料應(yīng)激損害大鼠新穎物體識別記憶再激活后提取及其膽堿能受體機制[D];南華大學(xué);2015年
5 李額;Apelin-13改善強迫游泳應(yīng)激誘導(dǎo)大鼠新穎物體識別記憶損傷[D];南華大學(xué);2015年
6 劉苗苗;基于2D和3D SIFT特征融合的一般物體識別算法研究[D];東南大學(xué);2015年
7 程玉立;面向工業(yè)應(yīng)用的機器人手眼標(biāo)定與物體定位[D];浙江大學(xué);2016年
8 周楠釗;基于SIFT特征的物體識別系統(tǒng)的設(shè)計與實現(xiàn)[D];蘭州大學(xué);2016年
9 陳佳洲;室內(nèi)場景物體同時識別與建模[D];廣東工業(yè)大學(xué);2016年
10 廉彬;長期母嬰分離對大鼠成年后新異性物體識別和社會性識別的影響[D];西南大學(xué);2016年
,本文編號:1724998
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1724998.html