卷積神經(jīng)網(wǎng)絡(luò)在電力設(shè)備紅外圖像識別中的應(yīng)用研究
發(fā)布時間:2020-08-27 07:34
【摘要】:電力設(shè)備紅外圖像識別是實現(xiàn)紅外成像下電力設(shè)備狀態(tài)監(jiān)測和故障診斷的必要前提。在實際場景中,由于紅外圖像的成像特點、背景環(huán)境的復(fù)雜性以及電力設(shè)備自身的多樣性和差異性,電力設(shè)備紅外圖像識別存在較大難度,基于人工特征的傳統(tǒng)圖像識別方法難以滿足實際場景中電力設(shè)備紅外圖像識別的要求。而近年來興起的以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù)由于能對輸入進行由淺到深多層次的特征表征和端到端的學(xué)習(xí),在圖像識別的性能上顯著優(yōu)于傳統(tǒng)方法。因此,本文對卷積神經(jīng)網(wǎng)絡(luò)在電力設(shè)備紅外圖像識別中的應(yīng)用進行研究?紤]到實際場景中的電力設(shè)備紅外圖像識別是一個目標(biāo)檢測任務(wù),先分析了將基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法應(yīng)用到電力設(shè)備紅外圖像識別面臨的難點。然后針對難點,以基于特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,FPN)的Faster R-CNN模型(本文簡稱為FP-FRCNN)為研究基礎(chǔ),通過分析FP-FRCNN存在的不足,對FP-FRCNN進行改進,最終所提出的基于改進FP-FRCNN模型的電力設(shè)備紅外圖像識別算法實現(xiàn)了電力設(shè)備紅外圖像高精度且較快速的識別。本文主要工作內(nèi)容如下:(1)基于FP-FRCNN模型的電力設(shè)備紅外圖像識別算法研究。為了解決電力設(shè)備紅外圖像識別存在小尺寸設(shè)備較難識別以及視覺特征較難提取的問題,本文以對小目標(biāo)具有較強識別能力的FP-FRCNN模型為研究基礎(chǔ),通過分析原始的FP-FRCNN模型存在的不足,對其進行改進:從增強模型特征提取能力角度出發(fā),在模型的卷積主干網(wǎng)絡(luò)部分使用密集連接結(jié)構(gòu)并引入壓縮激勵結(jié)構(gòu);還從提升模型目標(biāo)定位精度角度出發(fā),使用Ro IAlign池化代替原來的Ro I Pooling池化。在自建的電力設(shè)備紅外圖像數(shù)據(jù)集上的實驗結(jié)果表明,改進的FP-FRCNN模型能達到90.4%的m AP(mean Average Precision),相比原始FP-FRCNN模型提升5.7個百分點,且在GPU上能達到15幀/秒的識別速度。(2)電力設(shè)備紅外圖像識別系統(tǒng)的設(shè)計與實現(xiàn)。為將本文的研究成果直接應(yīng)用于實際,本文還設(shè)計了一個電力設(shè)備紅外圖像識別系統(tǒng)。其由本地識別主系統(tǒng)和遠(yuǎn)程識別子系統(tǒng)兩部分組成,可對保存于本地的或通過網(wǎng)絡(luò)傳輸過來的電力設(shè)備紅外圖像進行精準(zhǔn)識別,并將識別結(jié)果可視化,同時顯示識別時間、目標(biāo)數(shù)量等相關(guān)信息,具有一定的實用價值。
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TM50;TP391.41;TP183
【圖文】:
(1)電力設(shè)備紅外圖像的視覺特征較難提取:紅外圖像是反映物體表面溫度分布狀的偽彩色圖像,具有整體灰度分布低且集中、信噪比低、對比度低等特點[21]。如圖所示,與可見光圖像相比,紅外圖像的整體質(zhì)量較低、缺少圖像細(xì)節(jié)信息。而基于卷神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法是直接利用圖像數(shù)據(jù)來學(xué)習(xí)圖像的特征表示,圖像質(zhì)量的不和細(xì)節(jié)信息的缺乏會增加 CNN 提取視覺特征的難度。(2)小尺寸設(shè)備較難識別:電力設(shè)備紅外圖像中有很多電力設(shè)備的尺寸都比較小,比圖 1-1a)中的絕緣子、刀閘、避雷器等。而對于基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法,由CNN 在逐層提取圖像特征得到語義信息的過程中,特征圖的分辨率會不斷降低,物體尺寸不同會導(dǎo)致相應(yīng)的語義信息出現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)的不同層。小尺寸物體相應(yīng)的語信息會出現(xiàn)在更靠前的網(wǎng)絡(luò)層,而到了更靠后的網(wǎng)絡(luò)層其語義信息則會消失[22],從而致網(wǎng)絡(luò)最后的分類層難以對小尺寸物體進行分類判斷,另外小尺寸物體對識別的定位度也有更高的要求,這些因素都使得小尺寸設(shè)備較難識別。
CNN 中一個二維卷積操作的示例[35](滑動步長經(jīng)網(wǎng)絡(luò)中執(zhí)行池化操作的層,也叫下采樣層。池化函數(shù)將特征圖的響應(yīng)值匯合起來,從而達。在卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中,通常是在幾個連來對卷積層提取的特征表示進行降維和抽象;瘮(shù)。其中平均池化函數(shù)給出輸入的相鄰矩的背景信息。而最大池化函數(shù)則給出輸入的相數(shù),能保留更多的紋理信息。因為池化是在空所以不會改變數(shù)據(jù)體的深度,也不會引入需要圖的空間尺寸,從而減少網(wǎng)絡(luò)的參數(shù)和計算量全連接層與多層前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是一致有輸出數(shù)據(jù)全部連接。全連接層實現(xiàn)的功能是
圖 2-3 LeNet-5 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖[7]2.2.3 卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,就是根據(jù)訓(xùn)練數(shù)據(jù)不斷調(diào)整網(wǎng)絡(luò)中可學(xué)習(xí)的參數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練中,有兩個基本過程:前向傳播(forwardpropagation)和反向傳播(backwardpropagation)[36],卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練正是通過前向傳播和反向傳播過程交替迭代執(zhí)行直到網(wǎng)絡(luò)模型收斂來實現(xiàn)的。前向傳播過程中,輸入樣本 提供初始信息,然后傳播到每一層的神經(jīng)元,信息通過網(wǎng)絡(luò)向前流動,最終產(chǎn)生預(yù)測輸出 ,并通過損失函數(shù)(loss function,也稱目標(biāo)函數(shù)或代價函數(shù))來量化網(wǎng)絡(luò)預(yù)測輸出 與輸入樣本對應(yīng)的真實標(biāo)簽y之間的吻合度。損失函數(shù)通常由基本的損失函數(shù)再加上一個用于控制網(wǎng)絡(luò)模型復(fù)雜度的正則項組成如式(2-1)所示:
本文編號:2805814
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TM50;TP391.41;TP183
【圖文】:
(1)電力設(shè)備紅外圖像的視覺特征較難提取:紅外圖像是反映物體表面溫度分布狀的偽彩色圖像,具有整體灰度分布低且集中、信噪比低、對比度低等特點[21]。如圖所示,與可見光圖像相比,紅外圖像的整體質(zhì)量較低、缺少圖像細(xì)節(jié)信息。而基于卷神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法是直接利用圖像數(shù)據(jù)來學(xué)習(xí)圖像的特征表示,圖像質(zhì)量的不和細(xì)節(jié)信息的缺乏會增加 CNN 提取視覺特征的難度。(2)小尺寸設(shè)備較難識別:電力設(shè)備紅外圖像中有很多電力設(shè)備的尺寸都比較小,比圖 1-1a)中的絕緣子、刀閘、避雷器等。而對于基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法,由CNN 在逐層提取圖像特征得到語義信息的過程中,特征圖的分辨率會不斷降低,物體尺寸不同會導(dǎo)致相應(yīng)的語義信息出現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)的不同層。小尺寸物體相應(yīng)的語信息會出現(xiàn)在更靠前的網(wǎng)絡(luò)層,而到了更靠后的網(wǎng)絡(luò)層其語義信息則會消失[22],從而致網(wǎng)絡(luò)最后的分類層難以對小尺寸物體進行分類判斷,另外小尺寸物體對識別的定位度也有更高的要求,這些因素都使得小尺寸設(shè)備較難識別。
CNN 中一個二維卷積操作的示例[35](滑動步長經(jīng)網(wǎng)絡(luò)中執(zhí)行池化操作的層,也叫下采樣層。池化函數(shù)將特征圖的響應(yīng)值匯合起來,從而達。在卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中,通常是在幾個連來對卷積層提取的特征表示進行降維和抽象;瘮(shù)。其中平均池化函數(shù)給出輸入的相鄰矩的背景信息。而最大池化函數(shù)則給出輸入的相數(shù),能保留更多的紋理信息。因為池化是在空所以不會改變數(shù)據(jù)體的深度,也不會引入需要圖的空間尺寸,從而減少網(wǎng)絡(luò)的參數(shù)和計算量全連接層與多層前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是一致有輸出數(shù)據(jù)全部連接。全連接層實現(xiàn)的功能是
圖 2-3 LeNet-5 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖[7]2.2.3 卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,就是根據(jù)訓(xùn)練數(shù)據(jù)不斷調(diào)整網(wǎng)絡(luò)中可學(xué)習(xí)的參數(shù)。在卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練中,有兩個基本過程:前向傳播(forwardpropagation)和反向傳播(backwardpropagation)[36],卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練正是通過前向傳播和反向傳播過程交替迭代執(zhí)行直到網(wǎng)絡(luò)模型收斂來實現(xiàn)的。前向傳播過程中,輸入樣本 提供初始信息,然后傳播到每一層的神經(jīng)元,信息通過網(wǎng)絡(luò)向前流動,最終產(chǎn)生預(yù)測輸出 ,并通過損失函數(shù)(loss function,也稱目標(biāo)函數(shù)或代價函數(shù))來量化網(wǎng)絡(luò)預(yù)測輸出 與輸入樣本對應(yīng)的真實標(biāo)簽y之間的吻合度。損失函數(shù)通常由基本的損失函數(shù)再加上一個用于控制網(wǎng)絡(luò)模型復(fù)雜度的正則項組成如式(2-1)所示:
【參考文獻】
相關(guān)期刊論文 前1條
1 陳俊佑;金立軍;段紹輝;姚森敬;趙靈;;基于Hu不變矩的紅外圖像電力設(shè)備識別[J];機電工程;2013年01期
相關(guān)碩士學(xué)位論文 前1條
1 張明;基于紅外圖像的變電設(shè)備分類及在故障診斷中的應(yīng)用[D];合肥工業(yè)大學(xué);2012年
本文編號:2805814
本文鏈接:http://www.sikaile.net/kejilunwen/dianlilw/2805814.html
最近更新
教材專著