基于卷積神經(jīng)網(wǎng)絡(luò)的驗(yàn)證碼字符識(shí)別研究
發(fā)布時(shí)間:2021-10-31 00:43
基于文本的驗(yàn)證碼廣泛部署于各種需要身份驗(yàn)證的門戶網(wǎng)站,是互聯(lián)網(wǎng)安全機(jī)制中重要的一環(huán)。對(duì)文本驗(yàn)證碼的安全性和可用性進(jìn)行分析,有助于提高網(wǎng)站對(duì)抗惡意攻擊的能力,保證用戶的信息安全,維護(hù)安全的網(wǎng)絡(luò)環(huán)境。本文圍繞基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)驗(yàn)證碼字符進(jìn)行識(shí)別的問(wèn)題展開(kāi)研究,著力于提高神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確度,降低實(shí)現(xiàn)結(jié)構(gòu)的復(fù)雜度。本文的工作一方面可以為文本驗(yàn)證碼的設(shè)計(jì)和可用性提供建議,另一方面為使用卷積神經(jīng)網(wǎng)絡(luò)完成具有挑戰(zhàn)性的場(chǎng)景文本識(shí)別提供了新的研究思路。本文的主要工作如下:首先,分析了影響驗(yàn)證碼字符安全機(jī)制的因素,分析其反分割與反識(shí)別的效果。研究了圖像識(shí)別領(lǐng)域的主流算法卷積神經(jīng)網(wǎng)絡(luò),對(duì)其基本理論和實(shí)現(xiàn)結(jié)構(gòu)進(jìn)行分析。介紹了卷積神經(jīng)網(wǎng)絡(luò)的各個(gè)實(shí)現(xiàn)模塊,包括卷積操作、池化采樣、激活函數(shù)和正則化方法,重點(diǎn)對(duì)卷積層中的激活函數(shù)的適用范圍和使用條件進(jìn)行分析。對(duì)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行仿真,展示了CNN、ResNet和Xception網(wǎng)絡(luò)對(duì)驗(yàn)證碼字符的識(shí)別性能。其次,在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,結(jié)合自歸一化神經(jīng)網(wǎng)絡(luò)中的縮放指數(shù)型線性單元,引進(jìn)自歸一化屬性,提出一種自標(biāo)準(zhǔn)化卷積神經(jīng)網(wǎng)絡(luò)。該歸一化效果可以保證多層級(jí)訓(xùn)練的魯棒...
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:103 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
鐵路12306圖像驗(yàn)證碼12306網(wǎng)站的圖像驗(yàn)證碼如圖1.1所示,驗(yàn)證碼是一張整體的圖片,包括文字提示
第一章緒論3reCAPTCHA是Google提供的一種用于身份驗(yàn)證的基于圖像的驗(yàn)證碼,用戶需要按照文字提示,對(duì)相應(yīng)的圖片做出操作,該機(jī)制通過(guò)這一互動(dòng)環(huán)節(jié)預(yù)測(cè)用戶的行為,返回用戶的流量分?jǐn)?shù),作為區(qū)分人類與計(jì)算機(jī)程序的依據(jù)。這類圖像驗(yàn)證碼需要強(qiáng)大的算法保證評(píng)判的正確性,同時(shí)要保證圖片庫(kù)的容量來(lái)對(duì)抗惡意程序的暴力破解。圖1.2GooglereCAPTCHA基于圖像的驗(yàn)證碼機(jī)制很難實(shí)現(xiàn)自動(dòng)生成,并且需要完成標(biāo)簽和圖像的匹配,其生成機(jī)制相比基于文本的驗(yàn)證碼更加復(fù)雜,因此其使用范圍受到了限制[8]。同時(shí),尋找提高驗(yàn)證碼機(jī)制安全性與保證用戶體驗(yàn)之間的平衡是圖像驗(yàn)證碼設(shè)計(jì)者需要深入研究的課題。3.其他驗(yàn)證碼機(jī)制除上述兩類驗(yàn)證碼,其他類型的驗(yàn)證碼也存在于需要身份驗(yàn)證的場(chǎng)景,如基于語(yǔ)音的驗(yàn)證碼機(jī)制,基于視頻的驗(yàn)證碼機(jī)制,互動(dòng)驗(yàn)證碼機(jī)制等;谡Z(yǔ)音的驗(yàn)證碼通常是服務(wù)于有視力障礙的人群,該類驗(yàn)證碼將有效信息與噪聲合成在一段語(yǔ)音中,用戶需要反饋其獲得的語(yǔ)音信息[9]。這種驗(yàn)證方式經(jīng)常被各大運(yùn)營(yíng)商選用,用于確定用戶身份,完成服務(wù)評(píng)價(jià)和個(gè)人信息安全維護(hù)。語(yǔ)音驗(yàn)證碼的識(shí)別需要將語(yǔ)音信號(hào)處理相關(guān)知識(shí),結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對(duì)語(yǔ)音的時(shí)域或頻域特征進(jìn)行提齲目前針對(duì)非連續(xù)的語(yǔ)音驗(yàn)證碼,已經(jīng)可以使用兩相法完成識(shí)別[10]。語(yǔ)音驗(yàn)證碼需要提前錄制和大量的語(yǔ)料庫(kù),同時(shí)由于受到通信質(zhì)量和通話環(huán)境的限制,語(yǔ)音驗(yàn)證碼可用性不高[11];谝曨l的驗(yàn)證碼,是將字母和數(shù)字等字符以動(dòng)態(tài)的形式嵌入到視頻格式中。與基于文本的驗(yàn)證碼類似,基于視頻的驗(yàn)證碼會(huì)對(duì)字符進(jìn)行旋轉(zhuǎn)、扭曲、加入噪線以及復(fù)雜背景等,增加計(jì)算機(jī)程序識(shí)別的難度[12]。由于基于視頻的驗(yàn)證碼字符的有效信息并不會(huì)在同一幀共存,提取驗(yàn)證碼中的有效信息變得更加
第二章文本驗(yàn)證碼數(shù)據(jù)集簡(jiǎn)介及卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%結(jié)合以上關(guān)于文本驗(yàn)證碼識(shí)別的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四種驗(yàn)證碼不再安全,識(shí)別Baidu、Taobo、PayPal和eBay等驗(yàn)證碼的技術(shù)相對(duì)成熟。本文選擇新浪(2017)為代表的CCT驗(yàn)證碼和騰訊的空心驗(yàn)證碼作為研究對(duì)象,來(lái)補(bǔ)充該領(lǐng)域?qū)CT驗(yàn)證碼和空心驗(yàn)證碼的研究。另一方面,當(dāng)前方法中使用的神經(jīng)網(wǎng)絡(luò)多基于早期的LeNet-5進(jìn)行改進(jìn),卷積神經(jīng)網(wǎng)絡(luò)在近幾年的發(fā)展過(guò)程中已經(jīng)出現(xiàn)了眾多適用于不同目標(biāo)的網(wǎng)絡(luò)模型,研究基于卷積神經(jīng)網(wǎng)絡(luò)識(shí)別驗(yàn)證碼字符的方法具有重要的理論意義和研究?jī)r(jià)值。本文選擇空心文本驗(yàn)證碼和字符粘連文本驗(yàn)證碼作為各類卷積神經(jīng)網(wǎng)絡(luò)處理的對(duì)象,用以對(duì)比不同卷積神經(jīng)網(wǎng)絡(luò)之間的識(shí)別性能。需要說(shuō)明的是,本文使用的空心驗(yàn)證碼為騰訊公司公開(kāi)的數(shù)據(jù)集,CCT的驗(yàn)證碼來(lái)自開(kāi)源的驗(yàn)證碼庫(kù)captcha。兩種數(shù)據(jù)集的驗(yàn)證碼實(shí)例如圖2.1所示。圖2.1顯示CCT驗(yàn)證碼的主要防御機(jī)制是使用字符粘連重疊以及遮擋線,騰訊驗(yàn)證碼采用了復(fù)雜的背景,兩種驗(yàn)證碼都將不同大小的字符進(jìn)行旋轉(zhuǎn)以增加識(shí)別難度。圖2.1本文使用的兩種驗(yàn)證碼數(shù)據(jù)集
本文編號(hào):3467719
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:103 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
鐵路12306圖像驗(yàn)證碼12306網(wǎng)站的圖像驗(yàn)證碼如圖1.1所示,驗(yàn)證碼是一張整體的圖片,包括文字提示
第一章緒論3reCAPTCHA是Google提供的一種用于身份驗(yàn)證的基于圖像的驗(yàn)證碼,用戶需要按照文字提示,對(duì)相應(yīng)的圖片做出操作,該機(jī)制通過(guò)這一互動(dòng)環(huán)節(jié)預(yù)測(cè)用戶的行為,返回用戶的流量分?jǐn)?shù),作為區(qū)分人類與計(jì)算機(jī)程序的依據(jù)。這類圖像驗(yàn)證碼需要強(qiáng)大的算法保證評(píng)判的正確性,同時(shí)要保證圖片庫(kù)的容量來(lái)對(duì)抗惡意程序的暴力破解。圖1.2GooglereCAPTCHA基于圖像的驗(yàn)證碼機(jī)制很難實(shí)現(xiàn)自動(dòng)生成,并且需要完成標(biāo)簽和圖像的匹配,其生成機(jī)制相比基于文本的驗(yàn)證碼更加復(fù)雜,因此其使用范圍受到了限制[8]。同時(shí),尋找提高驗(yàn)證碼機(jī)制安全性與保證用戶體驗(yàn)之間的平衡是圖像驗(yàn)證碼設(shè)計(jì)者需要深入研究的課題。3.其他驗(yàn)證碼機(jī)制除上述兩類驗(yàn)證碼,其他類型的驗(yàn)證碼也存在于需要身份驗(yàn)證的場(chǎng)景,如基于語(yǔ)音的驗(yàn)證碼機(jī)制,基于視頻的驗(yàn)證碼機(jī)制,互動(dòng)驗(yàn)證碼機(jī)制等;谡Z(yǔ)音的驗(yàn)證碼通常是服務(wù)于有視力障礙的人群,該類驗(yàn)證碼將有效信息與噪聲合成在一段語(yǔ)音中,用戶需要反饋其獲得的語(yǔ)音信息[9]。這種驗(yàn)證方式經(jīng)常被各大運(yùn)營(yíng)商選用,用于確定用戶身份,完成服務(wù)評(píng)價(jià)和個(gè)人信息安全維護(hù)。語(yǔ)音驗(yàn)證碼的識(shí)別需要將語(yǔ)音信號(hào)處理相關(guān)知識(shí),結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對(duì)語(yǔ)音的時(shí)域或頻域特征進(jìn)行提齲目前針對(duì)非連續(xù)的語(yǔ)音驗(yàn)證碼,已經(jīng)可以使用兩相法完成識(shí)別[10]。語(yǔ)音驗(yàn)證碼需要提前錄制和大量的語(yǔ)料庫(kù),同時(shí)由于受到通信質(zhì)量和通話環(huán)境的限制,語(yǔ)音驗(yàn)證碼可用性不高[11];谝曨l的驗(yàn)證碼,是將字母和數(shù)字等字符以動(dòng)態(tài)的形式嵌入到視頻格式中。與基于文本的驗(yàn)證碼類似,基于視頻的驗(yàn)證碼會(huì)對(duì)字符進(jìn)行旋轉(zhuǎn)、扭曲、加入噪線以及復(fù)雜背景等,增加計(jì)算機(jī)程序識(shí)別的難度[12]。由于基于視頻的驗(yàn)證碼字符的有效信息并不會(huì)在同一幀共存,提取驗(yàn)證碼中的有效信息變得更加
第二章文本驗(yàn)證碼數(shù)據(jù)集簡(jiǎn)介及卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%結(jié)合以上關(guān)于文本驗(yàn)證碼識(shí)別的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四種驗(yàn)證碼不再安全,識(shí)別Baidu、Taobo、PayPal和eBay等驗(yàn)證碼的技術(shù)相對(duì)成熟。本文選擇新浪(2017)為代表的CCT驗(yàn)證碼和騰訊的空心驗(yàn)證碼作為研究對(duì)象,來(lái)補(bǔ)充該領(lǐng)域?qū)CT驗(yàn)證碼和空心驗(yàn)證碼的研究。另一方面,當(dāng)前方法中使用的神經(jīng)網(wǎng)絡(luò)多基于早期的LeNet-5進(jìn)行改進(jìn),卷積神經(jīng)網(wǎng)絡(luò)在近幾年的發(fā)展過(guò)程中已經(jīng)出現(xiàn)了眾多適用于不同目標(biāo)的網(wǎng)絡(luò)模型,研究基于卷積神經(jīng)網(wǎng)絡(luò)識(shí)別驗(yàn)證碼字符的方法具有重要的理論意義和研究?jī)r(jià)值。本文選擇空心文本驗(yàn)證碼和字符粘連文本驗(yàn)證碼作為各類卷積神經(jīng)網(wǎng)絡(luò)處理的對(duì)象,用以對(duì)比不同卷積神經(jīng)網(wǎng)絡(luò)之間的識(shí)別性能。需要說(shuō)明的是,本文使用的空心驗(yàn)證碼為騰訊公司公開(kāi)的數(shù)據(jù)集,CCT的驗(yàn)證碼來(lái)自開(kāi)源的驗(yàn)證碼庫(kù)captcha。兩種數(shù)據(jù)集的驗(yàn)證碼實(shí)例如圖2.1所示。圖2.1顯示CCT驗(yàn)證碼的主要防御機(jī)制是使用字符粘連重疊以及遮擋線,騰訊驗(yàn)證碼采用了復(fù)雜的背景,兩種驗(yàn)證碼都將不同大小的字符進(jìn)行旋轉(zhuǎn)以增加識(shí)別難度。圖2.1本文使用的兩種驗(yàn)證碼數(shù)據(jù)集
本文編號(hào):3467719
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3467719.html
最近更新
教材專著