支持向量機研究及其在生物特征識別上的應用
發(fā)布時間:2021-08-28 20:50
網(wǎng)絡信息安全的地位隨著互聯(lián)網(wǎng)技術(shù)的普及和蓬勃發(fā)展而日益凸顯,針對網(wǎng)絡信息所發(fā)起的網(wǎng)絡攻擊日益密集,這就給保障網(wǎng)絡信息安全的各大門戶提出了新的挑戰(zhàn),各大門戶均使用人機驗證技術(shù)來抵御大規(guī)模的網(wǎng)絡攻擊,其中最主要的方案就是驗證碼技術(shù)。隨著驗證碼技術(shù)的在各大網(wǎng)站、APP的應用越來越廣泛,驗證碼的破解技術(shù)也日趨成熟、低廉,為了防范已經(jīng)破解驗證碼技術(shù)的網(wǎng)絡攻擊者,進一步加強網(wǎng)絡信息安全,越來越多的研究者開始探究新型的人機驗證技術(shù)。在這一背景下,本文主要研究在操作鼠標繪制指定軌跡的過程中所產(chǎn)生的生物特征,針對這種生物特征來構(gòu)造人機識別模型,用以預測提交驗證軌跡的是人或是計算機程序。不同于傳統(tǒng)的僅依靠對用戶模式識別能力的簡單判斷,加入了生物特征識別的行為式驗證碼采用雙重認證:1)對比用戶反饋信息與驗證圖中隱藏信息的相似程度,目的是判斷用戶是否對驗證圖中所示信息具備識別能力;2)根據(jù)鼠標在以繪制軌的形式返回驗證信息的過程,所產(chǎn)生的生物特征來有效地區(qū)分人或者計算機程序。提取了用戶的生物特征信息之后如何行之有效地進行人機識別是本文的另一個研究重點,在分析了各類機器學習算法的優(yōu)缺點之后,本文擬采用支持向量機作...
【文章來源】:重慶理工大學重慶市
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
論文的主要框架結(jié)構(gòu)
2SVM算法及其理論基礎11F(x,y),記(,)tfxa是函數(shù)集中使得經(jīng)驗風險()emptRa最小的預測函數(shù)。若對任意的ε>0,有:{()}limP()inf()0tlfRaRaε→∞∈>=F(2.14){()}limP()inf()0emptlfRaRaε→∞∈>=F(2.15)如果能夠?qū)ふ业揭粋使得經(jīng)驗風險和期望風險收斂到同一個可能的最小值的函數(shù){(,)|1,2......}tfxat=,那么學習過程中的經(jīng)驗風險最小化與期望風險最小化是具備一致性的。如圖所示,期望風險R(ω)和經(jīng)驗風險收斂到同一個可能最小的風險值0R(ω),代表學習過程是一致的。圖2.1學習過程一致性定理:學習理論的關鍵定理學習理論的關鍵定理是Vapnik和Chervonenkis[65]于1989年共同提出的,數(shù)統(tǒng)計學習理論中極其重要的理論基矗設存在常數(shù)A和B,能夠使得函數(shù)集F={f(x,a)|a∈Λ}中的所有函數(shù)和給定的概率分布F(x,y)滿足下列條件:A≤∫L(y,f(x,a))dF(,y)≤B,a∈Λ(2.16)則經(jīng)驗風險()empRa在整個函數(shù)集F上一致單邊收斂到期望風險R(a)就是學習過程具有一致性的充要條件,即:limPsup(()())0emptfRaRaε→∞∈>=F(2.17)這一關鍵定理將學習過程的一致性問題轉(zhuǎn)換為公式(2.17)中所定義的一致收斂問題[77],這一定理雖然解決了在什么條件下經(jīng)驗風險最小化原則可以保證一致性的關鍵
重慶理工大學碩士學位論文12問題,但并沒有給出滿足一致性條件的函數(shù)集的選擇和構(gòu)造方法,也沒有說明如何估計事件sup(()())fFempRaRaε∈>出現(xiàn)的概率,因此VC維仍然是作為衡量函數(shù)集性能的最重要指標。2.1.5結(jié)構(gòu)風險最小化原則結(jié)合公式(2.14)和(2.15)來看,當樣本數(shù)量足夠大,即nh較大時,期望風險由經(jīng)驗風險決定,當樣本數(shù)據(jù)量不足,即nh較小時,僅考慮最小化經(jīng)驗風險并不能夠保證期望風險也達到最小,此時就需要同時將置信范圍也納入考慮。然而在實際應用的過程中對置信范圍的調(diào)節(jié)通常都很依賴于經(jīng)驗和技巧,這就使得模型的使用難度進一步增大,此時就需要將風險原則換成同時兼顧經(jīng)驗風險和置信范圍的結(jié)構(gòu)風險最小化原則(SRM),從結(jié)構(gòu)風險最小化原則的提出背景可以看出,結(jié)構(gòu)風險最小化原則是對給定樣本集的分布函數(shù)的逼近程度和逼近函數(shù)復雜程度之間的一種折中。將給定函數(shù)集合S={f(x,ω),ω∈Λ}分解為一個嵌套的函數(shù)子集序列:12SS....S,各個子集的VC維分別為1,....,,....,khhh,任一子集的VC維都是有限的。對于已知的樣本數(shù)據(jù),下圖給出了關于期望風險、置信區(qū)間和經(jīng)驗風險分別隨函數(shù)VC維的變化曲線,可以看出,經(jīng)驗風險()empRω隨著函數(shù)集VC維h的增加而減小,函數(shù)集的學習能力隨著函數(shù)集VC維的增加而增強,即使樣本數(shù)量非常有限都能夠收斂。但置信風險Φ也會隨著函數(shù)集VC維h的增加而增大,折中兩者的影響就形成了一條凹型的期望風險曲線,而機器學習的目的就是獲取函數(shù)集中使得期望風險曲線達到最低的函數(shù)。圖2.2結(jié)構(gòu)風險最小化原則
【參考文獻】:
期刊論文
[1]支持向量機核函數(shù)選擇研究與仿真[J]. 梁禮明,鐘震,陳召陽. 計算機工程與科學. 2015(06)
[2]基于最大間隔的決策樹歸納算法[J]. 焦樹軍,安志江. 科技信息. 2011(25)
[3]支持向量機研究進展[J]. 顧亞祥,丁世飛. 計算機科學. 2011(02)
[4]常用核函數(shù)的幾何度量與幾何性質(zhì)[J]. 羅林開,葉凌君,周綺鳳. 廈門大學學報(自然科學版). 2009(06)
[5]基于實時擊鍵序列的主機入侵檢測[J]. 高艷,管曉宏,孫國基,馮力. 計算機學報. 2004(03)
博士論文
[1]類內(nèi)結(jié)構(gòu)支持向量機學習算法研究[D]. 安文娟.北京交通大學 2015
碩士論文
[1]大規(guī)模數(shù)據(jù)樣本下的稀疏最小二乘支持向量機研究[D]. 王欣.西安理工大學 2018
[2]滑塊式驗證碼健壯性分析[D]. 江運佳.西南財經(jīng)大學 2018
[3]多類分類支持向量機在語音識別中的應用研究[D]. 段繼康.太原理工大學 2010
[4]支持向量機(SVM)算法及其在腦電逆問題方面的應用[D]. 侯昀.河北工業(yè)大學 2007
本文編號:3369222
【文章來源】:重慶理工大學重慶市
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
論文的主要框架結(jié)構(gòu)
2SVM算法及其理論基礎11F(x,y),記(,)tfxa是函數(shù)集中使得經(jīng)驗風險()emptRa最小的預測函數(shù)。若對任意的ε>0,有:{()}limP()inf()0tlfRaRaε→∞∈>=F(2.14){()}limP()inf()0emptlfRaRaε→∞∈>=F(2.15)如果能夠?qū)ふ业揭粋使得經(jīng)驗風險和期望風險收斂到同一個可能的最小值的函數(shù){(,)|1,2......}tfxat=,那么學習過程中的經(jīng)驗風險最小化與期望風險最小化是具備一致性的。如圖所示,期望風險R(ω)和經(jīng)驗風險收斂到同一個可能最小的風險值0R(ω),代表學習過程是一致的。圖2.1學習過程一致性定理:學習理論的關鍵定理學習理論的關鍵定理是Vapnik和Chervonenkis[65]于1989年共同提出的,數(shù)統(tǒng)計學習理論中極其重要的理論基矗設存在常數(shù)A和B,能夠使得函數(shù)集F={f(x,a)|a∈Λ}中的所有函數(shù)和給定的概率分布F(x,y)滿足下列條件:A≤∫L(y,f(x,a))dF(,y)≤B,a∈Λ(2.16)則經(jīng)驗風險()empRa在整個函數(shù)集F上一致單邊收斂到期望風險R(a)就是學習過程具有一致性的充要條件,即:limPsup(()())0emptfRaRaε→∞∈>=F(2.17)這一關鍵定理將學習過程的一致性問題轉(zhuǎn)換為公式(2.17)中所定義的一致收斂問題[77],這一定理雖然解決了在什么條件下經(jīng)驗風險最小化原則可以保證一致性的關鍵
重慶理工大學碩士學位論文12問題,但并沒有給出滿足一致性條件的函數(shù)集的選擇和構(gòu)造方法,也沒有說明如何估計事件sup(()())fFempRaRaε∈>出現(xiàn)的概率,因此VC維仍然是作為衡量函數(shù)集性能的最重要指標。2.1.5結(jié)構(gòu)風險最小化原則結(jié)合公式(2.14)和(2.15)來看,當樣本數(shù)量足夠大,即nh較大時,期望風險由經(jīng)驗風險決定,當樣本數(shù)據(jù)量不足,即nh較小時,僅考慮最小化經(jīng)驗風險并不能夠保證期望風險也達到最小,此時就需要同時將置信范圍也納入考慮。然而在實際應用的過程中對置信范圍的調(diào)節(jié)通常都很依賴于經(jīng)驗和技巧,這就使得模型的使用難度進一步增大,此時就需要將風險原則換成同時兼顧經(jīng)驗風險和置信范圍的結(jié)構(gòu)風險最小化原則(SRM),從結(jié)構(gòu)風險最小化原則的提出背景可以看出,結(jié)構(gòu)風險最小化原則是對給定樣本集的分布函數(shù)的逼近程度和逼近函數(shù)復雜程度之間的一種折中。將給定函數(shù)集合S={f(x,ω),ω∈Λ}分解為一個嵌套的函數(shù)子集序列:12SS....S,各個子集的VC維分別為1,....,,....,khhh,任一子集的VC維都是有限的。對于已知的樣本數(shù)據(jù),下圖給出了關于期望風險、置信區(qū)間和經(jīng)驗風險分別隨函數(shù)VC維的變化曲線,可以看出,經(jīng)驗風險()empRω隨著函數(shù)集VC維h的增加而減小,函數(shù)集的學習能力隨著函數(shù)集VC維的增加而增強,即使樣本數(shù)量非常有限都能夠收斂。但置信風險Φ也會隨著函數(shù)集VC維h的增加而增大,折中兩者的影響就形成了一條凹型的期望風險曲線,而機器學習的目的就是獲取函數(shù)集中使得期望風險曲線達到最低的函數(shù)。圖2.2結(jié)構(gòu)風險最小化原則
【參考文獻】:
期刊論文
[1]支持向量機核函數(shù)選擇研究與仿真[J]. 梁禮明,鐘震,陳召陽. 計算機工程與科學. 2015(06)
[2]基于最大間隔的決策樹歸納算法[J]. 焦樹軍,安志江. 科技信息. 2011(25)
[3]支持向量機研究進展[J]. 顧亞祥,丁世飛. 計算機科學. 2011(02)
[4]常用核函數(shù)的幾何度量與幾何性質(zhì)[J]. 羅林開,葉凌君,周綺鳳. 廈門大學學報(自然科學版). 2009(06)
[5]基于實時擊鍵序列的主機入侵檢測[J]. 高艷,管曉宏,孫國基,馮力. 計算機學報. 2004(03)
博士論文
[1]類內(nèi)結(jié)構(gòu)支持向量機學習算法研究[D]. 安文娟.北京交通大學 2015
碩士論文
[1]大規(guī)模數(shù)據(jù)樣本下的稀疏最小二乘支持向量機研究[D]. 王欣.西安理工大學 2018
[2]滑塊式驗證碼健壯性分析[D]. 江運佳.西南財經(jīng)大學 2018
[3]多類分類支持向量機在語音識別中的應用研究[D]. 段繼康.太原理工大學 2010
[4]支持向量機(SVM)算法及其在腦電逆問題方面的應用[D]. 侯昀.河北工業(yè)大學 2007
本文編號:3369222
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3369222.html
最近更新
教材專著