面向自然場景漢字識別的非平衡性與抗攻擊性研究
發(fā)布時間:2022-12-05 00:34
光學(xué)文字識別(Optical Character Recognition,簡稱OCR)是計算機視覺領(lǐng)域的基礎(chǔ)課題之一。自然場景下的漢字識別至今仍然存在著一定的提升空間,尤其在不平衡、稀缺訓(xùn)練集上的漢字識別效果并不理想。近些年隨著深度學(xué)習(xí)的飛速發(fā)展,自然場景中的文字識別取得了巨大的成就。特別對于文字符號偏少的語種(如英文僅有26個字母),深度學(xué)習(xí)已經(jīng)能夠達到甚至超越人眼的識別性能。然而對于文字符號復(fù)雜并且數(shù)量偏大的語種(如中文常用字就有3000多字),受樣本不均衡,訓(xùn)練樣本稀缺等因素的影響,深度學(xué)習(xí)方法仍然不能達到理想的識別性能。本文以中文漢字識別為研究對象,針對現(xiàn)有的漢字識別算法在實際應(yīng)用中所面臨的關(guān)鍵技術(shù)難題進行了深入的研究與討論。本文的主要貢獻包括以下四個方面:第一,提出了基于聚焦CTC損失的非平衡漢字識別方法。深度學(xué)習(xí)模型在漢字識別任務(wù)的訓(xùn)練過程中不可避免的面臨訓(xùn)練數(shù)據(jù)不平衡的問題,導(dǎo)致低頻文字無法得到充分的訓(xùn)練,從而影響模型的整體性能。本文提出的聚焦CTC是一種新型的序列分類損失函數(shù),該方法能夠在不對訓(xùn)練數(shù)據(jù)做人為調(diào)整的情況下,使模型在訓(xùn)練過程中自動地向未充分學(xué)習(xí)的樣本傾斜,有...
【文章頁數(shù)】:117 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 文字識別以及相關(guān)深度學(xué)習(xí)技術(shù)研究現(xiàn)狀
1.2.1 文字識別相關(guān)研究現(xiàn)狀
1.2.2 文字識別骨干網(wǎng)絡(luò)結(jié)構(gòu)研究現(xiàn)狀
1.2.3 小樣本學(xué)習(xí)研究現(xiàn)狀
1.2.4 對抗攻擊研究現(xiàn)狀
1.3 漢字識別領(lǐng)域內(nèi)所存在的主要問題
1.4 本文的內(nèi)容安排
第2章 基于聚焦CTC損失的非平衡漢字識別方法
2.1 引言
2.2 基于聚焦CTC的非平衡漢字識別算法
2.2.1 基于聚焦CTC的文字識別網(wǎng)絡(luò)結(jié)構(gòu)
2.2.2 聚焦CTC函數(shù)
2.3 基于聚焦CTC的非平衡漢字識別的實驗結(jié)果與分析
2.3.1 實驗數(shù)據(jù)描述
2.3.2 訓(xùn)練策略以及評價標準
2.3.3 基于聚焦CTC的非平衡漢字識別的實驗結(jié)果
2.3.4 基于聚焦CTC的非平衡漢字識別的實驗分析
2.4 本章小結(jié)
第3章 基于精簡稠密網(wǎng)絡(luò)的漢字識別方法
3.1 引言
3.2 基于精簡稠密網(wǎng)絡(luò)的漢字識別模型
3.2.1 精簡稠密網(wǎng)絡(luò)
3.2.2 基于精簡稠密網(wǎng)絡(luò)的漢字識別模型
3.3 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)描述
3.3.2 分類數(shù)據(jù)集實驗結(jié)果與分析
3.3.3 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗結(jié)果
3.3.4 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗分析
3.4 本章小結(jié)
第4章 基于LSTM-Reptile元學(xué)習(xí)手寫漢字識別方法
4.1 引言
4.2 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別算法
4.2.1 LSTM-Reptile元學(xué)習(xí)
4.2.2 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別
4.3 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別實驗結(jié)果與分析
4.3.1 實驗數(shù)據(jù)描述
4.3.2 學(xué)習(xí)器模型與元學(xué)習(xí)器模型
4.3.3 分類數(shù)據(jù)集實驗結(jié)果與分析
4.3.4 合成漢字識別數(shù)據(jù)集上的實驗結(jié)果與分析
4.3.5 真實漢字識別數(shù)據(jù)集上的實驗結(jié)果與分析
4.4 本章小結(jié)
第5章 基于提升迭代法的漢字識別抗攻擊方法
5.1 引言
5.2 基于提升迭代法的漢字識別抗攻擊算法
5.2.1 對抗樣本的生成方法
5.2.2 基于提升迭代法的對抗樣本生成方法
5.2.3 基于提升迭代法的漢字識別模型的抗攻擊方法
5.3 基于提升迭代法的漢字識別抗攻擊實驗結(jié)果與分析
5.3.1 實驗數(shù)據(jù)與模型描述
5.3.2 基于提升迭代法的漢字識別抗攻擊實驗結(jié)果
5.3.3 基于提升迭代法的漢字識別抗攻擊實驗分析
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)在手寫漢字識別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學(xué)報. 2016(08)
本文編號:3709305
【文章頁數(shù)】:117 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 文字識別以及相關(guān)深度學(xué)習(xí)技術(shù)研究現(xiàn)狀
1.2.1 文字識別相關(guān)研究現(xiàn)狀
1.2.2 文字識別骨干網(wǎng)絡(luò)結(jié)構(gòu)研究現(xiàn)狀
1.2.3 小樣本學(xué)習(xí)研究現(xiàn)狀
1.2.4 對抗攻擊研究現(xiàn)狀
1.3 漢字識別領(lǐng)域內(nèi)所存在的主要問題
1.4 本文的內(nèi)容安排
第2章 基于聚焦CTC損失的非平衡漢字識別方法
2.1 引言
2.2 基于聚焦CTC的非平衡漢字識別算法
2.2.1 基于聚焦CTC的文字識別網(wǎng)絡(luò)結(jié)構(gòu)
2.2.2 聚焦CTC函數(shù)
2.3 基于聚焦CTC的非平衡漢字識別的實驗結(jié)果與分析
2.3.1 實驗數(shù)據(jù)描述
2.3.2 訓(xùn)練策略以及評價標準
2.3.3 基于聚焦CTC的非平衡漢字識別的實驗結(jié)果
2.3.4 基于聚焦CTC的非平衡漢字識別的實驗分析
2.4 本章小結(jié)
第3章 基于精簡稠密網(wǎng)絡(luò)的漢字識別方法
3.1 引言
3.2 基于精簡稠密網(wǎng)絡(luò)的漢字識別模型
3.2.1 精簡稠密網(wǎng)絡(luò)
3.2.2 基于精簡稠密網(wǎng)絡(luò)的漢字識別模型
3.3 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)描述
3.3.2 分類數(shù)據(jù)集實驗結(jié)果與分析
3.3.3 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗結(jié)果
3.3.4 基于精簡稠密網(wǎng)絡(luò)的漢字識別實驗分析
3.4 本章小結(jié)
第4章 基于LSTM-Reptile元學(xué)習(xí)手寫漢字識別方法
4.1 引言
4.2 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別算法
4.2.1 LSTM-Reptile元學(xué)習(xí)
4.2.2 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別
4.3 基于LSTM-Reptile元學(xué)習(xí)的手寫漢字識別實驗結(jié)果與分析
4.3.1 實驗數(shù)據(jù)描述
4.3.2 學(xué)習(xí)器模型與元學(xué)習(xí)器模型
4.3.3 分類數(shù)據(jù)集實驗結(jié)果與分析
4.3.4 合成漢字識別數(shù)據(jù)集上的實驗結(jié)果與分析
4.3.5 真實漢字識別數(shù)據(jù)集上的實驗結(jié)果與分析
4.4 本章小結(jié)
第5章 基于提升迭代法的漢字識別抗攻擊方法
5.1 引言
5.2 基于提升迭代法的漢字識別抗攻擊算法
5.2.1 對抗樣本的生成方法
5.2.2 基于提升迭代法的對抗樣本生成方法
5.2.3 基于提升迭代法的漢字識別模型的抗攻擊方法
5.3 基于提升迭代法的漢字識別抗攻擊實驗結(jié)果與分析
5.3.1 實驗數(shù)據(jù)與模型描述
5.3.2 基于提升迭代法的漢字識別抗攻擊實驗結(jié)果
5.3.3 基于提升迭代法的漢字識別抗攻擊實驗分析
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)在手寫漢字識別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學(xué)報. 2016(08)
本文編號:3709305
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3709305.html
最近更新
教材專著