天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

大詞匯量脫機手寫蒙古文整詞識別研究

發(fā)布時間:2021-05-20 00:56
  近年來,隨著數(shù)字化技術(shù)的飛速發(fā)展,越來越多的蒙古文手寫文獻資源被轉(zhuǎn)換成圖像格式加以保存。然而,圖像格式的蒙古文手寫文獻資源并不適合詞頻統(tǒng)計、內(nèi)容分析、編輯與檢索。因此,本文針對脫機手寫蒙古文識別問題開展相關(guān)研究,為挖掘和利用蒙古文手寫文獻資源提供便利。蒙古文獨特的構(gòu)詞方式導致其詞匯量巨大,據(jù)統(tǒng)計蒙古文詞匯量可達數(shù)百萬,常用詞匯也有幾十萬。此外,本文所關(guān)注的脫機手寫蒙古文是非受限書寫,在這種條件下,單詞書寫變形非常嚴重,這使得脫機手寫蒙古文識別任務極具挑戰(zhàn)性。針對蒙古文詞匯量巨大、書寫變形嚴重等特點,本文提出了適合于蒙古文構(gòu)詞特點和書寫方式的整詞識別方法。本文的主要工作如下:(1)采用目前文字識別領(lǐng)域最為流行的卷積循環(huán)神經(jīng)網(wǎng)絡(luò)與連接時序分類器相結(jié)合的模型(Convolution Recurrent Neural Network-Connectionist Temporal Classification,CRNN-CTC),實現(xiàn)了脫機手寫蒙古文整詞識別。在相關(guān)脫機手寫蒙古文數(shù)據(jù)集上進行測試,并與該數(shù)據(jù)集上性能最佳的深度神經(jīng)網(wǎng)絡(luò)與隱馬爾科夫相結(jié)合的模型(Deep Neural Network... 

【文章來源】:內(nèi)蒙古大學內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:57 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
    1.2 手寫識別方法分類及蒙古文特點分析
    1.3 脫機手寫蒙古文識別研究現(xiàn)狀
    1.4 本文的研究重點
    1.5 本文的結(jié)構(gòu)安排
第二章 相關(guān)模型介紹
    2.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
        2.1.3 卷積神經(jīng)網(wǎng)絡(luò)的總結(jié)
    2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.2.1 LSTM
        2.2.3 GRU
    2.3 連接時序分類器
        2.3.1 CTC的原理
        2.3.2 CTC的特點
    2.4 注意力機制
        2.4.1 注意力機制簡介
        2.4.2 手寫蒙古文識別中的注意力機制
第三章 CRNN-CTC模型的脫機手寫蒙古文整詞識別
    3.1 小詞匯量脫機手寫蒙古文數(shù)據(jù)集
        3.1.1 實驗數(shù)據(jù)集
        3.1.2 數(shù)據(jù)預處理
    3.2 CRNN-CTC模型
        3.2.1 模型結(jié)構(gòu)介紹
        3.2.2 模型訓練補充說明
    3.3 實驗結(jié)果與分析
        3.3.1 模型性能檢測標準
        3.3.2 結(jié)果與分析
    3.4 本章小結(jié)
第四章 序列到序列模型的脫機手寫蒙古文整詞識別
    4.1 大詞匯量手寫蒙古文數(shù)據(jù)集
        4.1.1 數(shù)據(jù)預處理
        4.1.2 實驗數(shù)據(jù)集
    4.2 具有注意力機制的序列到序列模型
        4.2.1 模型結(jié)構(gòu)介紹
        4.2.2 后處理
        4.2.3 幀序列生成方式
    4.3 不同的幀序列生成方式實驗
        4.3.1 幀重疊方式實驗結(jié)果與分析
        4.3.2 幀不重疊方式實驗結(jié)果與分析
    4.4 數(shù)據(jù)增強實驗
        4.4.1 數(shù)據(jù)增強方法
        4.4.2 數(shù)據(jù)增強結(jié)果與分析
    4.5 基于大詞匯量手寫蒙古文數(shù)據(jù)集的對比實驗
        4.5.1 幀重疊方式實驗結(jié)果與分析
        4.5.2 幀不重疊方式實驗結(jié)果與分析
        4.5.3 數(shù)據(jù)增強實驗結(jié)果與分析
    4.6 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻
致謝


【參考文獻】:
期刊論文
[1]蒙文文檔圖像的傾斜檢測方法[J]. 魏宏喜,高光來.  內(nèi)蒙古大學學報(自然科學版). 2007(04)

博士論文
[1]蒙古文古籍圖像檢索技術(shù)研究[D]. 魏宏喜.內(nèi)蒙古大學 2012

碩士論文
[1]聯(lián)機手寫蒙古文字識別技術(shù)的研究[D]. 白文榮.內(nèi)蒙古大學 2007
[2]印刷體蒙古文字識別中關(guān)鍵技術(shù)的研究[D]. 魏宏喜.內(nèi)蒙古大學 2006
[3]聯(lián)機手寫蒙古文字識別技術(shù)的研究與實現(xiàn)[D]. 吳偉.內(nèi)蒙古大學 2005



本文編號:3196767

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3196767.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶31bdf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com