天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

手寫(xiě)體新蒙文字符識(shí)別算法研究

發(fā)布時(shí)間:2021-01-17 12:51
  在當(dāng)今各國(guó)合作共建的時(shí)代背景下,中蒙兩國(guó)作為睦鄰友好的鄰國(guó),將新蒙文做一個(gè)有效的電腦錄入以及字符識(shí)別,能有利于兩國(guó)之間和地區(qū)之間的經(jīng)濟(jì)、社會(huì)、文化發(fā)展,也能促進(jìn)兩國(guó)和地區(qū)人民之間更好的交流溝通。為了滿足基本的應(yīng)用需求,本文從識(shí)別率及識(shí)別速度的角度出發(fā),結(jié)合新蒙文的字符與語(yǔ)言特點(diǎn),設(shè)計(jì)了手寫(xiě)體新蒙文字符識(shí)別系統(tǒng)。論文主要完成了以下內(nèi)容。1、完成了手寫(xiě)體新蒙文字符庫(kù)與語(yǔ)料庫(kù)的建立。通過(guò)編寫(xiě)字符錄入窗口,邀請(qǐng)15位同學(xué)進(jìn)行樣本錄入,完成了手寫(xiě)體新蒙文字符樣本集的制作。并通過(guò)轉(zhuǎn)錄新蒙文文章的形式構(gòu)建了新蒙文的語(yǔ)料庫(kù)。2、對(duì)于已錄入的樣本集,結(jié)合新蒙文的字符特征以及語(yǔ)言特點(diǎn)進(jìn)行分析研究,通過(guò)手寫(xiě)體新蒙文進(jìn)行嘗試分類實(shí)驗(yàn)發(fā)掘手寫(xiě)體新蒙文字符識(shí)別中存在的問(wèn)題。對(duì)于實(shí)驗(yàn)結(jié)果進(jìn)行分析,針對(duì)發(fā)現(xiàn)的問(wèn)題,提出了手寫(xiě)體新蒙文字符識(shí)別系統(tǒng)的設(shè)計(jì)方案。3、采用深層卷積神經(jīng)網(wǎng)絡(luò)作為主分類器,通過(guò)多組實(shí)驗(yàn)測(cè)試比對(duì),確定神經(jīng)網(wǎng)絡(luò)框架,并經(jīng)過(guò)微調(diào)確定了最適合手寫(xiě)體新蒙文字符識(shí)別的深層卷積神經(jīng)網(wǎng)絡(luò)模型;谧R(shí)別結(jié)果提出了進(jìn)一步提高識(shí)別率的可能。4、輔助分類器的設(shè)計(jì)與分類器整合。結(jié)合手寫(xiě)體新蒙文字的語(yǔ)言特性,利用長(zhǎng)短期記憶神... 

【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁(yè)數(shù)】:85 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

手寫(xiě)體新蒙文字符識(shí)別算法研究


新蒙文的鍵盤(pán)式輸入法

程序框圖,字符,程序框圖


內(nèi)蒙古大學(xué)碩士學(xué)位論文6第二章字符樣本的錄入與數(shù)據(jù)集的制作由于在制作分類器時(shí)并沒(méi)有一個(gè)完備的手寫(xiě)體新蒙文字符樣本庫(kù)與語(yǔ)料庫(kù),受限于設(shè)計(jì)算法的需求,設(shè)計(jì)初期首先要做的就是構(gòu)建一個(gè)適合于網(wǎng)絡(luò)訓(xùn)練需求的樣本集。2.1字符的錄入字符錄入部分的工作是通過(guò)MATLAB編程完成,除此之外淺層神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)部分也在MATLAB環(huán)境下完成。字符錄入部分的設(shè)計(jì)思路是通過(guò)生成坐標(biāo)系,對(duì)鼠標(biāo)左鍵按下時(shí)的位置收錄作為點(diǎn)集,通過(guò)點(diǎn)集確定繪制區(qū)域,并將其與坐標(biāo)系結(jié)合生成圖像。為防止在鼠標(biāo)滑動(dòng)較快時(shí)導(dǎo)致點(diǎn)不夠密集,由此引發(fā)生成的圖像存在斷線的情況,需要在每次捕獲位置時(shí)對(duì)于移動(dòng)的距離上限進(jìn)行設(shè)定,當(dāng)鼠標(biāo)的移動(dòng)距離超過(guò)設(shè)定的閾值時(shí),對(duì)這一段空白的間距進(jìn)行直線擬合。并且在擬合時(shí),需要對(duì)于直線斜率不存時(shí)的情況單獨(dú)處理。為使后續(xù)訓(xùn)練過(guò)程中更易于處理,對(duì)于錄入的圖像進(jìn)行二值化處理并取反為黑底白字,同時(shí)重新調(diào)整圖片的大小為35*35*3(長(zhǎng)*寬*通道數(shù),為避免與通道數(shù)放在第一位的表述方式混淆,如無(wú)特殊說(shuō)明本文保持這種圖片尺寸的表述方式)。程序框圖如圖2.1所示:圖2.1字符錄入部分的程序框圖Fig.2.1Programblockdiagramofcharacterenteringpart

手寫(xiě)體,蒙文,字符


內(nèi)蒙古大學(xué)碩士學(xué)位論文7制作完成的簡(jiǎn)單錄入窗口如圖2.2所示。圖2.2手寫(xiě)體新蒙文的錄入窗口Fig.2.2InputwindowofhandwritingMongolianCyrillicCharacter為保證數(shù)據(jù)集有較好的廣泛性,在字符錄入時(shí),尋找了15位同學(xué)進(jìn)行協(xié)助,每人為68個(gè)字符(大寫(xiě)字符33個(gè)以及小寫(xiě)字符35個(gè),其中有兩個(gè)字符無(wú)大小寫(xiě)形式區(qū)分)每個(gè)字符提供10個(gè)樣本,構(gòu)成了共計(jì)4950個(gè)數(shù)據(jù)的大寫(xiě)字符樣本集和共計(jì)5250個(gè)數(shù)據(jù)的小寫(xiě)字符樣本集。其中С字符的樣本集如圖2.3所示,圖示樣本集為經(jīng)過(guò)抽取測(cè)試集樣本后的訓(xùn)練集樣本,因此總計(jì)不足150個(gè)。從圖2.3中可以看出,采集的樣本不僅在筆跡粗細(xì),大小上存在區(qū)別,在字符的大小與位置上也存在不同,為識(shí)別工作增加了難度。圖2.3部分手寫(xiě)體字符樣本Fig.2.3Somehandwritingcharactersamples新蒙文字符部分字符在大小寫(xiě)的字體寫(xiě)法上具有高度的相似性,如圖2.4所示。圖2.4(a)字符Ж的手寫(xiě)體圖2.4(b)字符Й的手寫(xiě)體Fig.2.4(a)HandwritingcharacterЖFig.2.4(b)HandwritingcharacterЖ

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)Inception卷積神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別[J]. 余圣新,夏成蹊,唐澤恬,丁召,楊晨.  計(jì)算機(jī)應(yīng)用與軟件. 2019(12)
[2]深度卷積記憶網(wǎng)絡(luò)時(shí)空數(shù)據(jù)模型[J]. 秦超,高曉光,萬(wàn)開(kāi)方.  自動(dòng)化學(xué)報(bào). 2020(03)
[3]基于改進(jìn)inception的脫機(jī)手寫(xiě)漢字識(shí)別[J]. 陳站,邱衛(wèi)根,張立臣.  計(jì)算機(jī)應(yīng)用研究. 2020(04)
[4]一種HOG特征模板匹配算法[J]. 崔偉清,黨長(zhǎng)春,張旺,王洪洲,羅勇牙.  機(jī)械管理開(kāi)發(fā). 2018(11)
[5]人工智能在手寫(xiě)字符識(shí)別領(lǐng)域的應(yīng)用[J]. 譚仁杰.  中國(guó)新通信. 2018(20)
[6]基于神經(jīng)網(wǎng)絡(luò)對(duì)手寫(xiě)字符的研究[J]. 王澤天.  科技經(jīng)濟(jì)導(dǎo)刊. 2018(29)
[7]計(jì)算機(jī)技術(shù)在手寫(xiě)體漢字識(shí)別方面的應(yīng)用及發(fā)展趨勢(shì)[J]. 陳擎國(guó).  科技傳播. 2018(19)
[8]Gabor濾波器參數(shù)設(shè)置[J]. 孔銳,張冰.  控制與決策. 2012(08)
[9]改進(jìn)的HOG和Gabor,LBP性能比較[J]. 向征,譚恒良,馬爭(zhēng)鳴.  計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2012(06)
[10]一種采用Gabor小波的紋理特征提取方法[J]. 張剛,馬宗民.  中國(guó)圖象圖形學(xué)報(bào). 2010(02)

博士論文
[1]基于圖像分析和深度學(xué)習(xí)的船名標(biāo)識(shí)字符檢測(cè)與識(shí)別研究[D]. 劉寶龍.浙江大學(xué) 2018
[2]西里爾蒙古文—漢文機(jī)器翻譯系統(tǒng)的實(shí)現(xiàn)[D]. 烏日力嘎.內(nèi)蒙古大學(xué) 2015

碩士論文
[1]基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實(shí)現(xiàn)[D]. 馮海.中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院) 2019
[2]彈丸運(yùn)動(dòng)參數(shù)激光陰影照相測(cè)試技術(shù)研究[D]. 張文博.西安工業(yè)大學(xué) 2019
[3]基于深度學(xué)習(xí)的手寫(xiě)漢字識(shí)別的研究[D]. 蘇日婭.內(nèi)蒙古大學(xué) 2019
[4]基于LSTM模型的數(shù)學(xué)公式手寫(xiě)體識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D]. 王奕松.電子科技大學(xué) 2018
[5]藏文音節(jié)字手寫(xiě)識(shí)別[D]. 袁道昱.西安電子科技大學(xué) 2017
[6]圖像中的文本檢測(cè)與識(shí)別研究[D]. 楊彬.東南大學(xué) 2017
[7]基于雙向長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)的聯(lián)機(jī)手寫(xiě)數(shù)字公式字符識(shí)別[D]. 商俊蓓.華南理工大學(xué) 2015
[8]多字體印刷蒙文字識(shí)別技術(shù)的研究[D]. 李偉.內(nèi)蒙古大學(xué) 2004



本文編號(hào):2982919

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2982919.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4808b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com