面向特定字符集的脫機(jī)手寫體文字識別算法研究
【圖文】:
識別算法對預(yù)處理后的文字進(jìn)行特征提取,進(jìn)而依據(jù)提取出的各類特征進(jìn)行分類,之后逡逑與知識庫中己有的文字特征進(jìn)行匹配,最后可以識別出手寫體文字。逡逑從流程上看,脫機(jī)手寫識別大體分為預(yù)處理,,文字識別與后處理三個(gè)模塊,如圖2.1逡逑所示,預(yù)處理過程可分為二值化、平滑去噪、規(guī)范化等幾個(gè)步驟,文字識別過程又可分逡逑為特征提取、分類、特征匹配等幾個(gè)步驟,而后處理即為將識別過程中新學(xué)到的特征錄逡逑入知識庫中。逡逑手與體文件逡逑片格式保忭的逡逑文件邐筅機(jī)逡逑I邐I邐邐逡逑■邋■■■邋■..A邐 ̄?二值化逡逑預(yù)處理邐?|邐|平?噴|逡逑—— ̄ ̄I規(guī)范化丨逡逑邐邐邋 ̄?!邐I特征提。义希保敝R庫I邋」丨后處pk邋-邋識別邐?!分炎逡逑Li邐N邋j邋L邐!邐■{-邐"-十逡逑邐邐 ̄?!邐\mmM\逡逑邐'邋r邐逡逑輸出識別結(jié)果逡逑圖2.1脫機(jī)手寫體文字識別一般流程逡逑2.1預(yù)處理逡逑需要被識別的手寫體文字在書寫過程中或經(jīng)過掃描后可能生成各種噪聲。噪聲即為逡逑掃描出文件中的文字與知識庫中標(biāo)準(zhǔn)文字的特征信息不匹配的地方,而產(chǎn)生噪聲的原因逡逑9逡逑
的識別工作,首先要進(jìn)行對掃描圖像的預(yù)處理,從而將圖像的噪聲降到最低,以提高識逡逑別速度與識別率。逡逑如圖2.2所示,手寫識別與印刷體識別的預(yù)處理工作大致類似,基本步驟都分為二逡逑值化、去噪、傾斜校正、行切分、列切分、標(biāo)準(zhǔn)化等。逡逑'i邐-邐平邐^邐^邐^邐i逡逑Sl;邋一一邋j邋H邋—邋2邋一逡逑M邋u邐□邋11逡逑圖2.2手寫識別預(yù)處理一般過程逡逑2.1.1二值化逡逑所謂二值,指的是一副圖像中只存在黑白兩種顏色的圖像,并且在圖像中沒有另外逡逑的灰度變化。這樣的圖像中的像素點(diǎn)可以用0和1來表示黑和白(或白和黑)。二值化逡逑即為將普通的掃描圖像轉(zhuǎn)化為二值圖像的過程,通常為預(yù)處理的第一步,二值效果也將逡逑對之后的步驟造成很大影響,是整個(gè)預(yù)處理過程能否得到理想結(jié)果的關(guān)鍵。逡逑文獻(xiàn)[28]給出了一個(gè)灰度化彩色圖像的過程,從而可以得到二值化圖像;叶葓D像逡逑二值化的核心是確定適當(dāng)?shù)拈撝担蛞詣澐止P畫像素和背景像素%。閾值劃分法將整個(gè)圖逡逑像劃分為256個(gè)灰度區(qū)域,同一灰度像素共屬于一個(gè)灰度區(qū)域,由于一般在一個(gè)文字圖逡逑像中筆畫部分與背景部分灰度差異比較明顯,可以依據(jù)此特點(diǎn)確定r從而將筆畫像素所逡逑代表的灰度區(qū)域像素抽取出來。多種尋找閾值r的方法都較為成熟,但需要根據(jù)實(shí)際情逡逑況進(jìn)行選擇。逡逑(1)全局閾值法逡逑全局閾值法的計(jì)算對象為整個(gè)文字圖像
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.43
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 任日麗;彭利紅;;基于改進(jìn)的十三點(diǎn)特征提取算法的智能閱卷系統(tǒng)研究[J];電腦知識與技術(shù);2015年09期
2 孔斌;喻民;劉超;李續(xù);;保密檢查中圖像文件內(nèi)容識別技術(shù)研究[J];保密科學(xué)技術(shù);2014年07期
3 溫尚清;郝志峰;廖芹;陳炎雄;;基于貝葉斯網(wǎng)絡(luò)的脫機(jī)手寫體漢字智能識別[J];計(jì)算機(jī)輔助工程;2006年03期
4 魏陽;索忠偉;李文容;;數(shù)字濾波器在實(shí)時(shí)濾除心電干擾中的設(shè)計(jì)與應(yīng)用[J];微計(jì)算機(jī)信息;2006年11期
5 李國宏;施鵬飛;;手寫體漢字筆畫特征點(diǎn)的完整性分析[J];計(jì)算機(jī)工程;2006年06期
6 焦李成;孫強(qiáng);;多尺度變換域圖像的感知與識別:進(jìn)展和展望[J];計(jì)算機(jī)學(xué)報(bào);2006年02期
7 高彥宇,楊揚(yáng),陳飛;基于融合特征和LS-SVM的脫機(jī)手寫體漢字識別[J];北京科技大學(xué)學(xué)報(bào);2005年04期
8 付慶玲,韓力群;基于人工神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別[J];北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
9 Paul Graham;;反垃圾信的新策略[J];程序員;2003年10期
10 童學(xué)鋒,石繁槐;FSVM在有限集脫機(jī)手寫體漢字識別中的應(yīng)用[J];計(jì)算機(jī)工程;2003年13期
相關(guān)博士學(xué)位論文 前1條
1 婁正良;中文郵政地址識別研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
相關(guān)碩士學(xué)位論文 前1條
1 戚世貴;基于圖像特征點(diǎn)的提取匹配及應(yīng)用[D];吉林大學(xué);2006年
本文編號:2530696
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2530696.html