天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言藝術(shù)論文 >

藏文印刷體識別系統(tǒng)的研究與實現(xiàn)

發(fā)布時間:2020-03-31 08:30
【摘要】:英、漢文字識別研究較早,經(jīng)過許多學(xué)者的不懈努力,中英文識別在技術(shù)方面累積了豐富的成果,并開發(fā)出許多商業(yè)化產(chǎn)品,識別率達(dá)到了99%以上。藏文識別方面由于藏文信息化建設(shè)較晚,直到信息化高速發(fā)展的今天,還處于起步階段。而且藏文與中英文存在很大的差異,不能完全借鑒中英文識別中的成熟技術(shù),需要依據(jù)藏文自身的特點,研究和設(shè)計出適合藏文的識別系統(tǒng)。藏文是一種非常古老的文字,記載著藏民族獨有的文化,是全世界文化寶庫中的重要組成部分。隨著信息化時代的到來,為了讓藏文能更有效地進行傳播、查閱和交換,必須用數(shù)字化方式來整理和保存。所以藏文識別技術(shù)是解決這一問題的一種理想而有效的手段,可減少大量人力和財力的投入,而且藏文識別技術(shù)的發(fā)展,能推進民族文化、教育、經(jīng)濟的發(fā)展。具有非常重要的意義。根據(jù)上述問題,本課題深入研究了文字識別系統(tǒng)中的關(guān)鍵技術(shù)以及藏文字符的結(jié)構(gòu)特征。重點研究內(nèi)容放在藏文字丁的切分和分類識別上。提出了基于多策略的細(xì)化切分方法和基于二級分類器的識別方法。完成的主要工作具體如下:1.圖像預(yù)處理。將圖像預(yù)處理過程分為圖像灰度化、二值化、除噪、傾斜矯正四個步驟。其主要目的就是盡可能地去除印刷體藏文文檔圖像的無用信息,使圖像中的文字信息更容易檢測。本系統(tǒng)圖像預(yù)處理過程主要采用文字識別系統(tǒng)中常用的預(yù)處理方式,并取得了較好的效果。2.印刷體藏文文檔圖像中藏文字丁的切分。藏文字丁的切分過程分為行切分和字丁切分。首先將圖像中的每個文本行切分出來,然后把每行中的藏文字丁切分出來。由于藏文字丁寬高不等,圖像中會出現(xiàn)不同程度的重疊粘連問題。針對該問題提出了基于多策略的細(xì)化切分方法,對重疊粘連段該方法具有較好的切分效果。3.特征提取。特征提取對于印刷體藏文識別系統(tǒng)來說是一個非常重要的步驟,是實現(xiàn)文字識別的核心及難點。其主要目的就是提取出反映藏文字丁本質(zhì)的特征序列,通過已提取的特征序列使計算機具備識別藏文文本的能力。根據(jù)藏文字符的字形和結(jié)構(gòu)特征,提出了一種藏文字符混合特征的提取方法,其特征主要包括基線特征、封閉區(qū)域數(shù)特征和粗網(wǎng)格特征。4.分類識別。提取特征后,下一步就是與特征庫進行分類匹配,最終達(dá)到識別效果。在識別過程中分類器的設(shè)計是很關(guān)鍵的問題。分類器的好壞直接影響識別的準(zhǔn)確率。所以設(shè)計了基于藏文混合特征的二級分類器。該分類器可以彌補小維度特征和大維度特征之間的缺陷,在識別過程中提高了速度和精確度。最后通過實驗測試,本課題開發(fā)的印刷體藏文識別系統(tǒng)具有較好的識別效果,識別率達(dá)到了83.24%,但與此同時,還有一些模塊功能需要進一步完善和提高。
【圖文】:

直方圖,文字,直方圖,閾值


文字灰度直方圖有兩個明顯的波峰,分別表示圖像中的文字和背景部分,此時可以將波谷處的像素值作為閾值。圖2-1 文字直方圖如果圖像質(zhì)量差,有噪點等其他干擾因素的情況下,該方法獲取閾值比較困難。(3) 迭代閾值設(shè)定實現(xiàn)迭代閾值設(shè)定的基本步驟就是,,首先,通過人工設(shè)定閾值或灰度直方圖設(shè)定閾值的方法確定初始化閾值Tx,然后根據(jù)Tx對圖像進行二值化,將圖像區(qū)域分為文字部分和背景部分,再分別求出這兩個部分的平均值,并將兩個值的均值作為新閾值Tx+1,通過閾值Tx+1對圖像進行二值化,依次反復(fù)迭代,當(dāng)閾值之間進行對比無變化時,結(jié)束迭代,得到最終的閾值。具體的算法流程圖如圖2-2所示。開始初始化閾值TX用TX對圖像二值化求出文字、背景像素支均值H1和H2新閾值TX+1=(H1+H2)/2TX+1==TXTX=TX+1NY結(jié)束圖2-2 迭代閾值設(shè)定方法

藏文,圖片,文檔圖像,對偶性


藏文傾斜圖片
【學(xué)位授予單位】:青海民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:H214;TP391.41

【參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 周緯;陳良育;曾振柄;;基于幾何形狀分析的藏文字符識別[J];計算機工程與應(yīng)用;2012年18期

2 李永忠;王玉雷;劉真真;;藏文印刷體字符識別技術(shù)研究[J];南京大學(xué)學(xué)報(自然科學(xué)版);2012年01期

3 梁瑩;肖健;李s

本文編號:2608832


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/2608832.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7962c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com