天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于注意力機制的中文識別算法研究

發(fā)布時間:2021-03-25 07:50
  文字作為人類最偉大的發(fā)明之一,不僅是人類語言的書面表達形式,更是一種精神、文化的傳承。而圖像作為一種重要的信息載體,不僅攜帶著色彩、紋理、結(jié)構(gòu)等信息,通常還存在大量文字,其中文字往往包含更豐富的語義信息,能夠?qū)D像場景的理解提供重要線索?梢哉f文字在日常生活中隨處可見,如何對圖像中的文字進行識別和理解具有重要的研究意義,也有著廣闊的實際應(yīng)用場景。如手寫票據(jù)識別、車牌識別、拍照翻譯等應(yīng)用,可以大大提高人類生產(chǎn)效率,給人們的生活帶來幫助和便捷。盡管傳統(tǒng)的文檔文字識別技術(shù)已經(jīng)非常成熟,但是由于手寫風格的巨大差異和自然場景復雜的背景,準確地識別手寫漢字以及自然場景圖片中的文字仍然是非常有挑戰(zhàn)性的任務(wù)。隨著深度學習技術(shù)的快速發(fā)展,計算機視覺領(lǐng)域迎來重大突破。本文借助深度學習技術(shù),結(jié)合中文的特性,展開對手寫漢字字符和自然場景中文文本的識別研究,主要研究內(nèi)容如下:(1)提出了一種基于多對比注意力機制的卷積神經(jīng)網(wǎng)絡(luò)來進行手寫漢字字符識別。此方法對同一張輸入圖片學習多個注意力區(qū)域,并且在多個損失函數(shù)的監(jiān)督下,使模型的注意力能夠定位到字符有區(qū)分性的區(qū)域,同時讓同類字符定位到的這些區(qū)域特征盡量相似以減小手寫... 

【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【部分圖文】:

基于注意力機制的中文識別算法研究


印刷體漢字(左圖)與手寫體漢字(右圖)示例

文字,場景,文檔,示例


華 中 科 技 大 學 碩 士 學 位 論 文圖 1.2 文檔文字(左圖)與自然場景文字(右圖)示例如圖1.2, 相比文檔文字的背景簡單、字體單一,自然場景文字具有高度的復雜性和不確定性,主要表現(xiàn)在以下幾個方面:(1)自然場景文字背景復雜。場景文字可能出現(xiàn)在包含任何背景的圖像中,包括但不限于網(wǎng)絡(luò)截屏、路標、廣告牌、玻璃,甚至懸在半空中的建筑物。尤其是一些干擾強、噪聲大的背景,如發(fā)光的廣告牌、透明的玻璃、以及包含類似文字的物體(如柵欄、草地等)的背景,使得區(qū)分文本與背景區(qū)域的難度大大增加。部分場景文字圖片難點示例如圖1.3所示。圖 1.3 自然場景文字難點示例2

自然場景,文字,難點,示例


強、噪聲大的背景,如發(fā)光的廣告牌、透明的玻璃、以及包含類似文字的物體(如柵欄、草地等)的背景,使得區(qū)分文本與背景區(qū)域的難度大大增加。部分場景文字圖片難點示例如圖1.3所示。圖 1.3 自然場景文字難點示例2


本文編號:3099337

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3099337.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5390***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com