天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

手寫(xiě)中文文本視覺(jué)信息與語(yǔ)言信息特征層融合的深度網(wǎng)絡(luò)模型研究

發(fā)布時(shí)間:2021-04-27 16:11
  手寫(xiě)中文文本識(shí)別是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的研究熱點(diǎn)和難點(diǎn)之一,深度學(xué)習(xí)的興起為手寫(xiě)中文文本識(shí)別提供了新的研究方法。大多數(shù)現(xiàn)有的基于深度學(xué)習(xí)的方法首先利用視覺(jué)信息訓(xùn)練識(shí)別模型,然后將識(shí)別模型的結(jié)果與語(yǔ)言模型相結(jié)合,即在決策層融合視覺(jué)信息與語(yǔ)言信息。本文從在特征層融合視覺(jué)信息與語(yǔ)言信息的角度出發(fā),采用深度學(xué)習(xí)方法和強(qiáng)化學(xué)習(xí)方法構(gòu)建深度網(wǎng)絡(luò)模型,解決手寫(xiě)中文文本識(shí)別問(wèn)題。旨在通過(guò)具有豐富語(yǔ)義信息的多模態(tài)聯(lián)合表達(dá),來(lái)提高模型的識(shí)別性能。本文的主要工作包括:(1)研究了基于注意力機(jī)制的編碼解碼模型在手寫(xiě)中文文本識(shí)別中的應(yīng)用,將字符級(jí)別視覺(jué)信息與語(yǔ)言信息的特征層融合模塊嵌入基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的解碼模塊,構(gòu)建基于字符級(jí)別特征層融合的手寫(xiě)中文文本識(shí)別模型。具體地,由于視覺(jué)信息與語(yǔ)言信息之間存在著表達(dá)形式和語(yǔ)義層次的差異,為了對(duì)每個(gè)字符的多模態(tài)聯(lián)合表達(dá)進(jìn)行有效地學(xué)習(xí),本文探索了三種字符級(jí)別視覺(jué)信息與語(yǔ)言信息的特征層融合方法,分別是基于向量加和、向量拼接和門(mén)機(jī)制的方法。實(shí)驗(yàn)結(jié)果表明了在特征層融合視覺(jué)信息與語(yǔ)言信息的有效性,驗(yàn)證了采用基于門(mén)機(jī)制的方法相比于其他兩種方法能夠取得更好的識(shí)別效果。(2)在字... 

【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:84 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景與意義
    1.2 相關(guān)研究工作
        1.2.1 基于過(guò)分割的手寫(xiě)中文文本識(shí)別方法
        1.2.2 基于無(wú)分割的手寫(xiě)中文文本識(shí)別方法
        1.2.3 特征層融合方法
    1.3 本文研究?jī)?nèi)容
    1.4 本文組織結(jié)構(gòu)
第二章 相關(guān)知識(shí)
    2.1 手寫(xiě)中文文本識(shí)別
    2.2 多模態(tài)信息融合
    2.3 深度學(xué)習(xí)相關(guān)技術(shù)
        2.3.1 詞向量
        2.3.2 卷積神經(jīng)網(wǎng)絡(luò)
        2.3.3 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)
        2.3.4 雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)
        2.3.5 基于注意力機(jī)制的編碼解碼模型
        2.3.6 深度強(qiáng)化學(xué)習(xí)
    2.4 手寫(xiě)中文圖像數(shù)據(jù)集
        2.4.1 手寫(xiě)中文單字圖像數(shù)據(jù)集
        2.4.2 手寫(xiě)中文文本行圖像數(shù)據(jù)集
        2.4.3 ICDAR2013競(jìng)賽數(shù)據(jù)集
    2.5 系統(tǒng)評(píng)估指標(biāo)
    2.6 本章小結(jié)
第三章 基于字符級(jí)別特征層融合的手寫(xiě)中文文本識(shí)別
    3.1 研究動(dòng)機(jī)
    3.2 基于字符級(jí)別特征層融合的手寫(xiě)中文文本識(shí)別模型
        3.2.1 模型結(jié)構(gòu)
        3.2.2 圖像編碼模塊
        3.2.3 字符級(jí)別視覺(jué)信息與語(yǔ)言信息的特征層融合模塊
        3.2.4 基于字符級(jí)別特征層融合的LSTM解碼模塊
    3.3 實(shí)驗(yàn)結(jié)果與分析
        3.3.1 實(shí)驗(yàn)設(shè)置
        3.3.2 三種字符級(jí)別視覺(jué)信息與語(yǔ)言信息的特征層融合方法的對(duì)比結(jié)果
        3.3.3 與其他研究者提出的模型的對(duì)比結(jié)果
        3.3.4 樣例分析
        3.3.5 注意力機(jī)制的可視化結(jié)果
    3.4 本章小結(jié)
第四章 基于多級(jí)別特征層融合的手寫(xiě)中文文本識(shí)別
    4.1 研究動(dòng)機(jī)
    4.2 基于多級(jí)別特征層融合的手寫(xiě)中文文本識(shí)別模型
        4.2.1 模型結(jié)構(gòu)
        4.2.2 文本片段級(jí)別視覺(jué)信息與語(yǔ)言信息的特征層融合模塊
        4.2.3 基于多級(jí)別特征層融合的LSTM解碼模塊
    4.3 實(shí)驗(yàn)結(jié)果與分析
        4.3.1 實(shí)驗(yàn)設(shè)置
        4.3.2 基準(zhǔn)模型
        4.3.3 與其他模型的對(duì)比實(shí)驗(yàn)結(jié)果
        4.3.4 不同文本片段長(zhǎng)度的對(duì)比實(shí)驗(yàn)結(jié)果
    4.4 本章小結(jié)
第五章 基于深度強(qiáng)化學(xué)習(xí)的手寫(xiě)中文文本識(shí)別
    5.1 研究動(dòng)機(jī)
    5.2 基于深度強(qiáng)化學(xué)習(xí)的手寫(xiě)中文文本識(shí)別模型
        5.2.1 模型結(jié)構(gòu)
        5.2.2 強(qiáng)化學(xué)習(xí)過(guò)程
    5.3 實(shí)驗(yàn)設(shè)置
    5.4 實(shí)驗(yàn)結(jié)果與分析
    5.5 本章小結(jié)
第六章 總結(jié)及展望
    6.1 本文總結(jié)
    6.2 未來(lái)工作
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文以及學(xué)術(shù)成果
參加國(guó)際競(jìng)賽獲獎(jiǎng)情況
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在手寫(xiě)漢字識(shí)別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.  自動(dòng)化學(xué)報(bào). 2016(08)
[2]基于CNN和隨機(jī)彈性形變的相似手寫(xiě)漢字識(shí)別[J]. 高學(xué),王有旺.  華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)



本文編號(hào):3163768

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3163768.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0dc7d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com