基于編碼器—解碼器和注意力機(jī)制神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)公式識(shí)別方法
發(fā)布時(shí)間:2021-03-11 14:31
數(shù)學(xué)公式識(shí)別是紙質(zhì)文獻(xiàn)進(jìn)行電子化轉(zhuǎn)錄領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù),同時(shí)隨著近年來(lái)觸摸設(shè)備的普及,在線手寫體數(shù)學(xué)公式識(shí)別技術(shù)也變得越發(fā)重要,該技術(shù)的發(fā)展可以促進(jìn)一種新型的人機(jī)交互方式,尤其在數(shù)字化教學(xué)、數(shù)學(xué)文檔撰寫等領(lǐng)域?qū)?lái)極大的便利。數(shù)學(xué)公式識(shí)別問題屬于光學(xué)字符識(shí)別的一種,但又有其自身的特殊性。數(shù)學(xué)公式識(shí)別問題的特殊性體現(xiàn)在:公式中存在大量書寫歧義、字符歧義、分割歧義以及結(jié)構(gòu)歧義等難點(diǎn)。這些難點(diǎn)使得該問題存在諸多的挑戰(zhàn),因此并不能使用傳統(tǒng)光學(xué)字符識(shí)別技術(shù)來(lái)解決該問題。根據(jù)數(shù)學(xué)公式的表示格式來(lái)劃分的話,可以分為印刷體和書寫體兩種。手寫體公式會(huì)引入更多歧義,因此相對(duì)印刷體公式來(lái)說(shuō)識(shí)別也更加困難,本文將主要研究手寫體數(shù)學(xué)公式識(shí)別問題。根據(jù)是否是實(shí)時(shí)數(shù)據(jù)來(lái)劃分的話,手寫體數(shù)學(xué)公式又可以分為在線的和離線的。所謂在線指的是公式被表示為動(dòng)態(tài)軌跡坐標(biāo)信息;所謂離線指的是公式被表示為靜態(tài)圖片像素信息;當(dāng)然根據(jù)動(dòng)態(tài)軌跡信息可以得到靜態(tài)圖片信息,反之則不然。由于近來(lái)便攜式電子觸摸設(shè)備的流行,使得在線數(shù)學(xué)公式識(shí)別問題受到研究者越來(lái)越多的重視,因此本文的研究重點(diǎn)是在線手寫體數(shù)學(xué)公式識(shí)別問題,并且本文將采用在線手寫體數(shù)學(xué)...
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1數(shù)學(xué)公式語(yǔ)法樹??
圖1.2句號(hào)上下文敏感??
編碼器一解碼器映射為統(tǒng)一語(yǔ)義空間
本文編號(hào):3076615
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1數(shù)學(xué)公式語(yǔ)法樹??
圖1.2句號(hào)上下文敏感??
編碼器一解碼器映射為統(tǒng)一語(yǔ)義空間
本文編號(hào):3076615
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3076615.html
最近更新
教材專著