工程圖紙的關(guān)鍵信息智能提取技術(shù)
發(fā)布時(shí)間:2021-11-24 11:51
隨著制圖軟件的廣泛應(yīng)用,面對(duì)逐漸積累的大量工程圖紙,如何快速對(duì)現(xiàn)有圖紙進(jìn)行信息提取和檢索查詢,已成為迫切需要解決的問(wèn)題。目前主要是通過(guò)人工比對(duì)的方式對(duì)數(shù)據(jù)庫(kù)中的圖紙進(jìn)行查找,流程繁瑣同時(shí)效率較低。因此快速提取工程圖紙中的關(guān)鍵信息并建立圖紙信息數(shù)據(jù)庫(kù)和相似圖紙查找系統(tǒng),將大大提高工程圖紙的管理效率。以此為背景,本文研究了利用人工智能技術(shù),快速自動(dòng)提取工程圖紙中關(guān)鍵信息的技術(shù),主要對(duì)工程圖紙中的標(biāo)題欄信息以及標(biāo)注尺寸信息進(jìn)行了提取,建立圖紙信息數(shù)據(jù)庫(kù),設(shè)計(jì)了一套信息提取與查詢系統(tǒng)。本文主要的研究工作如下:首先,本文對(duì)工程圖紙的標(biāo)題欄信息提取方法進(jìn)行了研究。主要涉及到文字區(qū)域定位與文字識(shí)別兩方面。鑒于表格標(biāo)題欄格式較為固定,利用切分表格單元格的形式對(duì)關(guān)鍵信息進(jìn)行了定位分析。基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了文字識(shí)別模型,實(shí)驗(yàn)表明,文字識(shí)別率相比傳統(tǒng)文字識(shí)別率得到了有效的提升,實(shí)現(xiàn)了對(duì)標(biāo)題欄信息的自動(dòng)化提取。其次,考慮到傳統(tǒng)基于特征的標(biāo)注尺寸檢測(cè)方法效率較低,同時(shí)標(biāo)注信息的提取是字符與圖元相結(jié)合的結(jié)果,所以本文創(chuàng)新性的使用深度學(xué)習(xí)的方法對(duì)標(biāo)注尺寸與字符同時(shí)進(jìn)行檢測(cè),通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),該方法可以準(zhǔn)確的對(duì)標(biāo)注尺寸...
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-4灰度直方圖??Fig.2-4?Gray?histogram??
根據(jù)像素點(diǎn)局部鄰域窗計(jì)算像素點(diǎn)閾值,在局部窗內(nèi)計(jì)算閾值,有平均值法,高斯??加權(quán)法等,局部二值化方法速度一般較慢。對(duì)于圖紙標(biāo)題欄,其灰度直方圖的分布??基本如圖2-4所示,背景與目標(biāo)相差較為明顯,所以在對(duì)表格標(biāo)題欄進(jìn)行二值化時(shí)??可以使用OTSU算法,或者使用固定閾值進(jìn)行二值化。??HEI??a)原始圖??a)?Original?image??b)二值化圖??b)?Binarization?graph??圖2-3圖像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
對(duì)每個(gè)窗口采用單字識(shí)別模型對(duì)其進(jìn)行識(shí)別?梢允褂秘澬乃惴ɑ蛘呤欠菢O大??值抑制算法來(lái)規(guī)劃最終的識(shí)別路徑。這種識(shí)別方法存在兩個(gè)問(wèn)題,滑動(dòng)步長(zhǎng)過(guò)大容??易造成信息丟失,滑動(dòng)步長(zhǎng)過(guò)小計(jì)算量太大,所以很難選定一個(gè)合適的步長(zhǎng),同時(shí)??對(duì)單字識(shí)別模型的依賴程度較高。??語(yǔ)音識(shí)別,手寫識(shí)別,文本識(shí)別其實(shí)都有一個(gè)共同的特點(diǎn),就是需要對(duì)時(shí)序進(jìn)??行建模,這就衍生出了序列學(xué)習(xí)[3G,31]。盡管文字行圖像是二維的,但也都是以序列??的形式出現(xiàn),識(shí)別過(guò)程中通常需要預(yù)測(cè)一系列的標(biāo)簽。文字識(shí)別也有其上下文的聯(lián)??系,將從左到右的識(shí)別類比為時(shí)序,則文字識(shí)別也可歸類為序列識(shí)別。通過(guò)端到端??的學(xué)習(xí),無(wú)需進(jìn)行矯正,分割等處理,輸入文本行直接出來(lái)預(yù)測(cè)結(jié)果,以此提升序??列學(xué)習(xí)的效果,這己經(jīng)成為當(dāng)前研究的熱點(diǎn);舅悸肥蔷矸e神經(jīng)網(wǎng)絡(luò)??(Convolutional?Neural?Networks,CNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Network,??RNN)結(jié)合:CNN被廣泛的應(yīng)用于特征提取,得到的特征可以充分的表征目標(biāo),而??RNN即有前饋連接又有反饋連接,決定了其適合處理序列問(wèn)題。這種混合的文本??字符串識(shí)別網(wǎng)絡(luò)突破了以往的文字識(shí)別方法,取得了不錯(cuò)的文字識(shí)別效果。??lnPU,image?ConvolutionalsandRelu
【參考文獻(xiàn)】:
期刊論文
[1]基于雅克比稀疏自動(dòng)編碼機(jī)的手寫數(shù)字識(shí)別算法[J]. 王慧玲,宋威. 計(jì)算機(jī)應(yīng)用研究. 2018(12)
[2]一種基于Android平臺(tái)的圖像文字識(shí)別系統(tǒng)[J]. 趙思寧. 中國(guó)科技信息. 2018(02)
[3]基于圖像分塊的局部閾值二值化方法[J]. 張潔玉. 計(jì)算機(jī)應(yīng)用. 2017(03)
[4]基于特征加權(quán)模糊模板匹配的字符識(shí)別[J]. 朱顥東,李紅嬋. 蘭州理工大學(xué)學(xué)報(bào). 2013(01)
[5]工程圖紙字符串及標(biāo)注信息提取[J]. 范帆,關(guān)佶紅. 計(jì)算機(jī)工程與應(yīng)用. 2012(07)
[6]工程圖紙標(biāo)題欄的自動(dòng)生成及其信息提取的方法實(shí)現(xiàn)[J]. 苗帥,王衛(wèi)東. 計(jì)算機(jī)應(yīng)用與軟件. 2011(09)
[7]面向工程圖紙離線式表格信息提取與識(shí)別方法研究[J]. 董玉德,劉孫,朱長(zhǎng)江,杜立,王仁敏,馬云峰. 工程圖學(xué)學(xué)報(bào). 2009(01)
[8]工程圖紙標(biāo)題欄信息自動(dòng)提取方法的研究[J]. 李賢兵,張應(yīng)中,羅曉芳. 計(jì)算機(jī)工程與設(shè)計(jì). 2004(11)
[9]機(jī)械圖紙掃描圖像尺寸信息提取[J]. 張習(xí)文,歐宗瑛. 機(jī)械科學(xué)與技術(shù). 2001(02)
碩士論文
[1]基于OCR技術(shù)的通用證件識(shí)別系統(tǒng)[D]. 常參參.南昌大學(xué) 2018
[2]深度卷積神經(jīng)網(wǎng)絡(luò)在OCR問(wèn)題中的應(yīng)用研究[D]. 汪一文.電子科技大學(xué) 2018
[3]A汽車制造公司供應(yīng)商管理研究[D]. 趙滿生.武漢工程大學(xué) 2016
[4]CAD圖紙文本信息提取與處理技術(shù)研究[D]. 顏立坤.河南工業(yè)大學(xué) 2013
[5]工程圖三維重建中的信息提取與預(yù)處理技術(shù)研究[D]. 石嵐峰.湖南大學(xué) 2006
本文編號(hào):3515917
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-4灰度直方圖??Fig.2-4?Gray?histogram??
根據(jù)像素點(diǎn)局部鄰域窗計(jì)算像素點(diǎn)閾值,在局部窗內(nèi)計(jì)算閾值,有平均值法,高斯??加權(quán)法等,局部二值化方法速度一般較慢。對(duì)于圖紙標(biāo)題欄,其灰度直方圖的分布??基本如圖2-4所示,背景與目標(biāo)相差較為明顯,所以在對(duì)表格標(biāo)題欄進(jìn)行二值化時(shí)??可以使用OTSU算法,或者使用固定閾值進(jìn)行二值化。??HEI??a)原始圖??a)?Original?image??b)二值化圖??b)?Binarization?graph??圖2-3圖像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
對(duì)每個(gè)窗口采用單字識(shí)別模型對(duì)其進(jìn)行識(shí)別?梢允褂秘澬乃惴ɑ蛘呤欠菢O大??值抑制算法來(lái)規(guī)劃最終的識(shí)別路徑。這種識(shí)別方法存在兩個(gè)問(wèn)題,滑動(dòng)步長(zhǎng)過(guò)大容??易造成信息丟失,滑動(dòng)步長(zhǎng)過(guò)小計(jì)算量太大,所以很難選定一個(gè)合適的步長(zhǎng),同時(shí)??對(duì)單字識(shí)別模型的依賴程度較高。??語(yǔ)音識(shí)別,手寫識(shí)別,文本識(shí)別其實(shí)都有一個(gè)共同的特點(diǎn),就是需要對(duì)時(shí)序進(jìn)??行建模,這就衍生出了序列學(xué)習(xí)[3G,31]。盡管文字行圖像是二維的,但也都是以序列??的形式出現(xiàn),識(shí)別過(guò)程中通常需要預(yù)測(cè)一系列的標(biāo)簽。文字識(shí)別也有其上下文的聯(lián)??系,將從左到右的識(shí)別類比為時(shí)序,則文字識(shí)別也可歸類為序列識(shí)別。通過(guò)端到端??的學(xué)習(xí),無(wú)需進(jìn)行矯正,分割等處理,輸入文本行直接出來(lái)預(yù)測(cè)結(jié)果,以此提升序??列學(xué)習(xí)的效果,這己經(jīng)成為當(dāng)前研究的熱點(diǎn);舅悸肥蔷矸e神經(jīng)網(wǎng)絡(luò)??(Convolutional?Neural?Networks,CNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Network,??RNN)結(jié)合:CNN被廣泛的應(yīng)用于特征提取,得到的特征可以充分的表征目標(biāo),而??RNN即有前饋連接又有反饋連接,決定了其適合處理序列問(wèn)題。這種混合的文本??字符串識(shí)別網(wǎng)絡(luò)突破了以往的文字識(shí)別方法,取得了不錯(cuò)的文字識(shí)別效果。??lnPU,image?ConvolutionalsandRelu
【參考文獻(xiàn)】:
期刊論文
[1]基于雅克比稀疏自動(dòng)編碼機(jī)的手寫數(shù)字識(shí)別算法[J]. 王慧玲,宋威. 計(jì)算機(jī)應(yīng)用研究. 2018(12)
[2]一種基于Android平臺(tái)的圖像文字識(shí)別系統(tǒng)[J]. 趙思寧. 中國(guó)科技信息. 2018(02)
[3]基于圖像分塊的局部閾值二值化方法[J]. 張潔玉. 計(jì)算機(jī)應(yīng)用. 2017(03)
[4]基于特征加權(quán)模糊模板匹配的字符識(shí)別[J]. 朱顥東,李紅嬋. 蘭州理工大學(xué)學(xué)報(bào). 2013(01)
[5]工程圖紙字符串及標(biāo)注信息提取[J]. 范帆,關(guān)佶紅. 計(jì)算機(jī)工程與應(yīng)用. 2012(07)
[6]工程圖紙標(biāo)題欄的自動(dòng)生成及其信息提取的方法實(shí)現(xiàn)[J]. 苗帥,王衛(wèi)東. 計(jì)算機(jī)應(yīng)用與軟件. 2011(09)
[7]面向工程圖紙離線式表格信息提取與識(shí)別方法研究[J]. 董玉德,劉孫,朱長(zhǎng)江,杜立,王仁敏,馬云峰. 工程圖學(xué)學(xué)報(bào). 2009(01)
[8]工程圖紙標(biāo)題欄信息自動(dòng)提取方法的研究[J]. 李賢兵,張應(yīng)中,羅曉芳. 計(jì)算機(jī)工程與設(shè)計(jì). 2004(11)
[9]機(jī)械圖紙掃描圖像尺寸信息提取[J]. 張習(xí)文,歐宗瑛. 機(jī)械科學(xué)與技術(shù). 2001(02)
碩士論文
[1]基于OCR技術(shù)的通用證件識(shí)別系統(tǒng)[D]. 常參參.南昌大學(xué) 2018
[2]深度卷積神經(jīng)網(wǎng)絡(luò)在OCR問(wèn)題中的應(yīng)用研究[D]. 汪一文.電子科技大學(xué) 2018
[3]A汽車制造公司供應(yīng)商管理研究[D]. 趙滿生.武漢工程大學(xué) 2016
[4]CAD圖紙文本信息提取與處理技術(shù)研究[D]. 顏立坤.河南工業(yè)大學(xué) 2013
[5]工程圖三維重建中的信息提取與預(yù)處理技術(shù)研究[D]. 石嵐峰.湖南大學(xué) 2006
本文編號(hào):3515917
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3515917.html
最近更新
教材專著