基于數(shù)據(jù)顏色特殊性的加分表格識別系統(tǒng)研究
本文選題:表格識別 + 單元格; 參考:《昆明理工大學(xué)》2017年碩士論文
【摘要】:目前,許多的手寫表格信息更需要錄入、存儲在計算機(jī)中。在教育系統(tǒng)中,處理試卷加分表格過程中,存在著以下問題:(1)不恰當(dāng)?shù)氖褂萌肆Y源,造成人力資源的浪費(fèi)。教育系統(tǒng)內(nèi)的工作人員很大部分是高學(xué)歷、高素質(zhì)的尖端科研人員,卻在做著這種單調(diào)而重復(fù)的工作,無疑對社會及國家造成了大量的人力資源的浪費(fèi)。(2)大量的小題加分計算會造成人員的疲勞、計算的失誤、效率低下。長時間的批改試卷已經(jīng)產(chǎn)生了精神上和生理上的疲勞,這種情況下再進(jìn)行加分計算容易產(chǎn)生失誤且效率較低。本文考慮應(yīng)用表格圖像識別技術(shù)來解決教育工作者在試卷表格的加分過程中存在的問題。為了解決以上存在的問題,本文考慮從兩個方面進(jìn)行表格圖像的識別。一方面是表格線單元格的檢測,一方面是表格內(nèi)數(shù)據(jù)識別。首先,查閱大量的相關(guān)文獻(xiàn),了解了表格識別相關(guān)技術(shù),分析了表格識別相關(guān)技術(shù)的國內(nèi)外的研究現(xiàn)狀,并進(jìn)行了評述。其次,本文以試卷加分表格為識別對象,針對該表格進(jìn)行了特征分析,確定了根據(jù)數(shù)據(jù)顏色的特殊性,進(jìn)行表格識別的基本思路。第三,本文應(yīng)用預(yù)處理對圖像進(jìn)行預(yù)處理,應(yīng)用直線檢測的方法進(jìn)行表格線的檢測,獲得表格單元格位置情況。第四,根據(jù)顏色特殊性直接對圖像中表格內(nèi)數(shù)據(jù)進(jìn)行提取,實現(xiàn)數(shù)據(jù)圖片的切分并獲得的單個數(shù)字圖片。由于數(shù)據(jù)提取的特殊性,數(shù)據(jù)間的邊界模糊、區(qū)分不明確。本文提出了數(shù)字區(qū)域擴(kuò)散邊界界定法,實現(xiàn)每個單元格數(shù)據(jù)的切分。利用滴水算法將兩位數(shù)數(shù)據(jù)字符切分,實現(xiàn)單個數(shù)字圖片的獲得。應(yīng)用OCR技術(shù)對單數(shù)字進(jìn)行識別并計算單元格數(shù)據(jù)。最后,根據(jù)單元格位置情況,提出識別數(shù)據(jù)與單元格排序關(guān)聯(lián)算法對識別的表格數(shù)據(jù)按順存儲。本文利用Microsoft Visual Studio開發(fā)平臺,利用EmguCV圖片處理庫,實現(xiàn)試卷加分表格識別系統(tǒng)原型的開發(fā),并計算出總成績。驗證出本文提出的針對具有特殊顏色表格識別的相關(guān)方法具有一定的可行性;本系統(tǒng)的開發(fā)具有一定的使用價值。
[Abstract]:At present, many handwritten form information needs to be input, stored in the computer. In the educational system, in the process of processing the test papers and adding the score forms, there are the following problems: 1) improper use of human resources, which results in the waste of human resources. Most of the staff in the education system are highly educated and highly qualified cutting-edge researchers, but they are doing this monotonous and repetitive work. There is no doubt that a large amount of human resources is wasted to the society and the country. (2) A large number of small problems and points will cause fatigue, error in calculation and inefficiency. A long period of marking has resulted in mental and physical fatigue. In this case, the calculation of bonus points is prone to errors and low efficiency. In this paper, we consider the application of table image recognition technology to solve the problems that educators have in the process of adding scores to test papers. In order to solve the above problems, this paper considers two aspects of table image recognition. On the one hand, it is the detection of table line cells, and on the other hand, it is the data recognition in the table. Firstly, we refer to a large number of relevant literature, understand the related technology of table recognition, and analyze the current research situation of the related technology at home and abroad, and make a review. Secondly, this paper takes the test paper plus score table as the recognition object, carries on the characteristic analysis to the table, and determines the basic idea of the table recognition according to the particularity of the data color. Thirdly, the preprocessing method is used to preprocess the image, and the method of line detection is used to detect the table line, and the position of the table cell is obtained. Fourthly, the data in the table is extracted directly according to the color particularity, the segmentation of the data picture is realized and a single digital picture is obtained. Because of the particularity of data extraction, the boundary between data is fuzzy and the distinction is not clear. In this paper, a digital region diffusion boundary demarcation method is proposed to segment each cell data. Two-digit data characters are segmented by drip algorithm to obtain a single digital picture. OCR technology is used to identify single digits and calculate cell data. Finally, according to the location of the cells, the algorithm of associating the recognition data with the sorting of the cells is proposed to store the identified table data in sequence. This paper uses Microsoft Visual Studio development platform and EmguCV image processing library to realize the prototype of test paper plus score table recognition system, and calculate the total results. It is verified that the method proposed in this paper is feasible for the recognition of special color tables and the development of the system has some practical value.
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 夏禾;馮軍煥;;手持終端自動閱卷的表格數(shù)據(jù)定位算法的研究[J];微型機(jī)與應(yīng)用;2014年06期
2 李興國;高煒;;基于滴水算法的驗證碼中粘連字符分割方法[J];計算機(jī)工程與應(yīng)用;2014年01期
3 王緒;平西建;周林;王會鵬;;基于投影特征與結(jié)構(gòu)特征的表格圖像識別[J];計算機(jī)工程;2011年01期
4 宋婉娟;;基于支持向量機(jī)的手寫數(shù)字串識別[J];湖北第二師范學(xué)院學(xué)報;2010年02期
5 丁杰;楊靜宇;;一種基于模糊規(guī)則的手寫體粘連數(shù)字串分割[J];中國圖象圖形學(xué)報;2009年11期
6 卜富清;王茂芝;于慶剛;;基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識別[J];長江大學(xué)學(xué)報(自然科學(xué)版)理工卷;2009年02期
7 何國輝;解正梅;;快速實用的通用表格分析方法[J];計算機(jī)工程與設(shè)計;2008年19期
8 馬瑞;楊靜宇;;一種用于手寫數(shù)字分割的滴水算法的改進(jìn)[J];小型微型計算機(jī)系統(tǒng);2007年11期
9 羅佳;王玲;;基于凹凸特性的非限制粘連手寫數(shù)字串切分[J];微計算機(jī)信息;2007年25期
10 王曉春;田豐;戴國忠;;基于筆交互的表格制作[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2007年05期
相關(guān)博士學(xué)位論文 前1條
1 王秀娟;文本檢索中若干問題研究[D];北京郵電大學(xué);2006年
相關(guān)碩士學(xué)位論文 前7條
1 仲小挺;基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別方法的研究[D];哈爾濱工業(yè)大學(xué);2014年
2 石會芳;支持向量機(jī)及其在手寫數(shù)字識別中的應(yīng)用[D];重慶大學(xué);2013年
3 吳棟梁;基于支持向量機(jī)的手寫數(shù)字識別的研究[D];華中師范大學(xué);2011年
4 張慧;基于模型驅(qū)動的表格識別的研究[D];山東大學(xué);2011年
5 邱立;支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)在手寫數(shù)字識別算法中的應(yīng)用研究[D];華南理工大學(xué);2010年
6 李連勝;基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別技術(shù)研究[D];中南大學(xué);2008年
7 朱曉波;基于BP神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別分析與研究[D];武漢科技大學(xué);2003年
,本文編號:1803797
本文鏈接:http://www.sikaile.net/guanlilunwen/renliziyuanguanlilunwen/1803797.html