面向工業(yè)領(lǐng)域的數(shù)值信息抽取與應(yīng)用
發(fā)布時(shí)間:2022-07-13 15:53
隨著大數(shù)據(jù)時(shí)代的到來(lái),網(wǎng)絡(luò)中每天產(chǎn)生著大量的數(shù)據(jù)。無(wú)論是企業(yè)還是個(gè)人,對(duì)網(wǎng)絡(luò)資源的依賴都顯得尤為凸出。在工業(yè)領(lǐng)域,數(shù)值作為一種直觀的表達(dá)方式,能夠反映出工業(yè)相關(guān)信息,一直被企業(yè)和個(gè)人所需要。因?yàn)槟壳叭鄙僖环N有效的工業(yè)領(lǐng)域的數(shù)值信息抽取方法,所以本文對(duì)其抽取方法進(jìn)行研究。首先本文對(duì)數(shù)值信息的表示形式做出改進(jìn),將工業(yè)領(lǐng)域的數(shù)值信息定義為七元組形式(主體、屬性、屬性值、比較詞、比較對(duì)象、時(shí)間、地點(diǎn)),并將數(shù)值信息抽取分為數(shù)值信息元素識(shí)別和數(shù)值信息元素關(guān)系識(shí)別兩個(gè)步驟。在數(shù)值信息元素識(shí)別方面,采取一種階段性數(shù)值信息元素識(shí)別方法。即根據(jù)各個(gè)數(shù)值信息元素的特點(diǎn),在不同階段采用不同方法對(duì)相應(yīng)的數(shù)值信息元素進(jìn)行識(shí)別。并將當(dāng)前階段的識(shí)別結(jié)果輸入給下一階段使用。對(duì)于屬性值來(lái)說(shuō),由于其表達(dá)比較固定,故采用了基于模板的方法;對(duì)于比較詞來(lái)說(shuō),其數(shù)量有限,因此本文采用字典和規(guī)則相結(jié)合的方法進(jìn)行識(shí)別;對(duì)于主體、屬性則采用了序列標(biāo)注算法;比較對(duì)象的識(shí)別則通過(guò)規(guī)則在之前數(shù)值信息元素中進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法融合了規(guī)則、Bi-LSTM-CRF模型的優(yōu)勢(shì),對(duì)數(shù)值信息元素的識(shí)別取得了比較滿意的效果。在數(shù)值信息元素關(guān)系識(shí)...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與意義
1.2 工業(yè)領(lǐng)域的數(shù)值信息
1.2.1 數(shù)值信息
1.2.2 工業(yè)領(lǐng)域數(shù)值信息的特征
1.2.3 工業(yè)數(shù)值信息的存儲(chǔ)形式
1.3 數(shù)值信息抽取的難點(diǎn)
1.4 本文主要工作
1.5 論文結(jié)構(gòu)
第2章 相關(guān)研究
2.1 數(shù)值信息
2.1.1 單一數(shù)值信息的抽取
2.1.2 復(fù)合數(shù)值信息的抽取
2.2 命名實(shí)體識(shí)別
2.2.1 實(shí)體識(shí)別發(fā)展歷史
2.2.2 基于規(guī)則的實(shí)體識(shí)別
2.2.3 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的實(shí)體識(shí)別
2.2.4 基于深度學(xué)習(xí)的實(shí)體識(shí)別
2.2.5 工業(yè)領(lǐng)域的實(shí)體識(shí)別
2.3 關(guān)系識(shí)別
2.3.1 關(guān)系識(shí)別任務(wù)介紹
2.3.2 關(guān)系識(shí)別相關(guān)研究
2.4 本章小結(jié)
第3章 數(shù)值信息元素識(shí)別
3.1 數(shù)值信息元素識(shí)別概述
3.2 基于模板的屬性值識(shí)別
3.3 基于字典和規(guī)則的比較詞識(shí)別
3.4 基于Bi-LSTM-CRF模型的主體、屬性識(shí)別
3.4.1 分布式表示
3.4.2 標(biāo)注體系
3.5 比較對(duì)象識(shí)別
3.6 實(shí)驗(yàn)設(shè)計(jì)及分析
3.6.1 實(shí)驗(yàn)設(shè)置與語(yǔ)料介紹
3.6.2 評(píng)價(jià)標(biāo)準(zhǔn)
3.6.3 實(shí)驗(yàn)結(jié)果及分析
3.7 本章小結(jié)
第4章 基于規(guī)則的數(shù)值信息元素關(guān)系識(shí)別
4.1 數(shù)值信息抽取
4.2 基于規(guī)則的數(shù)值信息元素關(guān)系識(shí)別
4.3 實(shí)驗(yàn)設(shè)計(jì)及分析
4.3.1 實(shí)驗(yàn)語(yǔ)料
4.3.2 評(píng)價(jià)標(biāo)準(zhǔn)
4.3.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第5章 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)整體架構(gòu)和總圖流程
5.2 系統(tǒng)模塊實(shí)現(xiàn)與效果展示
5.2.1 文本信息的獲取和輸入模塊
5.2.2 數(shù)值信息抽取模塊
5.3 數(shù)值信息抽取在數(shù)值信息可視化的應(yīng)用
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表(含錄用)的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]面向化學(xué)資源文本的命名實(shí)體識(shí)別[J]. 馬建紅,王立芹,姚爽. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2018(04)
[2]面向問(wèn)答的數(shù)值信息抽取[J]. 張桂平,張寧,白宇. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2018(04)
[3]海量法律文書中基于CNN的實(shí)體關(guān)系抽取技術(shù)[J]. 高丹,彭敦陸,劉叢. 小型微型計(jì)算機(jī)系統(tǒng). 2018(05)
[4]命名實(shí)體識(shí)別研究綜述[J]. 劉瀏,王東波. 情報(bào)學(xué)報(bào). 2018(03)
[5]使用深度長(zhǎng)短時(shí)記憶模型對(duì)于評(píng)價(jià)詞和評(píng)價(jià)對(duì)象的聯(lián)合抽取[J]. 沈亞田,黃萱菁,曹均闊. 中文信息學(xué)報(bào). 2018(02)
[6]微博客蘊(yùn)含交通事件信息抽取的自動(dòng)標(biāo)注方法[J]. 仇培元,張恒才,余麗,陸鋒. 中文信息學(xué)報(bào). 2017(02)
[7]MBNER:面向生物醫(yī)學(xué)領(lǐng)域的多種實(shí)體識(shí)別系統(tǒng)[J]. 楊婭,楊志豪,林鴻飛,宮本東,王健. 中文信息學(xué)報(bào). 2016(01)
[8]基于先秦語(yǔ)料庫(kù)的古漢語(yǔ)地名自動(dòng)識(shí)別模型構(gòu)建研究[J]. 黃水清,王東波,何琳. 圖書情報(bào)工作. 2015(12)
[9]中文文本中時(shí)間信息解析方法[J]. 張春菊,張雪英,李明,王曙. 地理與地理信息科學(xué). 2014(06)
[10]煤制橡膠產(chǎn)業(yè)發(fā)展新情況[J]. 蘇鹽科技. 2012(03)
碩士論文
[1]面向數(shù)值問(wèn)題的答案抽取與生成[D]. 張寧.沈陽(yáng)航空航天大學(xué) 2018
[2]基于web的工業(yè)產(chǎn)品知識(shí)圖譜構(gòu)建及應(yīng)用[D]. 邵元新.沈陽(yáng)航空航天大學(xué) 2017
[3]基于非結(jié)構(gòu)化文檔數(shù)據(jù)的抽取與分析系統(tǒng)的信息抽取[D]. 霍焰.天津大學(xué) 2012
[4]數(shù)值信息的抽取方法研究[D]. 毋菲.山西大學(xué) 2010
[5]基于CRF的中文命名實(shí)體識(shí)別研究[D]. 史海峰.蘇州大學(xué) 2010
本文編號(hào):3660326
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與意義
1.2 工業(yè)領(lǐng)域的數(shù)值信息
1.2.1 數(shù)值信息
1.2.2 工業(yè)領(lǐng)域數(shù)值信息的特征
1.2.3 工業(yè)數(shù)值信息的存儲(chǔ)形式
1.3 數(shù)值信息抽取的難點(diǎn)
1.4 本文主要工作
1.5 論文結(jié)構(gòu)
第2章 相關(guān)研究
2.1 數(shù)值信息
2.1.1 單一數(shù)值信息的抽取
2.1.2 復(fù)合數(shù)值信息的抽取
2.2 命名實(shí)體識(shí)別
2.2.1 實(shí)體識(shí)別發(fā)展歷史
2.2.2 基于規(guī)則的實(shí)體識(shí)別
2.2.3 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的實(shí)體識(shí)別
2.2.4 基于深度學(xué)習(xí)的實(shí)體識(shí)別
2.2.5 工業(yè)領(lǐng)域的實(shí)體識(shí)別
2.3 關(guān)系識(shí)別
2.3.1 關(guān)系識(shí)別任務(wù)介紹
2.3.2 關(guān)系識(shí)別相關(guān)研究
2.4 本章小結(jié)
第3章 數(shù)值信息元素識(shí)別
3.1 數(shù)值信息元素識(shí)別概述
3.2 基于模板的屬性值識(shí)別
3.3 基于字典和規(guī)則的比較詞識(shí)別
3.4 基于Bi-LSTM-CRF模型的主體、屬性識(shí)別
3.4.1 分布式表示
3.4.2 標(biāo)注體系
3.5 比較對(duì)象識(shí)別
3.6 實(shí)驗(yàn)設(shè)計(jì)及分析
3.6.1 實(shí)驗(yàn)設(shè)置與語(yǔ)料介紹
3.6.2 評(píng)價(jià)標(biāo)準(zhǔn)
3.6.3 實(shí)驗(yàn)結(jié)果及分析
3.7 本章小結(jié)
第4章 基于規(guī)則的數(shù)值信息元素關(guān)系識(shí)別
4.1 數(shù)值信息抽取
4.2 基于規(guī)則的數(shù)值信息元素關(guān)系識(shí)別
4.3 實(shí)驗(yàn)設(shè)計(jì)及分析
4.3.1 實(shí)驗(yàn)語(yǔ)料
4.3.2 評(píng)價(jià)標(biāo)準(zhǔn)
4.3.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第5章 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)整體架構(gòu)和總圖流程
5.2 系統(tǒng)模塊實(shí)現(xiàn)與效果展示
5.2.1 文本信息的獲取和輸入模塊
5.2.2 數(shù)值信息抽取模塊
5.3 數(shù)值信息抽取在數(shù)值信息可視化的應(yīng)用
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表(含錄用)的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]面向化學(xué)資源文本的命名實(shí)體識(shí)別[J]. 馬建紅,王立芹,姚爽. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2018(04)
[2]面向問(wèn)答的數(shù)值信息抽取[J]. 張桂平,張寧,白宇. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2018(04)
[3]海量法律文書中基于CNN的實(shí)體關(guān)系抽取技術(shù)[J]. 高丹,彭敦陸,劉叢. 小型微型計(jì)算機(jī)系統(tǒng). 2018(05)
[4]命名實(shí)體識(shí)別研究綜述[J]. 劉瀏,王東波. 情報(bào)學(xué)報(bào). 2018(03)
[5]使用深度長(zhǎng)短時(shí)記憶模型對(duì)于評(píng)價(jià)詞和評(píng)價(jià)對(duì)象的聯(lián)合抽取[J]. 沈亞田,黃萱菁,曹均闊. 中文信息學(xué)報(bào). 2018(02)
[6]微博客蘊(yùn)含交通事件信息抽取的自動(dòng)標(biāo)注方法[J]. 仇培元,張恒才,余麗,陸鋒. 中文信息學(xué)報(bào). 2017(02)
[7]MBNER:面向生物醫(yī)學(xué)領(lǐng)域的多種實(shí)體識(shí)別系統(tǒng)[J]. 楊婭,楊志豪,林鴻飛,宮本東,王健. 中文信息學(xué)報(bào). 2016(01)
[8]基于先秦語(yǔ)料庫(kù)的古漢語(yǔ)地名自動(dòng)識(shí)別模型構(gòu)建研究[J]. 黃水清,王東波,何琳. 圖書情報(bào)工作. 2015(12)
[9]中文文本中時(shí)間信息解析方法[J]. 張春菊,張雪英,李明,王曙. 地理與地理信息科學(xué). 2014(06)
[10]煤制橡膠產(chǎn)業(yè)發(fā)展新情況[J]. 蘇鹽科技. 2012(03)
碩士論文
[1]面向數(shù)值問(wèn)題的答案抽取與生成[D]. 張寧.沈陽(yáng)航空航天大學(xué) 2018
[2]基于web的工業(yè)產(chǎn)品知識(shí)圖譜構(gòu)建及應(yīng)用[D]. 邵元新.沈陽(yáng)航空航天大學(xué) 2017
[3]基于非結(jié)構(gòu)化文檔數(shù)據(jù)的抽取與分析系統(tǒng)的信息抽取[D]. 霍焰.天津大學(xué) 2012
[4]數(shù)值信息的抽取方法研究[D]. 毋菲.山西大學(xué) 2010
[5]基于CRF的中文命名實(shí)體識(shí)別研究[D]. 史海峰.蘇州大學(xué) 2010
本文編號(hào):3660326
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3660326.html
最近更新
教材專著