天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言藝術(shù)論文 >

基于依存句法分析的企業(yè)稅法實體關(guān)系抽取方法研究

發(fā)布時間:2020-03-26 04:26
【摘要】:隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)對話系統(tǒng)的構(gòu)建成了研究領(lǐng)域里的一大熱點,人機(jī)對話的實現(xiàn)離不開計算機(jī)對于文本信息(以下簡稱“文本”)的處理和理解,從現(xiàn)有的研究來看,計算機(jī)對于文本的理解還不夠智能化。計算機(jī)要實現(xiàn)對文本的智能化處理,需要同時對句法和語義進(jìn)行分析,遇到歧義時,還要結(jié)合上下文的語境進(jìn)行處理,本文的研究亦是基于上述原則展開的。本文研究重點在于命名實體識別和實體關(guān)系抽取,為了取得較好的結(jié)果,需要將語法規(guī)則和語義分析結(jié)合在一起。命名實體的識別,通過知識圖譜進(jìn)行總結(jié)和梳理,以一種可視化的形式展現(xiàn)出來,同時在最大程度上確保了命名實體的全面性,方便及時查漏補(bǔ)缺。實體關(guān)系抽取,要從語法和語義兩個方面入手,為了獲取較好的語法規(guī)則,本文選用了依存句法對其進(jìn)行分析。該種方法可以用來處理長難句和歧義句,且可以更好地展現(xiàn)出句子的核心和層次性。同時,實體關(guān)系的抽取離不開實體關(guān)系詞的語義映射,這就需要對實體關(guān)系進(jìn)行語義上的分類,而不單單只停留在語法層面。有了語法層面的規(guī)則分析以及語義層面的實體關(guān)系分類,就可以更好地理解一句話的真實意圖,從而達(dá)到對于文本信息的處理和識別。本文研究的領(lǐng)域為企業(yè)稅法,因此研究的目標(biāo)則為公司稅法領(lǐng)域內(nèi)所涉及到的相關(guān)命名實體以及實體關(guān)系,本文參考了六本該領(lǐng)域的專業(yè)書籍,同時通過百度詞條、百度問答、知乎等平臺來搜尋企業(yè)所涉及的相關(guān)稅法,對其中所涉及到的命名實體進(jìn)行總結(jié)、劃分和歸類。在構(gòu)建實體關(guān)系體系時,針對每一種實體關(guān)系,也建立了一個與之相對應(yīng)的詞表。使用“Mind Manager(思維導(dǎo)圖)-幕布”作為工具,生成該領(lǐng)域中所涉及到的命名實體及實體間關(guān)系,然后以圖形的方式將它們表現(xiàn)出來。同時,抽取其中所涉及到的命名實體關(guān)系,抽取主要是對句法規(guī)則進(jìn)行總結(jié),對新增的句子進(jìn)行解析,得出相應(yīng)的分詞,在經(jīng)過分詞、詞性標(biāo)注以及句法分析等步驟后,每個句子都會有一個相對應(yīng)的句法樹,每個句法樹都可以用相對應(yīng)的標(biāo)簽來表示。本文選擇企業(yè)稅法領(lǐng)域作為研究對象,與其重要性是密不可分的。稅收來源于民眾,而服務(wù)于民眾。無論是從國家或是政府的財政收入還是社會的經(jīng)濟(jì)發(fā)展?fàn)顩r來看,稅收都起到了舉足輕重的作用。而稅收的依據(jù)就是稅法,基于此,筆者認(rèn)為研究企業(yè)稅法的社會價值十分重要。同時,現(xiàn)階段,整個社會進(jìn)入了一個全民創(chuàng)業(yè)期。對于創(chuàng)業(yè)者來說,他們急需學(xué)習(xí)相關(guān)的企業(yè)稅法知識,而本文所做的有關(guān)于“企業(yè)稅法”方面的研究將為他們提供一個了解該領(lǐng)域知識的平臺。此外,本文在企業(yè)稅法實體關(guān)系抽取研究的基礎(chǔ)上,結(jié)合當(dāng)前的研究熱點,將研究內(nèi)容與自動問答系統(tǒng)結(jié)合在一起,使得研究結(jié)果能夠運用到實踐中,也讓該研究具有了更多的實際價值。綜上所述,本文利用依存句法分析技術(shù)和語義分類,將其應(yīng)用于企業(yè)稅法領(lǐng)域中,試圖實現(xiàn)自動抽取命名實體和實體關(guān)系的目的,并以此為基礎(chǔ),提出了一套構(gòu)建該領(lǐng)域的自動問答系統(tǒng)的構(gòu)想,希望借助該研究,將其運用到實際的自動問答系統(tǒng)之中。
【圖文】:

樹庫,多視圖,中文,北京大學(xué)


圖 1.1 中文樹庫信息匯總本文是以北京大學(xué)的多視圖依存樹庫(Peking University Multi-view Chineebank, PMT)為依托,對語料進(jìn)行處理時所使用的是依存句法結(jié)構(gòu),該種語構(gòu)中,,只有一個中心核心,其他成分皆依附在該核心之上,即便有些成分不

句法樹,示例,對語,詳細(xì)地


依存句法樹示例
【學(xué)位授予單位】:魯東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:H14

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李真;張優(yōu)敏;夏冬梅;靳沖;;基于句法分析的實體關(guān)系抽取[J];科技風(fēng);2018年15期

2 劉紹毓;李弼程;郭志剛;王波;陳剛;;實體關(guān)系抽取研究綜述[J];信息工程大學(xué)學(xué)報;2016年05期

3 郭喜躍;何婷婷;胡小華;陳前軍;;基于句法語義特征的中文實體關(guān)系抽取[J];中文信息學(xué)報;2014年06期

4 周舜哲;;基于句法語義特征的中文實體關(guān)系抽取[J];北方文學(xué);2016年20期

5 朱姍;;基于規(guī)則和本體的實體關(guān)系抽取系統(tǒng)研究[J];情報雜志;2010年S2期

6 李煜甫;黃蔚;胡國超;;弱監(jiān)督軍事實體關(guān)系識別[J];電子設(shè)計工程;2018年01期

7 朱艷輝;李飛;胡駿飛;錢繼勝;王天吉;;基于三支決策的兩階段實體關(guān)系抽取研究[J];計算機(jī)工程與應(yīng)用;2018年09期

8 武文雅;陳鈺楓;徐金安;張玉潔;;中文實體關(guān)系抽取研究綜述[J];計算機(jī)與現(xiàn)代化;2018年08期

9 周利娟;林鴻飛;羅文華;;基于實體關(guān)系的犯罪網(wǎng)絡(luò)識別機(jī)制[J];計算機(jī)應(yīng)用研究;2011年03期

10 董麗麗;高山;張翔;;集成學(xué)習(xí)算法在實體關(guān)系抽取中的應(yīng)用[J];西安建筑科技大學(xué)學(xué)報(自然科學(xué)版);2011年03期

相關(guān)會議論文 前9條

1 車萬翔;劉挺;李生;;實體關(guān)系自動抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年

2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實體關(guān)系抽取方法研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年

3 徐芬;王挺;陳火旺;;基于SVM方法的中文實體關(guān)系抽取[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

4 張葦如;孫樂;韓先培;;基于維基百科和模式聚類的實體關(guān)系抽取方法[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

5 王浩暢;趙鐵軍;于浩;;基于文本的生物信息獲取[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

6 甘甜;莫倩;張華平;;基于搜索引擎的人物社會關(guān)系抽取研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

7 姚天f ;;一種用于漢語信息抽取的詞匯本體[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

8 王智堅;李水平;包洋;李金娟;張莨;;煙葉交售排隊系統(tǒng)的設(shè)計與分析[A];中國煙草學(xué)會2016年度優(yōu)秀論文匯編—— 信息化管理主題[C];2016年

9 石志強(qiáng);李濤;孫延濤;;基于以太網(wǎng)的寬帶社區(qū)網(wǎng)絡(luò)管理系統(tǒng)[A];2003年通信軟件技術(shù)學(xué)術(shù)年會論文集[C];2003年

相關(guān)重要報紙文章 前1條

1 著名律師 高樹;程序合法決定結(jié)果合法[N];深圳特區(qū)報;2012年

相關(guān)博士學(xué)位論文 前10條

1 鄭巍;基于文本挖掘的生物醫(yī)學(xué)實體關(guān)系抽取研究[D];大連理工大學(xué);2018年

2 張曉峰;基于核方法的實體關(guān)系抽取研究[D];東南大學(xué);2016年

3 趙哲煥;生物醫(yī)學(xué)實體關(guān)系抽取研究[D];大連理工大學(xué);2017年

4 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年

5 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年

6 郭喜躍;面向開放領(lǐng)域文本的實體關(guān)系抽取[D];華中師范大學(xué);2016年

7 顧靜航;面向生物醫(yī)學(xué)領(lǐng)域的實體關(guān)系抽取研究[D];蘇州大學(xué);2017年

8 張宏濤;面向生物文本的實體關(guān)系自動抽取問題研究[D];清華大學(xué);2012年

9 陳忱;面向Web的實體關(guān)系查詢與分析關(guān)鍵技術(shù)研究[D];東北大學(xué);2013年

10 甘麗新;基于句法和語義分析的中文實體關(guān)系抽取[D];江西財經(jīng)大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 陳秋瑞;基于特征向量與核函數(shù)相結(jié)合的高新技術(shù)詞匯關(guān)系抽取模型研究[D];華中師范大學(xué);2019年

2 蔣貽順;基于規(guī)則匹配與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的中文實體關(guān)系抽取研究[D];合肥工業(yè)大學(xué);2019年

3 王春宇;基于深度學(xué)習(xí)的生物醫(yī)學(xué)實體關(guān)系抽取方法研究[D];吉林大學(xué);2019年

4 江爽;基于依存句法分析的皮膚病實體關(guān)系抽取[D];魯東大學(xué);2019年

5 何龍;基于依存句法分析的企業(yè)稅法實體關(guān)系抽取方法研究[D];魯東大學(xué);2019年

6 劉亞軍;中文命名實體及實體關(guān)系的自動抽取研究[D];鄭州大學(xué);2019年

7 佘恒;基于深度學(xué)習(xí)的中文文本實體關(guān)系抽取研究與實現(xiàn)[D];北京郵電大學(xué);2019年

8 溫政;基于深度學(xué)習(xí)的實體關(guān)系抽取研究[D];太原理工大學(xué);2019年

9 高賽;面向黨建領(lǐng)域?qū)嶓w關(guān)系抽取技術(shù)的研究[D];中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計算技術(shù)研究所);2019年

10 吳海濤;基于語義要素的網(wǎng)絡(luò)社區(qū)文本實體關(guān)系圖譜構(gòu)建[D];北京郵電大學(xué);2019年



本文編號:2600942

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/2600942.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶75260***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com