天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

專利領(lǐng)域本體概念間非分類關(guān)系抽取研究

發(fā)布時(shí)間:2017-05-22 11:20

  本文關(guān)鍵詞:專利領(lǐng)域本體概念間非分類關(guān)系抽取研究,由筆耕文化傳播整理發(fā)布。


【摘要】:在浩如煙海的信息面前,基于關(guān)鍵字的傳統(tǒng)信息檢索方式已經(jīng)不能滿足用戶對(duì)信息檢索快速、全面的要求。如何有效表示、管理、維護(hù)和復(fù)用信息資源已經(jīng)成為產(chǎn)業(yè)界和研究者共同關(guān)心的研究領(lǐng)域。本體作為一種有效的知識(shí)組織和描述方式,具有良好的概念層次結(jié)構(gòu)和豐富的概念間語義關(guān)系并且支持邏輯推理,因而在信息檢索、數(shù)字圖書館、專利分析等領(lǐng)域得到廣泛的研究和應(yīng)用。概念是組成本體的基本內(nèi)容之一,概念間分類關(guān)系是本體的骨架信息,概念間非分類關(guān)系是本體的枝干信息。根據(jù)本體學(xué)習(xí)的層次模型以及專利本體的應(yīng)用需求可知,該專利本體還缺少概念間的非分類關(guān)系。因此知識(shí)庫還是不完備的。為了構(gòu)建完備的專利本體知識(shí)庫,本文需要研究新能源汽車領(lǐng)域?qū)@g(shù)語抽取問題和概念間非分類關(guān)系抽取問題。本文的主要工作如下:(1)提出一種基于條件隨機(jī)場(chǎng)模型的中文專利領(lǐng)域術(shù)語抽取方法。本文針對(duì)新能源汽車領(lǐng)域的術(shù)語特點(diǎn)和總結(jié)前人術(shù)語抽取研究成果的基礎(chǔ)上,利用成熟的條件隨機(jī)場(chǎng)模型,選取詞、詞長、詞性、依存關(guān)系、詞典位置、停用詞等特征進(jìn)行新能源汽車領(lǐng)域中文術(shù)語的進(jìn)行抽取。本文探索將詞匯間的依存關(guān)系應(yīng)用到術(shù)語抽取問題即將其作為條件隨機(jī)場(chǎng)模型的一項(xiàng)特征。實(shí)驗(yàn)結(jié)果證明該方法可以有效提高術(shù)語抽取結(jié)果的正確率和召回率。(2)針對(duì)SAO結(jié)構(gòu)關(guān)系抽取任務(wù)中關(guān)系實(shí)例結(jié)構(gòu)正確但是語義錯(cuò)誤的問題,提出句法分析特征和關(guān)系詞詞典特征并結(jié)合傳統(tǒng)特征的關(guān)系抽取方法。將新特征和上下文、距離等傳統(tǒng)特征相結(jié)合,使用支持向量機(jī)分類器進(jìn)行SAO結(jié)構(gòu)關(guān)系抽取實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明該方法可以削弱語義錯(cuò)誤問題造成的影響,進(jìn)而提高抽取結(jié)果的正確率和召回率。(3)設(shè)計(jì)并實(shí)現(xiàn)了基于專利文獻(xiàn)的新能源汽車領(lǐng)域?qū)@倔w更新系統(tǒng)。專利本體的構(gòu)建目的是為了將知識(shí)庫應(yīng)用于專利文獻(xiàn)的檢索、技術(shù)主題矩陣的構(gòu)建、侵權(quán)檢測(cè)等領(lǐng)域。隨著專利文獻(xiàn)的爆炸式增長,專利本體也需要與時(shí)俱進(jìn)。本文實(shí)現(xiàn)的專利本體更新系統(tǒng),主要實(shí)現(xiàn)三個(gè)功能,首先是使用上文中提到的方法從專利文獻(xiàn)中抽取術(shù)語并加入到本體中;其次是從專利文獻(xiàn)中抽取概念間的非分類關(guān)系,在將發(fā)現(xiàn)的關(guān)系加入到本體之前需要對(duì)抽取的關(guān)系詞進(jìn)行聚類操作,通過該操作發(fā)現(xiàn)關(guān)系類型;第三個(gè)功能是將新發(fā)現(xiàn)的術(shù)語和關(guān)系類型加入到本體中,關(guān)系實(shí)例作為關(guān)系類型的實(shí)例。通過以上三個(gè)功能就可以實(shí)現(xiàn)對(duì)新能源汽車領(lǐng)域?qū)@倔w的術(shù)語豐富和語義關(guān)系擴(kuò)展。
【關(guān)鍵詞】:本體學(xué)習(xí) 非分類關(guān)系 關(guān)系抽取 句法分析
【學(xué)位授予單位】:北京信息科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第1章 緒論10-19
  • 1.1 研究背景與意義10-12
  • 1.1.1 研究背景10-12
  • 1.1.2 研究意義12
  • 1.2 課題研究現(xiàn)狀12-16
  • 1.2.1 術(shù)語抽取的研究現(xiàn)狀12-13
  • 1.2.2 非分類關(guān)系抽取研究現(xiàn)狀13-14
  • 1.2.3 SAO結(jié)構(gòu)抽取研究現(xiàn)狀14-15
  • 1.2.4 本體在專利領(lǐng)域的應(yīng)用15-16
  • 1.3 主要工作和創(chuàng)新點(diǎn)16-17
  • 1.4 論文的組織結(jié)構(gòu)17-19
  • 第2章 本體理論研究介紹19-24
  • 2.1 本體概述19
  • 2.2 本體描述語言19-21
  • 2.3 本體構(gòu)建工具21-22
  • 2.4 本體學(xué)習(xí)分類22-23
  • 2.5 本章小結(jié)23-24
  • 第3章 專利領(lǐng)域中文術(shù)語抽取研究24-33
  • 3.1 新能源汽車領(lǐng)域術(shù)語特點(diǎn)24-25
  • 3.2 基于CRFs的新能源汽車領(lǐng)域術(shù)語抽取25-29
  • 3.2.1 條件隨機(jī)場(chǎng)25-26
  • 3.2.2 術(shù)語抽取模型26
  • 3.2.3 語言云26-27
  • 3.2.4 特征選取27-29
  • 3.3 實(shí)驗(yàn)結(jié)果及分析29-32
  • 3.3.1 實(shí)驗(yàn)數(shù)據(jù)介紹29-30
  • 3.3.2 結(jié)果和分析30-32
  • 3.4 本章小結(jié)32-33
  • 第4章 專利領(lǐng)域概念間SAO結(jié)構(gòu)關(guān)系抽取33-42
  • 4.1 基于支持向量機(jī)的概念間SAO結(jié)構(gòu)關(guān)系抽取33-35
  • 4.1.1 支持向量機(jī)33
  • 4.1.2 領(lǐng)域關(guān)系強(qiáng)度33-34
  • 4.1.3 概念間SAO結(jié)構(gòu)關(guān)系抽取方法34-35
  • 4.2 特征選擇35-37
  • 4.2.1 實(shí)體詞語以及上下文特征35-36
  • 4.2.2 句法特征36-37
  • 4.2.3 詞間距離37
  • 4.2.4 關(guān)系詞詞典37
  • 4.3 實(shí)驗(yàn)與結(jié)果分析37-42
  • 4.3.1 實(shí)驗(yàn)描述37-38
  • 4.3.2 實(shí)驗(yàn)預(yù)處理38
  • 4.3.3 評(píng)價(jià)指標(biāo)38-39
  • 4.3.4 實(shí)驗(yàn)分析39-42
  • 第5章 本體豐富系統(tǒng)的實(shí)現(xiàn)42-52
  • 5.1 基于K-Means的領(lǐng)域動(dòng)詞聚類42-43
  • 5.1.1 Word2Vec簡介42
  • 5.1.2 K-Means簡介42-43
  • 5.1.3 Java OWL API簡介43
  • 5.2 專利本體更新系統(tǒng)的設(shè)計(jì)43-46
  • 5.2.1 術(shù)語抽取模塊的設(shè)計(jì)44-45
  • 5.2.2 SAO結(jié)構(gòu)關(guān)系抽取模塊的設(shè)計(jì)45-46
  • 5.2.3 關(guān)系詞聚類模塊的設(shè)計(jì)46
  • 5.2.4 本體操作模塊的設(shè)計(jì)46
  • 5.3 專利本體更新系統(tǒng)的實(shí)現(xiàn)46-52
  • 5.3.1 系統(tǒng)架構(gòu)46
  • 5.3.2 開發(fā)環(huán)境46-47
  • 5.3.3 系統(tǒng)展示47-52
  • 第6章 總結(jié)與展望52-54
  • 6.1 總結(jié)52-53
  • 6.2 展望53-54
  • 致謝54-55
  • 參考文獻(xiàn)55-59
  • 個(gè)人簡歷 在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果59

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 琚春華,王國征;你會(huì)選購收款機(jī)嗎? 收款機(jī)應(yīng)用功能與分類關(guān)系初探[J];市場(chǎng)與電腦;1998年06期

2 董麗麗;胡云飛;張翔;;一種領(lǐng)域概念非分類關(guān)系的獲取方法[J];計(jì)算機(jī)工程與應(yīng)用;2013年04期

3 喬建忠;;基于主題爬蟲的本體非分類關(guān)系學(xué)習(xí)框架[J];圖書情報(bào)工作;2010年18期

4 溫春;石昭祥;辛元;;基于擴(kuò)展關(guān)聯(lián)規(guī)則的中文非分類關(guān)系抽取[J];計(jì)算機(jī)工程;2009年24期

5 古凌嵐;孫素云;;基于語義依存的中文本體非分類關(guān)系抽取方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年04期

6 張立國;陳荔;;維基百科中基于語義依存的領(lǐng)域本體非分類關(guān)系獲取方法研究[J];情報(bào)科學(xué);2014年06期

7 賈秀玲;文敦偉;;一種本體學(xué)習(xí)中分類關(guān)系提取方法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年10期

8 余宏華;分類關(guān)系模型中的排它性維護(hù)及其應(yīng)用[J];廣東自動(dòng)化與信息工程;2001年03期

9 王歲花;趙愛玲;馬巍巍;;從Web中提取中文本體非分類關(guān)系的方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年02期

10 王紅;高斯婷;潘振杰;肖志偉;;基于NNV關(guān)聯(lián)規(guī)則的非分類關(guān)系提取方法及其應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用研究;2012年10期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前2條

1 陳慧清;林世平;;基于知網(wǎng)和模式自舉的概念間分類關(guān)系獲取方法[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2009年

2 馮煤生;王德謀;;Fuzzy—分類關(guān)系[A];中國系統(tǒng)工程學(xué)會(huì)模糊數(shù)學(xué)與模糊系統(tǒng)委員會(huì)第五屆年會(huì)論文選集[C];1990年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 連莉;本體中非分類關(guān)系的理論體系研究[D];山東大學(xué);2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條

1 何宇;專利領(lǐng)域本體概念間非分類關(guān)系抽取研究[D];北京信息科技大學(xué);2015年

2 楊倩倩;基于種子自舉的維吾爾文本體分類關(guān)系自動(dòng)提取[D];新疆大學(xué);2014年

3 梁吉震;基于領(lǐng)域概念知識(shí)的非分類關(guān)系學(xué)習(xí)研究[D];吉林大學(xué);2012年

4 吳芳;基于語義相似度的本體中分類關(guān)系的評(píng)價(jià)研究與實(shí)現(xiàn)[D];華東師范大學(xué);2010年

5 鄧子平;面向醫(yī)學(xué)診療的本體自動(dòng)生成系統(tǒng)的研究與開發(fā)[D];廣東工業(yè)大學(xué);2011年


  本文關(guān)鍵詞:專利領(lǐng)域本體概念間非分類關(guān)系抽取研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):385572

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/385572.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶baced***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com