天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于依存句法分析的語義三元組構(gòu)建的研究與實現(xiàn)

發(fā)布時間:2017-06-04 15:02

  本文關(guān)鍵詞:基于依存句法分析的語義三元組構(gòu)建的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的迅速發(fā)展,知識和信息量開始呈現(xiàn)爆炸式的增長趨勢,而搜索引擎的智能化程度卻與人們的實際需求相差甚遠。目前,萬維網(wǎng)聯(lián)盟提出了一種新興的、具有智能化優(yōu)點的語義網(wǎng)。對于漢語來說,語義網(wǎng)構(gòu)造的核心任務(wù)就是提取句子的語義三元組成分。本論文的主要研究內(nèi)容是自然語言處理中句法分析的理論和相關(guān)方法,利用依存句法分析的方法來構(gòu)建漢語復(fù)雜長句的語義三元組,即主語,謂語和賓語。語義三元組的提取為自動構(gòu)建語義網(wǎng)奠定了基礎(chǔ)。 漢語長句具有語序靈活多變、依存關(guān)系復(fù)雜的特點,本文采用構(gòu)造根搜索器的方法將長句劃分成兩個短句,然后分別對兩個簡單短句進行依存句法分析。本課題選用長句較多的哈工大漢語依存樹庫作為實驗的訓(xùn)練和測試語料庫。首先,利用JAVA的DOM4j方法將哈工大樹庫從XML格式轉(zhuǎn)換成TXT格式。然后,利用支持向量機方法對長句的結(jié)點詞進行訓(xùn)練并預(yù)測根結(jié)點。本課題選用LIBSVM作為二值分類器構(gòu)造根搜索器的模型,提取與根結(jié)點信息相關(guān)的特征,并進行了對比實驗分析,找出影響根搜索器性能的最優(yōu)特征組合。最后,,為避免Arc-eager算法進行長距離依存關(guān)系分析時的貪婪性問題,將Arc-eager依存分析算法和支持向量機方法結(jié)合對短句進行依存句法分析,提取語義三元組成分并對1000個長句和分割后形成的1981個短句進行了對比實驗分析,分別獲得兩者的依存關(guān)系準確率。 理論分析和實驗結(jié)果表明,先構(gòu)造根結(jié)點搜索器,然后將長句劃分成短句,并對短句進行依存分析,最后提取語義三元組中的根結(jié)點、主謂關(guān)系和動賓關(guān)系的準確率比原始長句的準確率高。
【關(guān)鍵詞】:根結(jié)點搜索器 依存句法分析 支持向量機 語義三元組
【學(xué)位授予單位】:沈陽工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 緒論10-17
  • 1.1 課題的背景及意義10-11
  • 1.2 國內(nèi)外研究動態(tài)11-14
  • 1.2.1 國外研究動態(tài)11-12
  • 1.2.2 國內(nèi)研究動態(tài)12-14
  • 1.3 論文主要研究內(nèi)容14-15
  • 1.4 論文組織結(jié)構(gòu)15-17
  • 第二章 依存語法與依存句法分析概述17-28
  • 2.1 依存語法理論17-19
  • 2.2 依存結(jié)構(gòu)形式19-20
  • 2.3 依存句法分析方法20-25
  • 2.3.1 各種依存句法的分析比較22-23
  • 2.3.2 Arc-eager 決策式依存句法分析算法23-25
  • 2.4 語料庫25-27
  • 2.4.1 國外語料庫25
  • 2.4.2 漢語語料庫25-27
  • 2.5 本章小結(jié)27-28
  • 第三章 機器學(xué)習(xí)模型28-36
  • 3.1 機器學(xué)習(xí)在句法分析中的應(yīng)用28-29
  • 3.2 支持向量機模型29-35
  • 3.2.1 支持向量機的理論基礎(chǔ)29-32
  • 3.2.2 多類劃分的方法32-34
  • 3.2.3 LIBSVM34-35
  • 3.3 本章小結(jié)35-36
  • 第四章 漢語長句根結(jié)點搜索器的構(gòu)造36-47
  • 4.1 前期工作36-37
  • 4.2 構(gòu)造根結(jié)點搜索器37-46
  • 4.2.1 漢語長句分析的難點37-38
  • 4.2.2 根搜索器的構(gòu)造38-40
  • 4.2.3 實驗結(jié)果及分析40-46
  • 4.3 本章小結(jié)46-47
  • 第五章 漢語子句句法分析及三元組的構(gòu)造47-60
  • 5.1 分句進行句法分析48-52
  • 5.1.1 依存句法分析模型49-50
  • 5.1.2 依存句法分析算法及過程描述50-52
  • 5.2 提取長句的語義三元組52-53
  • 5.3 實驗結(jié)果及分析53-59
  • 5.3.1 評價標準53-54
  • 5.3.2 數(shù)據(jù)特征選取54-55
  • 5.3.3 實驗結(jié)果分析55-59
  • 5.4 本章小結(jié)59-60
  • 第六章 結(jié)論60-61
  • 參考文獻61-64
  • 在學(xué)研究成果64-65
  • 致謝65

【參考文獻】

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 姚文琳;漢語依存句法分析方法的研究與實現(xiàn)[D];中國海洋大學(xué);2009年


  本文關(guān)鍵詞:基于依存句法分析的語義三元組構(gòu)建的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。



本文編號:421294

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/421294.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶488bd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com