天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

語義網(wǎng)自動構建中句子成分識別的研究

發(fā)布時間:2018-11-02 15:27
【摘要】:互聯(lián)網(wǎng)的迅速發(fā)展,使得世界的信息化程度越來越高。但是現(xiàn)在所使用的萬維網(wǎng)無法讓人滿意,主要問題體現(xiàn)在搜索引擎智能化程度還不夠。作為解決方案之一,一種新興的主要針對于搜索數(shù)據(jù)的解決方法——語義網(wǎng),它很好地體現(xiàn)了智能化的優(yōu)點。為了構建語義網(wǎng),則需要對資源描述框架進行構成。對于中文來說,構成資源描述框架的工作就是把一個句子的主謂賓成分進行提取后,利用此三元組進行語義網(wǎng)的自動構建工作。 依存句法分析是句法分析技術的一種。它利用語言模型、Eisner算法和最大生成樹算法來構成依存句法分析的主體。通過找到和謂語動詞相依存的幾個組塊,進一步找到句子的主語和賓語成分。利用這種方式,可以在短時間內獲取結構簡單句子的主謂賓成分。在此基礎之上的語義角色標注是淺層語義分析的一種表現(xiàn)方式,通過合并句子中的各個組塊,來分析它們在句子中的起到的主要作用。利用這種方法來分析句子成分有著更高的精確度。其中有關于特征的選擇是兩種方法的重要組成部分,對最終結果的影響占有很大比例。本文把重點放在特征的挑選上,并選擇了合適的對最終結果有效的特征進行使用。利用訓練好的語言模型,,進行特征的選擇和匹配,使兩種處理搭配得當,可以很好地找到句子中的主謂賓三元組。本系統(tǒng)將兩種方法進行綜合,改善了單純語義角色方法所帶來時間上的問題。 使用此系統(tǒng)在公開的未標注的語料庫上進行試驗,并與單純的語義角色標注和單純的依存語法分析的方法進行了對比,正確率高于單純的依存分析方法,時間上低于語義角色標注的方法。
[Abstract]:With the rapid development of the Internet, the information level of the world is getting higher and higher. But the current use of the World wide Web is not satisfactory, the main problem lies in the search engine intelligence is not enough. As one of the solutions, the semantic Web, a new solution for searching data, embodies the advantages of intelligence. In order to construct the semantic web, it is necessary to construct the resource description framework. For Chinese, the task of constructing a resource description framework is to extract the subject, predicate and object components of a sentence and use the triple to construct the semantic web automatically. Dependency parsing is one of syntactic parsing techniques. It uses language model, Eisner algorithm and maximal spanning tree algorithm to construct the main body of dependency parsing. By finding several blocks that are dependent on the predicate verb, the subject and object components of the sentence are further found. In this way, the subject, predicate and object components of a simple sentence can be obtained in a short time. Semantic role tagging based on this is a representation of shallow semantic analysis. The main role of semantic role tagging in sentences is analyzed by merging the blocks in sentences. Using this method to analyze sentence components has higher accuracy. The selection of features is an important part of the two methods and has a great influence on the final results. This paper focuses on feature selection and selects suitable features that are valid for the final result. The trained language model is used to select and match the features so that the two types can be collocated properly and the subject-predicate triples in sentences can be well found. In this system, the two methods are integrated to improve the time problem caused by the simple semantic role method. The system is tested on the open unannotated corpus and compared with the methods of simple semantic role annotation and simple dependency syntax analysis. The correct rate of this system is higher than that of the simple dependency analysis method. A method in which the time is lower than the semantic role annotation.
【學位授予單位】:沈陽工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.1

【參考文獻】

相關期刊論文 前9條

1 鞠久朋;王紅玲;周國棟;;依存關系語義角色標注研究[J];計算機工程與應用;2010年14期

2 安強強;張蕾;;基于依存樹的中文語義角色標注[J];計算機工程;2010年04期

3 張育;王紅玲;周國棟;;基于兩種句法分析的語義角色標注比較研究[J];計算機應用與軟件;2010年08期

4 袁文宜;;依存語法概述[J];科技情報開發(fā)與經濟;2010年18期

5 劉懷軍;車萬翔;劉挺;;中文語義角色標注的特征工程[J];中文信息學報;2007年01期

6 陳耀東;王挺;陳火旺;;半監(jiān)督學習和主動學習相結合的淺層語義分析[J];中文信息學報;2008年02期

7 周國光;漢語配價語法論略[J];南京師大學報(社會科學版);1994年04期

8 劉挺;車萬翔;李生;;基于最大熵分類器的語義角色標注[J];軟件學報;2007年03期

9 王文學;李芳;;基于聯(lián)合方法的中文語義角色標注[J];小型微型計算機系統(tǒng);2011年11期

相關博士學位論文 前1條

1 王紅玲;基于特征向量的中英文語義角色標注研究[D];蘇州大學;2009年

相關碩士學位論文 前2條

1 王玉丹;基于SVM的漢語依存句法分析研究[D];中國海洋大學;2010年

2 汪紅林;基于依存分析的語義角色標注研究[D];蘇州大學;2009年



本文編號:2306185

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2306185.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶fc61a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com