天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

面向中文短文本的關(guān)系抽取算法設(shè)計

發(fā)布時間:2021-09-19 19:23
  海量互聯(lián)網(wǎng)數(shù)據(jù)的異構(gòu)、多源和異質(zhì)等問題使得高效、精準(zhǔn)的知識獲取成為巨大的挑戰(zhàn)。關(guān)系抽取是自然語言處理中的一項基礎(chǔ)性任務(wù),從無結(jié)構(gòu)化的文本數(shù)據(jù)中自動獲取結(jié)構(gòu)化的關(guān)系型事實(shí),為大規(guī)模知識圖譜的構(gòu)建和互聯(lián)網(wǎng)智能知識服務(wù)提供支持。隨著深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用,神經(jīng)關(guān)系抽取模型的精度獲得了很大提升。然而,現(xiàn)有的主流研究一般關(guān)注英語語言的、句子級別的關(guān)系抽取。與英語不同,中文表述靈活多變,語法和構(gòu)詞規(guī)則相對不固定,大量語義知識蘊(yùn)含在中文短文本中,通常很難被現(xiàn)有算法有效抽取。本文主要研究面向中文短文本的關(guān)系抽取問題。由于中文短文本獨(dú)特的語言學(xué)特征,其關(guān)系抽取任務(wù)與傳統(tǒng)工作相比具有諸多挑戰(zhàn)。短文本的語法結(jié)構(gòu)和語義一般不完整,部分短文本蘊(yùn)含的語義關(guān)系屬于常識性知識,關(guān)系表述的上下文高度稀疏。與英語相比,中文基礎(chǔ)自然語言分析較低的準(zhǔn)確度,以及短文本關(guān)系抽取標(biāo)注數(shù)據(jù)集的缺乏也增大了這一問題的難度。本文分別從基于詞嵌入的上下位關(guān)系抽取、知識增強(qiáng)的語義關(guān)系抽取、以及非上下位關(guān)系抽取與語義理解等三個方面進(jìn)行深入研究,設(shè)計了面向中文短文本的關(guān)系抽取框架,較好地解決了上述挑戰(zhàn)。本文的主要工作和貢獻(xiàn)概述如下:(1)基于詞... 

【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:201 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景
        1.1.1 知識圖譜
        1.1.2 分類體系與上下位關(guān)系抽取
        1.1.3 通用語義關(guān)系抽取
    1.2 面臨的挑戰(zhàn)
    1.3 整體研究內(nèi)容與研究思路
    1.4 研究意義
    1.5 主要貢獻(xiàn)
    1.6 章節(jié)安排
第二章 基于詞嵌入的上下位關(guān)系抽取
    2.1 引言
    2.2 相關(guān)工作
        2.2.1 基于模式匹配的上下位關(guān)系抽取
        2.2.2 分布式上下位關(guān)系預(yù)測
        2.2.3 討論
    2.3 半監(jiān)督式上下位關(guān)系擴(kuò)展模型
        2.3.1 算法模型
        2.3.2 實(shí)驗(yàn)分析
    2.4 基于轉(zhuǎn)導(dǎo)學(xué)習(xí)的上下位關(guān)系分類模型
        2.4.1 算法模型
        2.4.2 實(shí)驗(yàn)分析
    2.5 基于模糊正交投影的上下位關(guān)系分類模型
        2.5.1 算法模型
        2.5.2 實(shí)驗(yàn)分析
    2.6 小結(jié)
第三章 知識增強(qiáng)的語義關(guān)系抽取
    3.1 引言
    3.2 相關(guān)工作
        3.2.1 對抗學(xué)習(xí)在NLP的應(yīng)用
        3.2.2 跨語言遷移學(xué)習(xí)在NLP的應(yīng)用
        3.2.3 詞匯關(guān)系分類
    3.3 基于對抗學(xué)習(xí)的跨知識源上下位關(guān)系融合
        3.3.1 算法模型
        3.3.2 實(shí)驗(yàn)分析
    3.4 基于遷移學(xué)習(xí)的跨語言上下位關(guān)系抽取
        3.4.1 算法模型
        3.4.2 實(shí)驗(yàn)分析
    3.5 基于超球?qū)W習(xí)的詞匯關(guān)系分類
        3.5.1 算法模型
        3.5.2 實(shí)驗(yàn)分析
    3.6 小結(jié)
第四章 非上下位關(guān)系抽取與語義理解
    4.1 引言
    4.2 相關(guān)工作
        4.2.1 基于短文本的關(guān)系抽取
        4.2.2 常識性關(guān)系抽取
        4.2.3 名詞短語的習(xí)語性分析
    4.3 基于模式挖掘的非上下位關(guān)系抽取
        4.3.1 算法模型
        4.3.2 實(shí)驗(yàn)分析
    4.4 數(shù)據(jù)驅(qū)動的非上下位關(guān)系抽取
        4.4.1 算法模型
        4.4.2 實(shí)驗(yàn)分析
    4.5 中文短文本的語義理解
        4.5.1 習(xí)語性分類問題
        4.5.2 算法模型
        4.5.3 實(shí)驗(yàn)分析
        4.5.4 應(yīng)用研究
    4.6 小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 未來工作展望
參考文獻(xiàn)
附錄
致謝
簡歷
攻讀博士學(xué)位期間發(fā)表的學(xué)術(shù)論文和科研情況



本文編號:3402193

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/3402193.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3c520***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com