天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于詞粒度知識(shí)遷移的依存句法分析研究

發(fā)布時(shí)間:2022-11-12 12:35
  隨著自然語(yǔ)言處理的發(fā)展,依存句法分析作為一個(gè)重要的基礎(chǔ)任務(wù)一直備受關(guān)注。依存句法分析旨在獲取句子中詞語(yǔ)之間的修飾關(guān)系,為機(jī)器翻譯、信息抽取、問答等下游自然語(yǔ)言處理任務(wù)提供豐富的句法指導(dǎo),其準(zhǔn)確率嚴(yán)重影響下游任務(wù)的性能;诮y(tǒng)計(jì)和基于神經(jīng)網(wǎng)絡(luò)的依存句法分析器依賴于大量的已標(biāo)注數(shù)據(jù),否則容易出現(xiàn)過擬合問題,導(dǎo)致依存句法分析在低資源領(lǐng)域的性能較低。標(biāo)注依存句法數(shù)據(jù)需要豐富的語(yǔ)言學(xué)知識(shí),是一個(gè)耗時(shí)耗力的工作。因此,如何將自然標(biāo)注數(shù)據(jù)以及現(xiàn)有的已標(biāo)注數(shù)據(jù)有效地遷移到低資源領(lǐng)域成為非常有價(jià)值的研究問題。在句法數(shù)據(jù)遷移的過程中,存在一些障礙,比如句法知識(shí)形態(tài)不同、領(lǐng)域之間詞匯差異較大等,影響了遷移性能。本文提出通過四種不同的詞粒度知識(shí),構(gòu)建不同數(shù)據(jù)之間信息交互的橋梁,提高句法數(shù)據(jù)的遷移性能。具體包括利用詞共現(xiàn)將查詢?nèi)罩局刑N(yùn)含的句法知識(shí)遷移到無(wú)監(jiān)督依存句法分析中,利用句法類、領(lǐng)域一致的詞表示以及詞的領(lǐng)域?qū)傩詠?lái)跨越領(lǐng)域之間的詞匯鴻溝,從而更好地遷移句法結(jié)構(gòu)。1.基于詞共現(xiàn)知識(shí)的無(wú)監(jiān)督依存句法分析。近年來(lái),無(wú)監(jiān)督依存句法分析因其不需要昂貴的已標(biāo)注樹庫(kù)越來(lái)越流行,但準(zhǔn)確率仍然離實(shí)際應(yīng)用有較大的距離,部分原因... 

【文章頁(yè)數(shù)】:129 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景及研究意義
        1.1.1 課題背景
        1.1.2 研究意義
    1.2 研究現(xiàn)狀及分析
        1.2.1 依存句法分析
        1.2.2 無(wú)監(jiān)督依存句法分析
        1.2.3 依存句法分析的遷移學(xué)習(xí)
        1.2.4 基于詞粒度知識(shí)的自然語(yǔ)言處理
    1.3 本文的研究?jī)?nèi)容及組織結(jié)構(gòu)
        1.3.1 研究?jī)?nèi)容
        1.3.2 組織結(jié)構(gòu)
第2章 基于詞共現(xiàn)知識(shí)的無(wú)監(jiān)督依存句法分析
    2.1 引言
    2.2 相關(guān)工作
    2.3 基于配價(jià)的依存句法模型
    2.4 查詢?nèi)罩局刑N(yùn)含的句法知識(shí)
        2.4.1 查詢?nèi)罩镜恼Z(yǔ)言學(xué)分析
        2.4.2 基于詞共現(xiàn)句法知識(shí)的表示
    2.5 基于query知識(shí)增強(qiáng)的無(wú)監(jiān)督依存模型結(jié)構(gòu)及推理
        2.5.1 基于query知識(shí)增強(qiáng)的無(wú)監(jiān)督依存模型
        2.5.2 基于query知識(shí)增強(qiáng)的無(wú)監(jiān)督依存模型的推理
    2.6 實(shí)驗(yàn)及結(jié)果分析
        2.6.1 實(shí)驗(yàn)數(shù)據(jù)
        2.6.2 基線系統(tǒng)及參數(shù)設(shè)置
        2.6.3 中文無(wú)監(jiān)督依存句法分析的實(shí)驗(yàn)結(jié)果
        2.6.4 英文無(wú)監(jiān)督依存句法分析的實(shí)驗(yàn)結(jié)果
        2.6.5 中文數(shù)據(jù)的案例分析
        2.6.6 查詢?nèi)罩緮?shù)據(jù)規(guī)模的影響
    2.7 本章小結(jié)
第3章 基于句法類的依存句法分析
    3.1 引言
    3.2 相關(guān)工作
    3.3 基于圖的依存句法分析模型
    3.4 句法類
        3.4.1 句法類的定義
        3.4.2 基于依存上下文學(xué)習(xí)詞嵌入
        3.4.3 依據(jù)詞嵌入獲取句法類
        3.4.4 句法類在依存句法分析中的應(yīng)用
    3.5 實(shí)驗(yàn)及結(jié)果分析
        3.5.1 實(shí)驗(yàn)設(shè)置
        3.5.2 基于統(tǒng)計(jì)和基于神經(jīng)網(wǎng)絡(luò)的依存句法分析實(shí)驗(yàn)
        3.5.3 詞匯句法類的案例分析
    3.6 本章小結(jié)
第4章 基于領(lǐng)域一致詞嵌入的依存句法分析領(lǐng)域遷移
    4.1 引言
    4.2 相關(guān)工作
    4.3 基于雙仿射的深度依存句法分析模型
    4.4 利用WGAN學(xué)習(xí)領(lǐng)域一致的詞表示
        4.4.1 面向領(lǐng)域一致詞表示的生成器
        4.4.2 基于深度卷積網(wǎng)絡(luò)的判別器
        4.4.3 損失函數(shù)設(shè)置
        4.4.4 生成器與判別器的訓(xùn)練過程
    4.5 學(xué)習(xí)領(lǐng)域一致詞表示實(shí)驗(yàn)及分析
        4.5.1 數(shù)據(jù)及參數(shù)設(shè)置
        4.5.2 WGAN的穩(wěn)定性及收斂性分析
        4.5.3 依據(jù)詞相似度分析領(lǐng)域一致詞表示
    4.6 依存句法分析領(lǐng)域自適應(yīng)實(shí)驗(yàn)及分析
        4.6.1 數(shù)據(jù)及參數(shù)設(shè)置
        4.6.2 新聞?lì)I(lǐng)域遷移到生物領(lǐng)域的依存句法分析結(jié)果
        4.6.3 生物領(lǐng)域遷移到新聞?lì)I(lǐng)域的依存句法分析結(jié)果
        4.6.4 不同依存關(guān)系上的實(shí)驗(yàn)結(jié)果分析
        4.6.5 依存句法分析案例分析
    4.7 本章小結(jié)
第5章 基于詞匯領(lǐng)域?qū)傩缘牟糠秩ピ~匯化依存句法分析
    5.1 引言
    5.2 相關(guān)工作
    5.3 利用生成式對(duì)抗網(wǎng)絡(luò)識(shí)別詞匯的語(yǔ)境化領(lǐng)域?qū)傩?br>        5.3.1 詞匯語(yǔ)境化領(lǐng)域?qū)傩缘淖R(shí)別
        5.3.2 面向部分去詞匯化句子的分類器
        5.3.3 損失函數(shù)設(shè)置
        5.3.4 生成式對(duì)抗網(wǎng)絡(luò)的的博弈訓(xùn)練
    5.4 掩碼在依存句法分析領(lǐng)域遷移中的應(yīng)用
        5.4.1 依存句法分析模型
        5.4.2 隱式向量拼接
        5.4.3 顯式元素替換
    5.5 實(shí)驗(yàn)及結(jié)果分析
        5.5.1 數(shù)據(jù)及參數(shù)設(shè)置
        5.5.2 掩碼的隱式應(yīng)用實(shí)驗(yàn)結(jié)果
        5.5.3 Token級(jí)掩碼的案例分析
        5.5.4 Token級(jí)掩碼的顯式應(yīng)用
    5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡(jiǎn)歷


【參考文獻(xiàn)】:
期刊論文
[1]適應(yīng)多領(lǐng)域多來(lái)源文本的漢語(yǔ)依存句法數(shù)據(jù)標(biāo)注規(guī)范[J]. 郭麗娟,李正華,彭雪,張民.  中文信息學(xué)報(bào). 2018(10)
[2]面向中文電子病歷的句法分析融合模型[J]. 蔣志鵬,關(guān)毅.  自動(dòng)化學(xué)報(bào). 2019(02)
[3]多領(lǐng)域中文依存樹庫(kù)構(gòu)建與影響統(tǒng)計(jì)句法分析因素之分析[J]. 邱立坤,史林林,王厚峰.  中文信息學(xué)報(bào). 2015(05)
[4]基于用戶行為分析的搜索引擎自動(dòng)性能評(píng)價(jià)[J]. 劉奕群,岑榮偉,張敏,茹立云,馬少平.  軟件學(xué)報(bào). 2008(11)
[5]基于大規(guī)模日志分析的搜索引擎用戶行為分析[J]. 余慧佳,劉奕群,張敏,茹立云,馬少平.  中文信息學(xué)報(bào). 2007(01)

博士論文
[1]基于分布表示的跨語(yǔ)言跨任務(wù)自然語(yǔ)言分析[D]. 郭江.哈爾濱工業(yè)大學(xué) 2017
[2]基于核方法的語(yǔ)義角色標(biāo)注研究[D]. 車萬(wàn)翔.哈爾濱工業(yè)大學(xué) 2008



本文編號(hào):3706378

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3706378.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶88967***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com