天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于深度學(xué)習(xí)的典籍介賓句法結(jié)構(gòu)自動(dòng)識(shí)別研究

發(fā)布時(shí)間:2023-04-19 03:24
  古漢語典籍是中華民族文化和歷史的承載與見證,通過典籍能夠還原、了解中國古代社會(huì)的樣貌,因此典籍中有著豐富的寶藏等待研究者去挖掘。隨著科學(xué)技術(shù)的發(fā)展,人們開始用計(jì)算機(jī)來處理自然語言,有關(guān)自然語言處理的技術(shù)越來越多。雖然中文信息處理發(fā)展飛速,尤其是現(xiàn)代漢語文本方面取得了豐碩的成果,但有關(guān)古文信息化處理的研究較少,這與現(xiàn)代漢語文本成果形成了鮮明的對(duì)比。當(dāng)前國內(nèi)的古文信息處理的研究處于滯后狀態(tài)且大多數(shù)研究都集中在典籍?dāng)?shù)字化、自動(dòng)分詞、詞性標(biāo)注等方面,少有關(guān)于古文句法層面的研究。要挖掘典籍中的知識(shí),首先要實(shí)現(xiàn)對(duì)典籍的句法分析。句法分析就是分析句子中的詞語語法功能,又分為句法結(jié)構(gòu)分析和依存關(guān)系分析兩種。但是完整的句法分析有較大的難度,可以通過淺層句法分析來解構(gòu)句子的組成。介賓結(jié)構(gòu)的自動(dòng)識(shí)別就是淺層句法分析中的一部分。古漢語的語法與現(xiàn)代漢語的語法有較大的差異,這也是古漢語典籍晦澀難懂的原因之一,但是古漢語與現(xiàn)代漢語在介賓結(jié)構(gòu)上有著很大的相似點(diǎn),介賓結(jié)構(gòu)有著引出相關(guān)的時(shí)間、地點(diǎn)、人物、原因、目的、方式等等語法意義,因而介賓結(jié)構(gòu)的識(shí)別與結(jié)構(gòu)的分析直接關(guān)系到人們對(duì)句子的理解。如果能夠?qū)崿F(xiàn)典籍的介賓結(jié)構(gòu)識(shí)別...

【文章頁數(shù)】:81 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
    1.2 研究內(nèi)容
第二章 文獻(xiàn)綜述與模型原理
    2.1 相關(guān)理論方法
        2.1.1 句法分析
        2.1.2 國內(nèi)外淺層句法分析研究綜述
        2.1.3 介賓結(jié)構(gòu)識(shí)別
        2.1.4 深度學(xué)習(xí)的發(fā)展
        2.1.5 序列標(biāo)注
        2.1.6 古文信息處理研究綜述
    2.2 相關(guān)模型原理
        2.2.1 CRF模型
        2.2.2 LSTM模型
        2.2.3 BERT模型
    2.3 本章小結(jié)
第三章 語料分析
    3.1 清華漢語樹庫
        3.1.1 清華漢語樹庫結(jié)構(gòu)分析
        3.1.2 清華漢語樹庫介賓結(jié)構(gòu)統(tǒng)計(jì)
    3.2 《史記》語料介詞分布分析
    3.3 清華漢語樹庫介賓結(jié)構(gòu)與《史記》介賓結(jié)構(gòu)比較
    3.4 《史記》語料構(gòu)建與分析
        3.4.1 《史記》語料標(biāo)注
        3.4.2 《史記》語料介賓結(jié)構(gòu)分析
    3.5 本章小結(jié)
第四章 清華漢語樹庫實(shí)驗(yàn)
    4.1 清華漢語樹庫語料處理
    4.2 實(shí)驗(yàn)?zāi)康?br>    4.3 清華漢語樹庫CRF實(shí)驗(yàn)
        4.3.1 CRF特征選擇
        4.3.2 窗口長度的選擇
        4.3.3 特征模板設(shè)置
        4.3.4 CRF實(shí)驗(yàn)
        4.3.5 不同語料處理對(duì)識(shí)別結(jié)果的影響分析
    4.4 Bi-LSTM-CRF模型實(shí)驗(yàn)
        4.4.1 詞向量的獲取
        4.4.2 參數(shù)的設(shè)置
        4.4.3 十折交叉驗(yàn)證
    4.5 BERT模型十折實(shí)驗(yàn)
        4.5.1 預(yù)訓(xùn)練模型
        4.5.2 識(shí)別模型結(jié)果
    4.6 本章小結(jié)
第五章 《史記》介賓結(jié)構(gòu)識(shí)別研究
    5.1 基于CRF++的史記介賓結(jié)構(gòu)識(shí)別
        5.1.1 特征與特征模板選擇
        5.1.2 識(shí)別模型結(jié)果
    5.2 基于Bi-LSTM-CRF模型的《史記》介賓結(jié)構(gòu)識(shí)別
        5.2.1 詞向量與字向量的獲取
        5.2.2 參數(shù)設(shè)置
        5.2.3 識(shí)別模型訓(xùn)練結(jié)果
        5.2.4 不同語料處理對(duì)識(shí)別結(jié)果的影響分析
    5.3 基于BERT的《史記》介賓結(jié)構(gòu)識(shí)別
    5.4 不同模型方法字單位識(shí)別效果分析
    5.5 典籍介賓結(jié)構(gòu)自動(dòng)識(shí)別平臺(tái)搭建
        5.5.1 網(wǎng)站的布局設(shè)計(jì)
        5.5.2 平臺(tái)使用示例
    5.6 本章小結(jié)
第六章 總結(jié)和展望
    6.1 總結(jié)
    6.2 不足和展望
參考文獻(xiàn)
致謝



本文編號(hào):3793619

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/3793619.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a51fa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com