漢語句子隱喻的識別和理解關鍵技術研究
發(fā)布時間:2022-12-06 05:57
在日常表達中,我們使用隱喻表達抽象的認知體驗或者傳達審美感受。同時,我們的認知思維機制和概念系統(tǒng)是建立在隱喻之上。因此,隱喻機制的計算實現(xiàn)是自然語言處理任務中必不可少的一環(huán)。隱喻計算旨在發(fā)掘和表征語言中普適存在的隱喻機制,一般包含如下兩個方面的內(nèi)容:一是識別語料中的隱喻表達,與非隱喻表達進行區(qū)分;二是描述隱喻的表述意義,實現(xiàn)隱喻意義的有效理解。本文基于隱喻的認知與語言學特性,運用相關計算模型,解決漢語中句子級別的隱喻識別和理解問題。在隱喻識別任務中,我們旨在判斷某一個句子是否具是隱喻表達。當前,多數(shù)模型運用深度學習網(wǎng)絡實現(xiàn)了隱喻識別,但是對識別中的注意力機制探討較少。考慮到識別計算與抽象度等語義特征密不可分,我們認為抽象度等語義特征能幫助機器抓取句子中對識別任務更為關鍵的信息,從而更好地判斷句子是否為隱喻表達。因此本文構建一個基于抽象度的具有注意力機制的神經(jīng)網(wǎng)絡模型。根據(jù)概念隱喻理論,我們選取句子中具有最高抽象度的詞語作為該句子的注意詞,構建雙向長短期記憶神經(jīng)網(wǎng)絡模型及句子的位置特征向量,從而表征句子的加權特征,并搭建多層注意力機制來抽取句子的關鍵信息,最后判斷輸入的文本是否為隱喻表達...
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 問題的提出
1.2 隱喻的基本理論
1.2.1 隱喻的分類
1.2.2 認知隱喻理論
1.3 隱喻計算的內(nèi)容
1.4 本文的主要工作
1.5 本文的組織結構
第二章 隱喻計算研究進展
2.1 隱喻識別計算研究
2.1.1 依賴語義知識源的識別方法
2.1.2 基于神經(jīng)網(wǎng)絡的識別方法
2.1.3 結合外部知識源和神經(jīng)網(wǎng)絡的識別方法
2.2 隱喻理解計算研究
2.2.1 基于推理的隱喻理解方法
2.2.2 基于統(tǒng)計的隱喻理解方法
2.2.3 基于向量計算的隱喻理解方法
第三章 抽象度分析與計算
3.1 抽象詞與抽象度表征
3.2 隱喻中的抽象性分析
3.3 抽象度計算研究進展
3.4 漢語詞語的抽象度計算方法
3.5 評估和討論
第四章 考慮抽象度的漢語句子隱喻識別研究
4.1 注意力機制與抽象度
4.2 考慮抽象度的基于注意力機制的隱喻識別模型
4.2.1 注意詞的抽取
4.2.2 基于雙向長短期記憶神經(jīng)網(wǎng)絡的句子建模
4.2.3 多層注意力機制
4.2.4 二元分類
4.3 實驗設置
4.3.1 數(shù)據(jù)集整理與分析
4.3.2 詞向量模型
4.3.3 實驗的參數(shù)設置
4.4 實驗及實驗分析
4.4.1 對照實驗
4.4.2 注意力機制的評估實驗
4.4.3 詞向量規(guī)模的評估實驗
4.4.4 實例分析
第五章 基于合作網(wǎng)的漢語句子隱喻理解研究
5.1 考慮相關域知識的聯(lián)想度計算
5.2 合作網(wǎng)模型的構建
5.2.1 合作強度的計算
5.2.2 模型的基本結構
5.3 基于合作網(wǎng)的隱喻理解算法
5.3.1 屬性的剪枝
5.3.2 算法
5.4 實驗設置
5.4.1 屬性的評估實驗
5.4.2 實驗數(shù)據(jù)與實驗預處理
5.5 實驗與實驗分析
5.5.1 對照實驗及實驗結果
5.5.2 實例分析
第六章 總結與展望
6.1 本文的主要貢獻
6.2 未來的研究方向
參考文獻
碩士期間發(fā)表的論文
致謝
附錄A 本文構建的抽象詞庫和具體詞庫示例
附錄B 漢語句子隱喻識別結果示例
附錄C 隱喻理解模型的理解結果及其可接受度
本文編號:3711204
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 問題的提出
1.2 隱喻的基本理論
1.2.1 隱喻的分類
1.2.2 認知隱喻理論
1.3 隱喻計算的內(nèi)容
1.4 本文的主要工作
1.5 本文的組織結構
第二章 隱喻計算研究進展
2.1 隱喻識別計算研究
2.1.1 依賴語義知識源的識別方法
2.1.2 基于神經(jīng)網(wǎng)絡的識別方法
2.1.3 結合外部知識源和神經(jīng)網(wǎng)絡的識別方法
2.2 隱喻理解計算研究
2.2.1 基于推理的隱喻理解方法
2.2.2 基于統(tǒng)計的隱喻理解方法
2.2.3 基于向量計算的隱喻理解方法
第三章 抽象度分析與計算
3.1 抽象詞與抽象度表征
3.2 隱喻中的抽象性分析
3.3 抽象度計算研究進展
3.4 漢語詞語的抽象度計算方法
3.5 評估和討論
第四章 考慮抽象度的漢語句子隱喻識別研究
4.1 注意力機制與抽象度
4.2 考慮抽象度的基于注意力機制的隱喻識別模型
4.2.1 注意詞的抽取
4.2.2 基于雙向長短期記憶神經(jīng)網(wǎng)絡的句子建模
4.2.3 多層注意力機制
4.2.4 二元分類
4.3 實驗設置
4.3.1 數(shù)據(jù)集整理與分析
4.3.2 詞向量模型
4.3.3 實驗的參數(shù)設置
4.4 實驗及實驗分析
4.4.1 對照實驗
4.4.2 注意力機制的評估實驗
4.4.3 詞向量規(guī)模的評估實驗
4.4.4 實例分析
第五章 基于合作網(wǎng)的漢語句子隱喻理解研究
5.1 考慮相關域知識的聯(lián)想度計算
5.2 合作網(wǎng)模型的構建
5.2.1 合作強度的計算
5.2.2 模型的基本結構
5.3 基于合作網(wǎng)的隱喻理解算法
5.3.1 屬性的剪枝
5.3.2 算法
5.4 實驗設置
5.4.1 屬性的評估實驗
5.4.2 實驗數(shù)據(jù)與實驗預處理
5.5 實驗與實驗分析
5.5.1 對照實驗及實驗結果
5.5.2 實例分析
第六章 總結與展望
6.1 本文的主要貢獻
6.2 未來的研究方向
參考文獻
碩士期間發(fā)表的論文
致謝
附錄A 本文構建的抽象詞庫和具體詞庫示例
附錄B 漢語句子隱喻識別結果示例
附錄C 隱喻理解模型的理解結果及其可接受度
本文編號:3711204
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3711204.html
最近更新
教材專著