融入特征和注意力機(jī)制的問(wèn)題生成方法研究
發(fā)布時(shí)間:2023-02-14 20:18
問(wèn)題生成任務(wù)旨在為文本生成相應(yīng)的自然語(yǔ)言問(wèn)句。傳統(tǒng)方法主要通過(guò)復(fù)雜的人工規(guī)則將陳述句轉(zhuǎn)化為自然問(wèn)句,以此方法生成的問(wèn)句往往表述簡(jiǎn)單,普適性較低。目前,深度學(xué)習(xí)法方法已經(jīng)被應(yīng)用于問(wèn)題自動(dòng)生成任務(wù),其中,以端到端的架構(gòu)為主。深度學(xué)習(xí)方法直接將陳述句作為模型的輸入,忽略了密令的相關(guān)信息。其中,密令是句子中的連續(xù)短語(yǔ)片段,生成問(wèn)句所需要關(guān)注的“潛在提問(wèn)對(duì)象”,又稱為答案源。從而,其往往使得模型的性能受限于固有的問(wèn)題提問(wèn)方式,無(wú)法適應(yīng)原句(答案源)的自身特點(diǎn)。因此,本文利用特征和注意力機(jī)制加強(qiáng)關(guān)注陳述句中的密令進(jìn)行問(wèn)題生成研究,主要內(nèi)容包含以下三個(gè)方面:(1)基于密令位里信息的問(wèn)題生成現(xiàn)有的問(wèn)題生成方法以端到端的序列化生成模型為基本框架,該方法由于對(duì)句子中密令的關(guān)注度不足,使得模型無(wú)法適應(yīng)原句(答案源)的語(yǔ)言特性。針對(duì)此弊端,本文提出一種基于密令位置信息的點(diǎn)對(duì)點(diǎn)的問(wèn)題生成模型。該模型將密令位置信息與全句語(yǔ)義信息進(jìn)行融合。本方法的目標(biāo)是通過(guò)添加密令位置信息輔助原有模型自動(dòng)關(guān)注密令。實(shí)驗(yàn)結(jié)果顯示,相比于基準(zhǔn)系統(tǒng),本方法在SQuAD數(shù)據(jù)上BLEU-4指標(biāo)提高1.98個(gè)百分點(diǎn)。(2)基于疑問(wèn)詞識(shí)別的問(wèn)題...
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.2.1 文本生成研究現(xiàn)狀
1.2.2 問(wèn)題生成的研究現(xiàn)狀
1.3 問(wèn)題生成現(xiàn)有研究中存在的問(wèn)題
1.4 本文的研究?jī)?nèi)容和組織結(jié)構(gòu)
第二章 問(wèn)題生成概述
2.1 問(wèn)題生成方法
2.2 端到端模型
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 編碼-解碼過(guò)程
2.3 語(yǔ)料概述
2.4 評(píng)價(jià)方法
2.5 本章小結(jié)
第三章 基于密令位置信息的問(wèn)題生成
3.1 研究動(dòng)機(jī)
3.2 融合密令位置信息的問(wèn)題生成模型
3.2.1 密令位置信息表示
3.2.2 句子語(yǔ)義信息編碼
3.2.3 密令位置信息特征抽取
3.2.4 門控注意力解碼層
3.3 實(shí)驗(yàn)及結(jié)果分析
3.3.1 語(yǔ)料配置
3.3.2 實(shí)驗(yàn)配置
3.3.3 參數(shù)配置
3.3.4 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第四章 基于疑問(wèn)詞識(shí)別的問(wèn)題生成方法
4.1 研究動(dòng)機(jī)
4.2 基于疑問(wèn)詞識(shí)別的問(wèn)題生成
4.2.1 基于密令的疑問(wèn)詞預(yù)測(cè)模型
4.2.2 端到端的問(wèn)題生成模型
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 語(yǔ)料配置
4.3.2 實(shí)驗(yàn)配置
4.3.3 評(píng)價(jià)方法
4.3.4 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第五章 基于雙向注意力機(jī)制的問(wèn)題生成網(wǎng)絡(luò)
5.1 研究動(dòng)機(jī)
5.2 基于指針網(wǎng)絡(luò)的問(wèn)題生成
5.2.1 注意力機(jī)制獲取上下文信息
5.2.2 基于指針網(wǎng)絡(luò)的問(wèn)題生成模型
5.3 基于雙向注意力機(jī)制的問(wèn)題生成方法
5.4 實(shí)驗(yàn)配置與分析
5.4.1 實(shí)驗(yàn)配置
5.4.2 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀學(xué)位期間公開發(fā)表的論文
致謝
本文編號(hào):3742950
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.2.1 文本生成研究現(xiàn)狀
1.2.2 問(wèn)題生成的研究現(xiàn)狀
1.3 問(wèn)題生成現(xiàn)有研究中存在的問(wèn)題
1.4 本文的研究?jī)?nèi)容和組織結(jié)構(gòu)
第二章 問(wèn)題生成概述
2.1 問(wèn)題生成方法
2.2 端到端模型
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 編碼-解碼過(guò)程
2.3 語(yǔ)料概述
2.4 評(píng)價(jià)方法
2.5 本章小結(jié)
第三章 基于密令位置信息的問(wèn)題生成
3.1 研究動(dòng)機(jī)
3.2 融合密令位置信息的問(wèn)題生成模型
3.2.1 密令位置信息表示
3.2.2 句子語(yǔ)義信息編碼
3.2.3 密令位置信息特征抽取
3.2.4 門控注意力解碼層
3.3 實(shí)驗(yàn)及結(jié)果分析
3.3.1 語(yǔ)料配置
3.3.2 實(shí)驗(yàn)配置
3.3.3 參數(shù)配置
3.3.4 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第四章 基于疑問(wèn)詞識(shí)別的問(wèn)題生成方法
4.1 研究動(dòng)機(jī)
4.2 基于疑問(wèn)詞識(shí)別的問(wèn)題生成
4.2.1 基于密令的疑問(wèn)詞預(yù)測(cè)模型
4.2.2 端到端的問(wèn)題生成模型
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 語(yǔ)料配置
4.3.2 實(shí)驗(yàn)配置
4.3.3 評(píng)價(jià)方法
4.3.4 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第五章 基于雙向注意力機(jī)制的問(wèn)題生成網(wǎng)絡(luò)
5.1 研究動(dòng)機(jī)
5.2 基于指針網(wǎng)絡(luò)的問(wèn)題生成
5.2.1 注意力機(jī)制獲取上下文信息
5.2.2 基于指針網(wǎng)絡(luò)的問(wèn)題生成模型
5.3 基于雙向注意力機(jī)制的問(wèn)題生成方法
5.4 實(shí)驗(yàn)配置與分析
5.4.1 實(shí)驗(yàn)配置
5.4.2 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀學(xué)位期間公開發(fā)表的論文
致謝
本文編號(hào):3742950
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3742950.html
最近更新
教材專著