基于主題模型與變分自編碼的情感對話生成技術(shù)研究
發(fā)布時間:2021-01-30 20:10
人機對話作為人工智能領(lǐng)域的核心技術(shù)之一,以其廣闊的應(yīng)用前景以及誘人的商業(yè)價值備受學(xué)術(shù)界和工業(yè)界的矚目。從早期的Eliza和Parry,到類似Siri的智能個人助手,再到如今的聊天機器人,如小冰,人機對話系統(tǒng)不斷地改變著人們的生活。聊天機器人,旨在通過人機交互中自然、流暢且多樣的對話以滿足人類的交流以及情感陪伴的需求。因此,一個出色的聊天機器人應(yīng)該同時具備智商和情商。然而,現(xiàn)有的對話系統(tǒng)的研究工作主要聚焦于改善句子的質(zhì)量,對于情感的關(guān)注還相對較少。因此,本文主要關(guān)注情感對話生成,該任務(wù)旨在生成蘊含情感且語義流暢的回復(fù),從而實現(xiàn)更加自然的人機交互。近年來,隨著深度學(xué)習(xí)技術(shù)的流行,研究人員逐漸采用seq2seq生成模型來實現(xiàn)對話系統(tǒng),而不僅是依賴基于模板和檢索等方式。因此,本文分別將seq2seq模型與主題模型和變分自編碼器相結(jié)合來提高回復(fù)的相關(guān)性和多樣性,并且在此基礎(chǔ)上融合情感因素,使得模型能夠生成蘊含情感的回答。本文的主要工作如下:1)為了生成蘊含情感且與輸入內(nèi)容相關(guān)的回復(fù),本文將情感因素和主題信息同時與seq2seq模型相結(jié)合,構(gòu)建了一個基于注意力機制的主題增強情感對話生成模型(TE-...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
LsTM結(jié)構(gòu)示意圖t’3]
?ys??圖2.4注意力機制[49】??引入了注意力機制的seq2Seq模型如圖2.4所示,其中編碼器采用了一個雙向??RNN,解碼器則加入了注意力機制。由2.1.2節(jié)的內(nèi)容可知,在模型的解碼階段,??解碼器每一個時刻的隱藏狀態(tài)的計算都需要上下文語義編碼向量c。在傳統(tǒng)的??seq2Seq模型中,只用編碼器最后一個時刻的輸出作為語義編碼向量c,且保持固定??不變,但加入注意力機制之后,每一時刻的c都將各不相同,從而能保證在解碼的不??同時刻,輸入序列中的每一個詞語對當(dāng)前時刻解碼的詞語的貢獻不同。在時刻i,中??間語義向量q可由編碼器輸出的隱藏層向量序列進行加權(quán)求和得到,??如公式2.13所示。??Cj?=?Y7j=\?^ijhj?(公式?2_13)??其中,\的權(quán)重的計算方法如公式2.14所示。??a..?=?exp(T,(hJ-,s,_1))?(公式?214)??11?SLjexpCriChk.s
Twitter?LDA模型的主要思想是每一個文本都僅僅屬于一個主題,并且文本中??的每一個詞是一個背景詞或者是該文本所屬主題的主題詞。Twitter?LDA的模型結(jié)??構(gòu)如圖3.2所示。我們假設(shè)微博中一共具有T個主題,每個主題可以由詞分布表示。??具體地,Twitter?LDA模型首先從表示整個數(shù)據(jù)集的主題分布的狄利克雷先驗分布??Dir(c〇中采樣得到多元分布0。然后,從狄利克雷分布Dir(p)中采樣得到多元分布??23??
本文編號:3009512
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
LsTM結(jié)構(gòu)示意圖t’3]
?ys??圖2.4注意力機制[49】??引入了注意力機制的seq2Seq模型如圖2.4所示,其中編碼器采用了一個雙向??RNN,解碼器則加入了注意力機制。由2.1.2節(jié)的內(nèi)容可知,在模型的解碼階段,??解碼器每一個時刻的隱藏狀態(tài)的計算都需要上下文語義編碼向量c。在傳統(tǒng)的??seq2Seq模型中,只用編碼器最后一個時刻的輸出作為語義編碼向量c,且保持固定??不變,但加入注意力機制之后,每一時刻的c都將各不相同,從而能保證在解碼的不??同時刻,輸入序列中的每一個詞語對當(dāng)前時刻解碼的詞語的貢獻不同。在時刻i,中??間語義向量q可由編碼器輸出的隱藏層向量序列進行加權(quán)求和得到,??如公式2.13所示。??Cj?=?Y7j=\?^ijhj?(公式?2_13)??其中,\的權(quán)重的計算方法如公式2.14所示。??a..?=?exp(T,(hJ-,s,_1))?(公式?214)??11?SLjexpCriChk.s
Twitter?LDA模型的主要思想是每一個文本都僅僅屬于一個主題,并且文本中??的每一個詞是一個背景詞或者是該文本所屬主題的主題詞。Twitter?LDA的模型結(jié)??構(gòu)如圖3.2所示。我們假設(shè)微博中一共具有T個主題,每個主題可以由詞分布表示。??具體地,Twitter?LDA模型首先從表示整個數(shù)據(jù)集的主題分布的狄利克雷先驗分布??Dir(c〇中采樣得到多元分布0。然后,從狄利克雷分布Dir(p)中采樣得到多元分布??23??
本文編號:3009512
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3009512.html
最近更新
教材專著