面向任務(wù)的對話狀態(tài)追蹤方法及應(yīng)用
發(fā)布時間:2021-01-24 21:07
對話狀態(tài)追蹤是面向任務(wù)的多輪對話系統(tǒng)中的重要組成部分,旨在根據(jù)對話上下文估計每輪對話中的用戶目標(biāo)和請求,為對話決策提供決策依據(jù)。傳統(tǒng)的對話狀態(tài)追蹤方法將口語理解的結(jié)果作為對話狀態(tài)追蹤模塊的輸入,存在誤差傳遞的問題;并且隨著用戶與系統(tǒng)的對話輪次不斷增加,傳統(tǒng)方法在新槽值和罕見槽值的識別上難以達(dá)到較高的準(zhǔn)確率。本文為改善這些缺點,設(shè)計了基于神經(jīng)網(wǎng)絡(luò)的狀態(tài)追蹤方法,并對對話狀態(tài)追蹤模型在知識驅(qū)動對話系統(tǒng)中的重要作用進(jìn)行了探究。為了解決多輪對話系統(tǒng)中新槽值及罕見槽值的識別問題,本文提出了基于局部槽特征的模型。該模型將局部的槽信息作為特征,借助注意力機(jī)制與LSTM(Long Short-Term Memory,長短期記憶網(wǎng)絡(luò))在不同槽信息的基礎(chǔ)上學(xué)習(xí)用戶當(dāng)前輸入、上一輪系統(tǒng)動作及候選槽值的特征表示,模型利用學(xué)習(xí)到的表示對候選的槽值進(jìn)行評估,從而生成對話狀態(tài)。該模型在兩個公開數(shù)據(jù)集上進(jìn)行了實驗,實驗結(jié)果表明,本文提出的模型在兩個狀態(tài)追蹤數(shù)據(jù)集上都有較好的識別準(zhǔn)確率及較快的運行速度。該模型簡單有效并能在不同槽信息的環(huán)境下學(xué)習(xí)到每個槽的特征,有利于罕見槽值和新槽值的識別。針對上述模型中對所有候選槽值建...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
人機(jī)對話系統(tǒng)組成部分[1]152對話管理由對話狀態(tài)追蹤(DialogueStateTracker,DST)和對話策略
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-21-新槽值及罕見槽值的識別。在LSDST模型架構(gòu)中,如圖3-1所示,模型中包括編碼模塊及評估模塊,首先將用戶的當(dāng)前輸入、系統(tǒng)上一輪動作以及所有的候選槽值對送入到基于不同槽信息的編碼器中,并結(jié)合注意力機(jī)制獲得上下文的向量表示(c,h)。再將該表示作為狀態(tài)評估模塊的輸入,結(jié)合系統(tǒng)動作評估模塊及用戶話語評估模塊為每個候選槽值對進(jìn)行打分。圖3-1LSDST模型示意圖LSDST+SU模型在LSDST模型的基礎(chǔ)上,引入了對話歷史信息,利用編碼模塊對上一輪的系統(tǒng)回復(fù)文本進(jìn)行編碼,并在狀態(tài)評估模塊與用戶輸入信息聯(lián)合建模,實現(xiàn)對候選槽值的打分,與如圖3-2所示。圖3-2LSDST+SU模型示意圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-21-新槽值及罕見槽值的識別。在LSDST模型架構(gòu)中,如圖3-1所示,模型中包括編碼模塊及評估模塊,首先將用戶的當(dāng)前輸入、系統(tǒng)上一輪動作以及所有的候選槽值對送入到基于不同槽信息的編碼器中,并結(jié)合注意力機(jī)制獲得上下文的向量表示(c,h)。再將該表示作為狀態(tài)評估模塊的輸入,結(jié)合系統(tǒng)動作評估模塊及用戶話語評估模塊為每個候選槽值對進(jìn)行打分。圖3-1LSDST模型示意圖LSDST+SU模型在LSDST模型的基礎(chǔ)上,引入了對話歷史信息,利用編碼模塊對上一輪的系統(tǒng)回復(fù)文本進(jìn)行編碼,并在狀態(tài)評估模塊與用戶輸入信息聯(lián)合建模,實現(xiàn)對候選槽值的打分,與如圖3-2所示。圖3-2LSDST+SU模型示意圖
【參考文獻(xiàn)】:
博士論文
[1]基于級聯(lián)神經(jīng)網(wǎng)絡(luò)的對話狀態(tài)追蹤技術(shù)研究與實現(xiàn)[D]. 楊國花.北京郵電大學(xué) 2019
本文編號:2997933
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
人機(jī)對話系統(tǒng)組成部分[1]152對話管理由對話狀態(tài)追蹤(DialogueStateTracker,DST)和對話策略
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-21-新槽值及罕見槽值的識別。在LSDST模型架構(gòu)中,如圖3-1所示,模型中包括編碼模塊及評估模塊,首先將用戶的當(dāng)前輸入、系統(tǒng)上一輪動作以及所有的候選槽值對送入到基于不同槽信息的編碼器中,并結(jié)合注意力機(jī)制獲得上下文的向量表示(c,h)。再將該表示作為狀態(tài)評估模塊的輸入,結(jié)合系統(tǒng)動作評估模塊及用戶話語評估模塊為每個候選槽值對進(jìn)行打分。圖3-1LSDST模型示意圖LSDST+SU模型在LSDST模型的基礎(chǔ)上,引入了對話歷史信息,利用編碼模塊對上一輪的系統(tǒng)回復(fù)文本進(jìn)行編碼,并在狀態(tài)評估模塊與用戶輸入信息聯(lián)合建模,實現(xiàn)對候選槽值的打分,與如圖3-2所示。圖3-2LSDST+SU模型示意圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-21-新槽值及罕見槽值的識別。在LSDST模型架構(gòu)中,如圖3-1所示,模型中包括編碼模塊及評估模塊,首先將用戶的當(dāng)前輸入、系統(tǒng)上一輪動作以及所有的候選槽值對送入到基于不同槽信息的編碼器中,并結(jié)合注意力機(jī)制獲得上下文的向量表示(c,h)。再將該表示作為狀態(tài)評估模塊的輸入,結(jié)合系統(tǒng)動作評估模塊及用戶話語評估模塊為每個候選槽值對進(jìn)行打分。圖3-1LSDST模型示意圖LSDST+SU模型在LSDST模型的基礎(chǔ)上,引入了對話歷史信息,利用編碼模塊對上一輪的系統(tǒng)回復(fù)文本進(jìn)行編碼,并在狀態(tài)評估模塊與用戶輸入信息聯(lián)合建模,實現(xiàn)對候選槽值的打分,與如圖3-2所示。圖3-2LSDST+SU模型示意圖
【參考文獻(xiàn)】:
博士論文
[1]基于級聯(lián)神經(jīng)網(wǎng)絡(luò)的對話狀態(tài)追蹤技術(shù)研究與實現(xiàn)[D]. 楊國花.北京郵電大學(xué) 2019
本文編號:2997933
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2997933.html
最近更新
教材專著