在線教育客服數(shù)據(jù)挖掘與對話機器人設(shè)計
發(fā)布時間:2022-02-09 01:42
在線教育的客服業(yè)務(wù)越來越受到人們重視?头䴓I(yè)務(wù),是在線教育提供商獲取用戶需求,了解用戶體驗情況的重要途徑,也是在線教育提供商及時獲取用戶意見,對產(chǎn)品進行改進的重要參考來源。在工業(yè)界的實際應(yīng)用中,客服業(yè)務(wù)存在兩個問題:在線教育提供商積累了大量客服數(shù)據(jù)。但這些數(shù)據(jù)并沒有得到充分挖掘和利用;目前客服業(yè)務(wù)普遍基于人工,由此帶來客服質(zhì)量不穩(wěn)定、成本高昂等問題,急需自動化客服服務(wù)方式幫助。自然語言處理技術(shù),特別是深度學(xué)習(xí)自然語言處理技術(shù)的進展,給上述問題的解決帶來了希望。本文把自然語言處理技術(shù)應(yīng)用到在線教育的客服業(yè)務(wù)中,以解決上述問題。具體工作如下:(1)對客服數(shù)據(jù)進行了數(shù)據(jù)挖掘,為對話機器人的設(shè)計進行了基礎(chǔ)準備工作,包括:對于網(wǎng)絡(luò)客服咨詢數(shù)據(jù),采用機器學(xué)習(xí)算法對客服文本進行聚類,發(fā)現(xiàn)選課報班咨詢是最常用的客服問題之一。對于電話客服對話數(shù)據(jù),開發(fā)程序,調(diào)用和評估了6種中文商用語音識別系統(tǒng)的語音轉(zhuǎn)文本性能。發(fā)現(xiàn)各系統(tǒng)轉(zhuǎn)寫錯誤率普遍很高。最優(yōu)的阿里語音識別接口錯誤率也達49.55%,其它系統(tǒng)錯誤率均超過60%;設(shè)計了基于機器學(xué)習(xí)、深度學(xué)習(xí)的客服對話分類系統(tǒng),對客服會話文本進行分類,提取選課報班對話語料...
【文章來源】:北京交通大學(xué)北京市211工程院校教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2?CNN的稀疏連接??-
(1)稀疏交互。又稱稀疏連接或稀疏權(quán)重,相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中每一個輸??出單元與每一個輸入單元都產(chǎn)生交互,卷積神經(jīng)網(wǎng)絡(luò)使用卷積核(Kernel)實現(xiàn)輸入??對輸出的影響,如圖2-2、圖2-3所示[33]。對兩張圖來說,每張圖從上往下看,可??以看出每個輸出單元以及對其產(chǎn)生影響的輸入單元個數(shù)的不同。圖2-3說明,在傳??統(tǒng)神經(jīng)網(wǎng)絡(luò)中,每一個輸出單元受到所有輸入單元控制;而在卷積神經(jīng)網(wǎng)絡(luò)中,??在圖2-2卷積核大小為3的情況下,每一個輸入單元僅會對三個輸出單元產(chǎn)生影響。??這一特性使得模型的存儲空間得到極大減少,同時也減少了計算量,提高統(tǒng)計效??率;??0?0???#?Q??0?0?0?0?0??圖2-2?CNN的稀疏連接??Figure?2-2?The?Sparse?Connectivity?of?CNN??14??
0?(Output?Feature?Map):輸出單元。根據(jù)輸入/選擇與之相關(guān)的記憶單兀;??(Response):表示單元。將輸出單元的輸出轉(zhuǎn)換為詞語輸出。??以問答系統(tǒng)為例,一個記憶網(wǎng)絡(luò)的結(jié)構(gòu)可以通過下圖2-5表示[M1:??Feature??Input?Vector??Test?—?>?j?>?G??個??;4??M—y?Slots???y?Feature????Questioii?(? ̄?Vector?:?|??Text?.…——>?〇?—R?Answer??j?Text??圖2-5記憶網(wǎng)絡(luò)結(jié)構(gòu)??Figure?2-5?The?Architecture?of?Memory?Networks??如果所有的構(gòu)件都是神經(jīng)網(wǎng)絡(luò)的話,此時的記憶網(wǎng)絡(luò)稱為記憶神經(jīng)網(wǎng)絡(luò)??(MemoryNeuralNetworks),簡稱MemNN。假設(shè)輸入為一段對話,MemNN的計??算過程如下:??(1)
【參考文獻】:
期刊論文
[1]利用拼音特征的深度學(xué)習(xí)文本分類模型[J]. 趙博軒,房寧,趙群飛,張朋柱. 高技術(shù)通訊. 2017(07)
[2]基于眾包的聊天機器人的研究[J]. 鄭曉霞,呂游,鄧紅,劉向春,張艷艷,李艷波,吳長偉,齊浩亮,馬東宇. 信息技術(shù). 2017(04)
[3]海量信息下的文本分類研究與優(yōu)化[J]. 劉威,邵劍飛,張磊磊. 新技術(shù)新工藝. 2017(02)
[4]不同情境下中文文本分類模型的表現(xiàn)及選擇[J]. 蘭秋軍,李衛(wèi)康,劉文星. 湖南大學(xué)學(xué)報(自然科學(xué)版). 2016(04)
碩士論文
[1]一種網(wǎng)絡(luò)聊天機器人的研究與實現(xiàn)[D]. 董永漢.浙江大學(xué) 2017
[2]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學(xué) 2016
[3]基于ALICE的研究生招生咨詢智能聊天機器人研究與實現(xiàn)[D]. 馮德虎.西南交通大學(xué) 2013
[4]中文文本分類關(guān)鍵技術(shù)研究與實現(xiàn)[D]. 何鐘莉.西安電子科技大學(xué) 2009
本文編號:3616144
【文章來源】:北京交通大學(xué)北京市211工程院校教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2?CNN的稀疏連接??-
(1)稀疏交互。又稱稀疏連接或稀疏權(quán)重,相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中每一個輸??出單元與每一個輸入單元都產(chǎn)生交互,卷積神經(jīng)網(wǎng)絡(luò)使用卷積核(Kernel)實現(xiàn)輸入??對輸出的影響,如圖2-2、圖2-3所示[33]。對兩張圖來說,每張圖從上往下看,可??以看出每個輸出單元以及對其產(chǎn)生影響的輸入單元個數(shù)的不同。圖2-3說明,在傳??統(tǒng)神經(jīng)網(wǎng)絡(luò)中,每一個輸出單元受到所有輸入單元控制;而在卷積神經(jīng)網(wǎng)絡(luò)中,??在圖2-2卷積核大小為3的情況下,每一個輸入單元僅會對三個輸出單元產(chǎn)生影響。??這一特性使得模型的存儲空間得到極大減少,同時也減少了計算量,提高統(tǒng)計效??率;??0?0???#?Q??0?0?0?0?0??圖2-2?CNN的稀疏連接??Figure?2-2?The?Sparse?Connectivity?of?CNN??14??
0?(Output?Feature?Map):輸出單元。根據(jù)輸入/選擇與之相關(guān)的記憶單兀;??(Response):表示單元。將輸出單元的輸出轉(zhuǎn)換為詞語輸出。??以問答系統(tǒng)為例,一個記憶網(wǎng)絡(luò)的結(jié)構(gòu)可以通過下圖2-5表示[M1:??Feature??Input?Vector??Test?—?>?j?>?G??個??;4??M—y?Slots???y?Feature????Questioii?(? ̄?Vector?:?|??Text?.…——>?〇?—R?Answer??j?Text??圖2-5記憶網(wǎng)絡(luò)結(jié)構(gòu)??Figure?2-5?The?Architecture?of?Memory?Networks??如果所有的構(gòu)件都是神經(jīng)網(wǎng)絡(luò)的話,此時的記憶網(wǎng)絡(luò)稱為記憶神經(jīng)網(wǎng)絡(luò)??(MemoryNeuralNetworks),簡稱MemNN。假設(shè)輸入為一段對話,MemNN的計??算過程如下:??(1)
【參考文獻】:
期刊論文
[1]利用拼音特征的深度學(xué)習(xí)文本分類模型[J]. 趙博軒,房寧,趙群飛,張朋柱. 高技術(shù)通訊. 2017(07)
[2]基于眾包的聊天機器人的研究[J]. 鄭曉霞,呂游,鄧紅,劉向春,張艷艷,李艷波,吳長偉,齊浩亮,馬東宇. 信息技術(shù). 2017(04)
[3]海量信息下的文本分類研究與優(yōu)化[J]. 劉威,邵劍飛,張磊磊. 新技術(shù)新工藝. 2017(02)
[4]不同情境下中文文本分類模型的表現(xiàn)及選擇[J]. 蘭秋軍,李衛(wèi)康,劉文星. 湖南大學(xué)學(xué)報(自然科學(xué)版). 2016(04)
碩士論文
[1]一種網(wǎng)絡(luò)聊天機器人的研究與實現(xiàn)[D]. 董永漢.浙江大學(xué) 2017
[2]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學(xué) 2016
[3]基于ALICE的研究生招生咨詢智能聊天機器人研究與實現(xiàn)[D]. 馮德虎.西南交通大學(xué) 2013
[4]中文文本分類關(guān)鍵技術(shù)研究與實現(xiàn)[D]. 何鐘莉.西安電子科技大學(xué) 2009
本文編號:3616144
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3616144.html
最近更新
教材專著