基于詞典擴(kuò)充的電力客服工單情感傾向性分析
發(fā)布時(shí)間:2020-02-19 00:23
【摘要】:為了有效提高電力企業(yè)客戶滿意度及主動(dòng)服務(wù)意識(shí),結(jié)合電力客服工單文本特征,構(gòu)建了電力客服工單情感分析模型。先通過TF-IDF思想進(jìn)行工單關(guān)鍵詞提取,采用word2vec訓(xùn)練得出每個(gè)詞語的詞向量,通過計(jì)算余弦相似度將高相似領(lǐng)域詞匯擴(kuò)充到情感詞典,再進(jìn)行工單傾向性分析及文本分類。通過實(shí)驗(yàn)分析驗(yàn)證該方法的有效性,實(shí)驗(yàn)結(jié)果表明,相較于原始情感詞典,進(jìn)行詞典擴(kuò)充及工單情感傾向性分析方法更具優(yōu)勢(shì),準(zhǔn)確率更高,可為電力企業(yè)客戶關(guān)系管理提供一定的參考。
【圖文】:
肭?N-1個(gè)詞相關(guān),其原理示意圖如圖1所示。圖1中,最下方的wt-1,wt-2,,wt-n+1為前N-1個(gè)輸入詞,并根據(jù)其預(yù)測(cè)下一個(gè)詞wt,每個(gè)輸入詞被映射為一個(gè)向量,C(wt-1)為詞語wt-1的詞向量。網(wǎng)絡(luò)的第一層(輸入層)為輸入詞語組成的(n-1)m維向量x;網(wǎng)絡(luò)第二層(隱藏層)計(jì)算Hx+d,d為偏置因子,使用激活函數(shù)tanh;網(wǎng)絡(luò)第三層(輸出層)包含|V|個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)yi表示下一詞i的未歸一化log概率,并使用softmax激活函數(shù)將輸出值y歸一化,最后使用隨機(jī)梯度下降法對(duì)模型進(jìn)行優(yōu)化。圖1NNLM原理模型圖模型的目標(biāo)函數(shù)為:f(w)t,wt-1,,wt-n+2,wt-n+1=p(|)wtwt-11需要滿足的約束條件為:f(w)t,wt-1,,wt-n+2,wt-n+1>0∑i=1|V|f(i,w)t-1,,wt-n+2,wt-n+1=12電力客服工單情感分析模型本文以某電力公司客服工單數(shù)據(jù)為研究對(duì)象,在深入理解電力業(yè)務(wù)及工單文本語義特點(diǎn)的基礎(chǔ)上,建立了一種電力客服工單情感分析模型。首先,在進(jìn)行文本預(yù)處理的基礎(chǔ)上,對(duì)文本進(jìn)行分詞處理并且完成關(guān)鍵詞提取;然后,采用word2vec訓(xùn)練工單數(shù)據(jù),并基于關(guān)鍵詞進(jìn)行情感詞典擴(kuò)充,構(gòu)建電力客服領(lǐng)域?qū)S们楦性~典;最后,進(jìn)行工單情感傾向性分析。2.1工單文本預(yù)處理由于工單文本數(shù)據(jù)中存在大量價(jià)值含量較低甚至沒有價(jià)值意義的數(shù)據(jù),在進(jìn)行分詞、情感分析中會(huì)對(duì)結(jié)果產(chǎn)生較大的影響,那么在文本挖掘之前就必須先進(jìn)行文本預(yù)處理,去除大量沒有挖掘意義的工單數(shù)據(jù)。工單文本預(yù)處理工作主要包括:刪除未標(biāo)注業(yè)務(wù)類型數(shù)據(jù)、分句處理、文本去重、短句刪除等。分句處理:將工單數(shù)據(jù)處理成以句子為最小單位,以句尾標(biāo)點(diǎn)符號(hào)為標(biāo)志分割,包括“,”,“!?
第11期吳和海,等:一種適用于機(jī)組組合優(yōu)化的改進(jìn)整數(shù)編碼粒子群算法右。這是由于本文采用修復(fù)策略對(duì)不可行粒子進(jìn)行修復(fù),使算法只在可行解區(qū)域內(nèi)搜索最優(yōu)解,有效提高收斂速度;同時(shí)相比二進(jìn)制編碼,本文的整數(shù)編碼方式能有效提高粒子群算法的搜索效率。因此本文提出的整數(shù)編碼粒子群算法更適用于求解大規(guī)模機(jī)組組合問題。圖4不同機(jī)組規(guī)模的執(zhí)行時(shí)間曲線4結(jié)語本文采用整數(shù)編碼粒子群算法來求解機(jī)組組合問題。通過整數(shù)編碼方式,用正負(fù)整數(shù)分別表示機(jī)組開停機(jī)時(shí)間長度,相比于二進(jìn)制編碼它能有效減少待優(yōu)化變量個(gè)數(shù)。求解過程中針對(duì)機(jī)組組合問題的特點(diǎn),采用修補(bǔ)策略處理不滿足約束條件的粒子,使算法只在可行解區(qū)域內(nèi)搜索,通過切除冗余機(jī)組提高解的精度。仿真算例表明,相比rICGA,IPSO,SEP,本文提出的ICPSO算法求解大規(guī)模機(jī)組組合優(yōu)化問題具有更高的精度,求解時(shí)間大幅度減少。參考文獻(xiàn)[1]KAZARLISSA,BAKIRTZISAG,PETRIDISV.Ageneticalgorithmsolutiontotheunitcommitmentproblem[J].IEEEtransactionsonpowersystems,1996,11(1):8392.[2]黎靜華,蘭飛.機(jī)組組合問題的模型及算法綜述[J].現(xiàn)代電力,2011,28(6):110.[3]李丹,高立群,王珂,等.電力系統(tǒng)機(jī)組組合問題的動(dòng)態(tài)雙種群粒子群算法[J].計(jì)算機(jī)應(yīng)用,2008,28(1):104107.[4]張濤,史蘇怡,徐雪琴.基于二進(jìn)制量子粒子群算法的含分布式電源配電網(wǎng)重構(gòu)[J].電力系統(tǒng)保護(hù)與控制,2016,44(4):2228.[5]方源,章桐,陳霏霏,,等.電動(dòng)車動(dòng)力總成噪聲品質(zhì)粒子群向量機(jī)預(yù)測(cè)模型[J].西安交通大學(xué)學(xué)報(bào),2016,50(1):4146.[6]
本文編號(hào):2580854
【圖文】:
肭?N-1個(gè)詞相關(guān),其原理示意圖如圖1所示。圖1中,最下方的wt-1,wt-2,,wt-n+1為前N-1個(gè)輸入詞,并根據(jù)其預(yù)測(cè)下一個(gè)詞wt,每個(gè)輸入詞被映射為一個(gè)向量,C(wt-1)為詞語wt-1的詞向量。網(wǎng)絡(luò)的第一層(輸入層)為輸入詞語組成的(n-1)m維向量x;網(wǎng)絡(luò)第二層(隱藏層)計(jì)算Hx+d,d為偏置因子,使用激活函數(shù)tanh;網(wǎng)絡(luò)第三層(輸出層)包含|V|個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)yi表示下一詞i的未歸一化log概率,并使用softmax激活函數(shù)將輸出值y歸一化,最后使用隨機(jī)梯度下降法對(duì)模型進(jìn)行優(yōu)化。圖1NNLM原理模型圖模型的目標(biāo)函數(shù)為:f(w)t,wt-1,,wt-n+2,wt-n+1=p(|)wtwt-11需要滿足的約束條件為:f(w)t,wt-1,,wt-n+2,wt-n+1>0∑i=1|V|f(i,w)t-1,,wt-n+2,wt-n+1=12電力客服工單情感分析模型本文以某電力公司客服工單數(shù)據(jù)為研究對(duì)象,在深入理解電力業(yè)務(wù)及工單文本語義特點(diǎn)的基礎(chǔ)上,建立了一種電力客服工單情感分析模型。首先,在進(jìn)行文本預(yù)處理的基礎(chǔ)上,對(duì)文本進(jìn)行分詞處理并且完成關(guān)鍵詞提取;然后,采用word2vec訓(xùn)練工單數(shù)據(jù),并基于關(guān)鍵詞進(jìn)行情感詞典擴(kuò)充,構(gòu)建電力客服領(lǐng)域?qū)S们楦性~典;最后,進(jìn)行工單情感傾向性分析。2.1工單文本預(yù)處理由于工單文本數(shù)據(jù)中存在大量價(jià)值含量較低甚至沒有價(jià)值意義的數(shù)據(jù),在進(jìn)行分詞、情感分析中會(huì)對(duì)結(jié)果產(chǎn)生較大的影響,那么在文本挖掘之前就必須先進(jìn)行文本預(yù)處理,去除大量沒有挖掘意義的工單數(shù)據(jù)。工單文本預(yù)處理工作主要包括:刪除未標(biāo)注業(yè)務(wù)類型數(shù)據(jù)、分句處理、文本去重、短句刪除等。分句處理:將工單數(shù)據(jù)處理成以句子為最小單位,以句尾標(biāo)點(diǎn)符號(hào)為標(biāo)志分割,包括“,”,“!?
第11期吳和海,等:一種適用于機(jī)組組合優(yōu)化的改進(jìn)整數(shù)編碼粒子群算法右。這是由于本文采用修復(fù)策略對(duì)不可行粒子進(jìn)行修復(fù),使算法只在可行解區(qū)域內(nèi)搜索最優(yōu)解,有效提高收斂速度;同時(shí)相比二進(jìn)制編碼,本文的整數(shù)編碼方式能有效提高粒子群算法的搜索效率。因此本文提出的整數(shù)編碼粒子群算法更適用于求解大規(guī)模機(jī)組組合問題。圖4不同機(jī)組規(guī)模的執(zhí)行時(shí)間曲線4結(jié)語本文采用整數(shù)編碼粒子群算法來求解機(jī)組組合問題。通過整數(shù)編碼方式,用正負(fù)整數(shù)分別表示機(jī)組開停機(jī)時(shí)間長度,相比于二進(jìn)制編碼它能有效減少待優(yōu)化變量個(gè)數(shù)。求解過程中針對(duì)機(jī)組組合問題的特點(diǎn),采用修補(bǔ)策略處理不滿足約束條件的粒子,使算法只在可行解區(qū)域內(nèi)搜索,通過切除冗余機(jī)組提高解的精度。仿真算例表明,相比rICGA,IPSO,SEP,本文提出的ICPSO算法求解大規(guī)模機(jī)組組合優(yōu)化問題具有更高的精度,求解時(shí)間大幅度減少。參考文獻(xiàn)[1]KAZARLISSA,BAKIRTZISAG,PETRIDISV.Ageneticalgorithmsolutiontotheunitcommitmentproblem[J].IEEEtransactionsonpowersystems,1996,11(1):8392.[2]黎靜華,蘭飛.機(jī)組組合問題的模型及算法綜述[J].現(xiàn)代電力,2011,28(6):110.[3]李丹,高立群,王珂,等.電力系統(tǒng)機(jī)組組合問題的動(dòng)態(tài)雙種群粒子群算法[J].計(jì)算機(jī)應(yīng)用,2008,28(1):104107.[4]張濤,史蘇怡,徐雪琴.基于二進(jìn)制量子粒子群算法的含分布式電源配電網(wǎng)重構(gòu)[J].電力系統(tǒng)保護(hù)與控制,2016,44(4):2228.[5]方源,章桐,陳霏霏,,等.電動(dòng)車動(dòng)力總成噪聲品質(zhì)粒子群向量機(jī)預(yù)測(cè)模型[J].西安交通大學(xué)學(xué)報(bào),2016,50(1):4146.[6]
本文編號(hào):2580854
本文鏈接:http://www.sikaile.net/guanlilunwen/kehuguanxiguanli/2580854.html
最近更新
教材專著