客戶(hù)流失預(yù)測(cè)模型研究及其應(yīng)用
本文選題:客戶(hù)流失 + 預(yù)測(cè) ; 參考:《西北大學(xué)》2017年碩士論文
【摘要】:隨著全球的商業(yè)競(jìng)爭(zhēng)愈來(lái)愈激烈,客戶(hù)流失預(yù)測(cè)已經(jīng)成為客戶(hù)關(guān)系管理中非常重要的內(nèi)容。預(yù)測(cè)即將流失的客戶(hù),并制定相應(yīng)的措施挽留客戶(hù)已經(jīng)成為促進(jìn)企業(yè)發(fā)展的關(guān)鍵性因素。本文從對(duì)電信和信用卡客戶(hù)的行為數(shù)據(jù)分析入手,針對(duì)其中的冗余特征和正負(fù)類(lèi)樣本不均衡等特點(diǎn),提出一種新的特征選擇算法和非均衡數(shù)據(jù)處理算法,以此建立一種新的客戶(hù)流失預(yù)測(cè)模型。本文的主要工作內(nèi)容如下:1.針對(duì)客戶(hù)信息數(shù)據(jù)量大且特征冗余的問(wèn)題,提出一種多指標(biāo)融合的mRMR特征選擇算法(MIF-mRMR)。該算法對(duì)mRMR算法進(jìn)行改進(jìn),將馬氏距離和最大信息系數(shù)相結(jié)合來(lái)綜合評(píng)定特征和類(lèi)別、特征和特征之間的相關(guān)性。實(shí)驗(yàn)結(jié)果證明,該算法所選擇的特征子集維度較小,且與mRMR算法相比準(zhǔn)確率提高3%左右。2.針對(duì)客戶(hù)數(shù)據(jù)中流失客戶(hù)與正?蛻(hù)比例相差較大的問(wèn)題,提出一種基于邊界混合采樣的非均衡數(shù)據(jù)處理算法(BMS)。該方法首先通過(guò)引進(jìn)“變異系數(shù)”找出樣本的邊界域和非邊界域,然后對(duì)邊界域中的少數(shù)類(lèi)樣本進(jìn)行過(guò)采樣處理,非邊界域中的多數(shù)類(lèi)樣本進(jìn)行欠采樣處理,從而實(shí)現(xiàn)原始樣本的均衡化。實(shí)驗(yàn)結(jié)果證明,該算法與其它3種流行的非均衡數(shù)據(jù)處理算法相比均能有效地提升少數(shù)類(lèi)樣本的識(shí)別性能。3.基于以上內(nèi)容,提出一種新的客戶(hù)流失預(yù)測(cè)模型。該模型首先分別使用MIF-mRMR算法和BMS算法對(duì)數(shù)據(jù)進(jìn)行特征選擇和均衡化,然后將均衡化后的數(shù)據(jù)送入SVM、C4.5和隨機(jī)森林3種分類(lèi)器進(jìn)行流失客戶(hù)的預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,使用該模型能夠得到較好的客戶(hù)流失預(yù)測(cè)結(jié)果,同時(shí)SVM分類(lèi)器相較其他兩種分類(lèi)器更適合客戶(hù)流失預(yù)測(cè)的研究。
[Abstract]:With the global business competition becoming more and more fierce, customer churn prediction has become a very important part of customer relationship management. It is a key factor to promote the development of enterprises to predict the customers that will soon be lost and to formulate corresponding measures to retain them. Based on the analysis of behavior data of telecom and credit card customers, a new feature selection algorithm and unbalanced data processing algorithm are proposed in this paper. Based on this, a new customer churn prediction model is established. The main work of this paper is as follows: 1. Aiming at the problem of large amount of data and redundant features of customer information, a multi-index fusion mRMR feature selection algorithm (MIF-mRMRA) is proposed. The algorithm improves the mRMR algorithm and combines Markov distance with the maximum information coefficient to evaluate the correlation between features and categories, features and features. Experimental results show that the feature subset dimension chosen by the algorithm is small and the accuracy of the proposed algorithm is about 3% higher than that of mRMR algorithm. In order to solve the problem that the ratio of customer loss and normal customer is different from that of normal customer, a non-equilibrium data processing algorithm based on boundary mixed sampling is proposed. First, the "coefficient of variation" is introduced to find out the boundary and non-boundary regions of the samples, then a few kinds of samples in the boundary domain are oversampled, and most of the samples in the non-boundary domain are under-sampled. In order to realize the equalization of the original samples. Experimental results show that the proposed algorithm can effectively improve the recognition performance of a small number of samples compared with the other three popular unbalanced data processing algorithms. Based on the above, a new customer churn prediction model is proposed. The model firstly uses MIF-mRMR algorithm and BMS algorithm to select and equalize the data, and then the equalized data are sent into SVMC4.5 and random forest classifier to predict the loss of customers. The experimental results show that the model can get better customer churn prediction results, and the SVM classifier is more suitable for customer churn prediction than the other two classifiers.
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:F274;TP301.6
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 V.庫(kù)馬爾;;美國(guó)公司如何避免客戶(hù)流失[J];IT時(shí)代周刊;2010年11期
2 李睿仙;龐潔;胡建華;王清心;汪偉;;一種基于電信客戶(hù)流失預(yù)警的解決方案[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年02期
3 夏國(guó)恩;邵培基;;改進(jìn)的支持向量分類(lèi)機(jī)在客戶(hù)流失預(yù)測(cè)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2009年06期
4 夏國(guó)恩;;基于簡(jiǎn)易支持向量機(jī)的客戶(hù)流失預(yù)測(cè)研究[J];計(jì)算機(jī)應(yīng)用研究;2010年03期
5 于小兵;曹杰;鞏在武;;客戶(hù)流失問(wèn)題研究綜述[J];計(jì)算機(jī)集成制造系統(tǒng);2012年10期
6 丁旭;電信大客戶(hù)流失原因分析及對(duì)策[J];現(xiàn)代電信科技;2003年01期
7 孔f3;探究電信行業(yè)客戶(hù)流失[J];信息網(wǎng)絡(luò);2004年01期
8 牛琨;張舒博;;基于數(shù)據(jù)挖掘技術(shù)的電信業(yè)客戶(hù)流失管理框架[J];電信工程技術(shù)與標(biāo)準(zhǔn)化;2006年01期
9 ;貼身咨詢(xún)助營(yíng)銷(xiāo)精準(zhǔn)實(shí)施——北京移動(dòng)成功化解拍照客戶(hù)流失危機(jī)[J];每周電腦報(bào);2007年25期
10 蔣盛益;王連喜;;面向電信的客戶(hù)流失預(yù)測(cè)模型研究[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2011年05期
相關(guān)會(huì)議論文 前10條
1 司學(xué)峰;蔣國(guó)瑞;李英毅;;基于數(shù)據(jù)挖掘技術(shù)的客戶(hù)流失預(yù)測(cè)研究綜述[A];第三屆中國(guó)智能計(jì)算大會(huì)論文集[C];2009年
2 李紅霞;;電信客戶(hù)流失與客戶(hù)保持分析[A];中國(guó)企業(yè)運(yùn)籌學(xué)[C];2009年
3 張俊巍;;電信行業(yè)客戶(hù)流失管理模型淺析[A];黑龍江省通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2005年
4 段巍巍;;電信客戶(hù)流失預(yù)測(cè)主題建模[A];第十屆中國(guó)科協(xié)年會(huì)信息化與社會(huì)發(fā)展學(xué)術(shù)討論會(huì)分會(huì)場(chǎng)論文集[C];2008年
5 張海波;趙煥成;;電信移動(dòng)客戶(hù)流失的預(yù)測(cè)模型——基于社會(huì)網(wǎng)絡(luò)分析的實(shí)證研究[A];21世紀(jì)數(shù)量經(jīng)濟(jì)學(xué)(第11卷)[C];2010年
6 蘇小龍;;基于消費(fèi)行為認(rèn)知的固網(wǎng)大客戶(hù)流失研究[A];中國(guó)創(chuàng)新與企業(yè)成長(zhǎng)(CI&G)2013年度會(huì)議論文集[C];2013年
7 余力濤;黨延忠;楊光飛;;基于遷移學(xué)習(xí)的客戶(hù)流失預(yù)測(cè)模型[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)——商務(wù)智能分會(huì)場(chǎng)論文集[C];2011年
8 李保升;陸煒?lè)f;呂廷杰;;移動(dòng)客戶(hù)流失預(yù)測(cè)模型研究[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
9 柳炳祥;盛昭翰;;一種基于Rough集的客戶(hù)流失風(fēng)險(xiǎn)分析方法[A];2002年中國(guó)管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年
10 李萍;齊佳音;舒華英;;歸因理論在移動(dòng)客戶(hù)流失管理中的應(yīng)用探討[A];全國(guó)第八屆工業(yè)工程與企業(yè)信息化學(xué)術(shù)會(huì)議論文集[C];2004年
相關(guān)重要報(bào)紙文章 前10條
1 冰藍(lán);如何防止客戶(hù)流失[N];電腦商報(bào);2005年
2 ;揭開(kāi)客戶(hù)流失真相[N];計(jì)算機(jī)世界;2005年
3 吳U,
本文編號(hào):1864433
本文鏈接:http://www.sikaile.net/guanlilunwen/kehuguanxiguanli/1864433.html