基于蟻群算法優(yōu)化隨機森林模型的汽車保險欺詐識別研究
本文關鍵詞: 汽車保險欺詐 平衡隨機森林 蟻群優(yōu)化算法 啟發(fā)式信息 出處:《保險研究》2017年06期 論文類型:期刊論文
【摘要】:汽車保險欺詐在全球范圍內逐步蔓延,車險欺詐識別越來越受到社會關注。本文針對實際汽車保險索賠數(shù)據(jù)中樣本數(shù)量大且不平衡的特點,提出了平衡隨機森林和蟻群結合的組合分類器。首先,對高維、不平衡的車險索賠數(shù)據(jù)集進行特征選擇與分類,將隨機森林的特征重要性評價得分和數(shù)據(jù)的統(tǒng)計檢驗得分作為啟發(fā)式信息,利用蟻群算法進行智能搜索,把隨機森林的分類精度反饋給蟻群進行信息素的實時更新,挖掘出判別車險欺詐的特征組合。然后將基于蟻群優(yōu)化算法的平衡隨機森林模型應用到汽車保險欺詐識別中。研究結果表明:基于蟻群優(yōu)化隨機森林算法的汽車保險欺詐識別模型能夠更好地對車險索賠數(shù)據(jù)進行分類預測,挖掘車險欺詐規(guī)律,具有更好的精確度和穩(wěn)健性。
[Abstract]:Automobile insurance fraud is gradually spreading all over the world, and the identification of vehicle insurance fraud has attracted more and more attention. This paper aims at the large sample size and unbalanced characteristics of the actual vehicle insurance claim data. A combination classifier of balanced random forest and ant colony is proposed. Firstly, the high dimensional and unbalanced vehicle insurance claim data sets are selected and classified. The evaluation score of feature importance of random forest and the statistical test score of data are taken as heuristic information, and the ant colony algorithm is used to carry out intelligent search. The classification accuracy of random forest is fed back to ant colony to update pheromone in real time. Then the balanced stochastic forest model based on ant colony optimization algorithm is applied to vehicle insurance fraud identification. The research results show that:. The vehicle insurance fraud identification model based on ant colony optimization stochastic forest algorithm can better classify and predict vehicle insurance claim data. Mining vehicle insurance fraud law, with better accuracy and robustness.
【作者單位】: 山東科技大學數(shù)學與系統(tǒng)科學學院統(tǒng)計系;
【基金】:國家自然科學基金項目“基于結構化大數(shù)據(jù)深度挖掘的非壽險保險公司經營風險模型研究”(61502280);國家自然科學基金面上項目“擴展邏輯Petri網(wǎng)理論及其在跨組織業(yè)務過程協(xié)同中的應用研究”(61472228) 山東省自然科學基金面上項目“擴展邏輯工作流網(wǎng)理論及其在組織間業(yè)務過程協(xié)同中的應用研究”(ZR2014FM009) 山東科技大學研究生科技創(chuàng)新項目“基于數(shù)據(jù)挖掘技術的非壽險公司客戶價值和風險管理研究”(SDKDYC170341)
【分類號】:F842.634;TP18
【正文快照】: 一、引言近年來,保險行業(yè)呈蓬勃發(fā)展之勢。2015年,我國保險行業(yè)推動服務能力提升和轉型升級,在經濟增速放緩的環(huán)境中一枝獨秀。中國已成為全球第三大保險市場,行業(yè)發(fā)展規(guī)模僅次于美國和日本。但是,隨之而來的保險欺詐事件也逐漸增多,其中以車險行業(yè)的欺詐現(xiàn)象最為嚴重。數(shù)據(jù)顯
【相似文獻】
相關期刊論文 前10條
1 劉足華;熊惠霖;;基于隨機森林的目標檢測與定位[J];計算機工程;2012年13期
2 董師師;黃哲學;;隨機森林理論淺析[J];集成技術;2013年01期
3 王象剛;;基于K均值隨機森林快速算法及入侵檢測中的應用[J];科技通報;2013年08期
4 陳姝;彭小寧;;基于粒子濾波和在線隨機森林分類的目標跟蹤[J];江蘇大學學報(自然科學版);2014年02期
5 羅知林;陳挺;蔡皖東;;一個基于隨機森林的微博轉發(fā)預測算法[J];計算機科學;2014年04期
6 王麗婷;丁曉青;方馳;;基于隨機森林的人臉關鍵點精確定位方法[J];清華大學學報(自然科學版);2009年04期
7 李建更;高志坤;;隨機森林針對小樣本數(shù)據(jù)類權重設置[J];計算機工程與應用;2009年26期
8 張建;武東英;劉慧生;;基于隨機森林的流量分類方法[J];信息工程大學學報;2012年05期
9 吳華芹;;基于訓練集劃分的隨機森林算法[J];科技通報;2013年10期
10 張華偉;王明文;甘麗新;;基于隨機森林的文本分類模型研究[J];山東大學學報(理學版);2006年03期
相關會議論文 前7條
1 謝程利;王金橋;盧漢清;;核森林及其在目標檢測中的應用[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學討論會論文集[C];2008年
3 張?zhí)忑?梁龍;王康;李華;;隨機森林結合激光誘導擊穿光譜技術用于的鋼鐵分類[A];中國化學會第29屆學術年會摘要集——第19分會:化學信息學與化學計量學[C];2014年
4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉嬓шP系研究[A];第十一屆全國計算(機)化學學術會議論文摘要集[C];2011年
5 張濤;李貞子;武曉巖;李康;;隨機森林回歸分析方法及在代謝組學中的應用[A];2011年中國衛(wèi)生統(tǒng)計學年會會議論文集[C];2011年
6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應用[A];第八屆全國轉子動力學學術討論會論文集[C];2008年
7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機)化學學術會議論文摘要集[C];2009年
相關博士學位論文 前6條
1 張乾;基于隨機森林的視覺數(shù)據(jù)分類關鍵技術研究[D];華南理工大學;2016年
2 薛小明;基于時頻分析與特征約簡的水電機組故障診斷方法研究[D];華中科技大學;2016年
3 曹正鳳;隨機森林算法優(yōu)化研究[D];首都經濟貿易大學;2014年
4 雷震;隨機森林及其在遙感影像處理中應用研究[D];上海交通大學;2012年
5 岳明;基于隨機森林和規(guī)則集成法的酒類市場預測與發(fā)展戰(zhàn)略[D];天津大學;2008年
6 李書艷;單點氨基酸多態(tài)性與疾病相關關系的預測及其機制研究[D];蘭州大學;2010年
相關碩士學位論文 前10條
1 錢維;藥品不良反應監(jiān)測中隨機森林方法的建立與實現(xiàn)[D];第二軍醫(yī)大學;2012年
2 韓燕龍;基于隨機森林的指數(shù)化投資組合構建研究[D];華南理工大學;2015年
3 賀捷;隨機森林在文本分類中的應用[D];華南理工大學;2015年
4 張文婷;交通環(huán)境下基于改進霍夫森林的目標檢測與跟蹤[D];華南理工大學;2015年
5 李強;基于多視角特征融合與隨機森林的蛋白質結晶預測[D];南京理工大學;2015年
6 朱玟謙;一種收斂性隨機森林在人臉檢測中的應用研究[D];武漢理工大學;2015年
7 肖宇;基于序列圖像的手勢檢測與識別算法研究[D];電子科技大學;2014年
8 李慧;一種改進的隨機森林并行分類方法在運營商大數(shù)據(jù)的應用[D];電子科技大學;2015年
9 趙亞紅;面向多類標分類的隨機森林算法研究[D];哈爾濱工業(yè)大學;2014年
10 黎成;基于隨機森林和ReliefF的致病SNP識別方法[D];西安電子科技大學;2014年
,本文編號:1475218
本文鏈接:http://www.sikaile.net/jingjilunwen/bxjjlw/1475218.html