天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

分類預(yù)測(cè)中正判率的改進(jìn)方法

發(fā)布時(shí)間:2019-09-16 18:45
【摘要】:評(píng)估分類預(yù)測(cè)模型優(yōu)良性的做法是衡量其預(yù)測(cè)準(zhǔn)確度,即正判率。文章從四個(gè)不同角度,構(gòu)建基于混合策略的組合預(yù)測(cè)模型、持續(xù)學(xué)習(xí)的樸素貝葉斯分類器、變量集預(yù)處理、分階段逐步實(shí)施的分類預(yù)測(cè)模型,討論了如何審慎地選擇或以恰當(dāng)?shù)姆绞竭\(yùn)用一種或幾種合適的分類算法,來(lái)有效地提升分類預(yù)測(cè)的正判率。其中,基于混合策略的組合預(yù)測(cè)模型對(duì)正判率的提升幅度明顯,而持續(xù)學(xué)習(xí)的樸素貝葉斯分類器對(duì)模型優(yōu)化也顯得簡(jiǎn)單而有效。
【圖文】:

持續(xù)學(xué)習(xí),優(yōu)化模型


⒌難猗靜⑽幢徊裳猬蜆?測(cè)到。然而,未帶類別標(biāo)注的樣本往往包含有助于分類的信息。通過(guò)一定的策略,選擇出滿足條件的未帶類別標(biāo)注的樣本,把它們加入到當(dāng)前的樣本數(shù)據(jù)集中以達(dá)到提升分類器性能的目的,這被稱為主動(dòng)學(xué)習(xí)的分類模型。胡為成(2007)[3]討論了基于主動(dòng)學(xué)習(xí)的樸素貝葉斯分類器,選用樣本數(shù)據(jù)進(jìn)行測(cè)試后指出,其分類精度明顯優(yōu)于樸素貝葉斯分類器。但文獻(xiàn)[3]中沒(méi)有明示選擇算子和最優(yōu)選擇策略是如何制定的。同樣借鑒主動(dòng)學(xué)習(xí)的思想,本文引入迭代算法,構(gòu)建了一個(gè)持續(xù)學(xué)習(xí)的樸素貝葉斯分類器優(yōu)化模型(如圖1所示):圖1持續(xù)學(xué)習(xí)的樸素貝葉斯分類器優(yōu)化模型步驟1:用當(dāng)前的分類器對(duì)未標(biāo)注數(shù)據(jù)集(可模擬產(chǎn)生,應(yīng)足夠大,譬如是樣本數(shù)據(jù)集的10倍以上)中每一個(gè)樣本進(jìn)行預(yù)測(cè),給出分類,即預(yù)標(biāo)注。步驟2:執(zhí)行迭代算法,在一次迭代中,遍歷未標(biāo)注數(shù)據(jù)集的每一個(gè)樣本,嘗試將該樣本加入到標(biāo)準(zhǔn)數(shù)據(jù)集,檢查和比較正判率的改進(jìn)效果,增量記為Δ=αi(j)-αi-1,這里αi(j)代表第i次迭代中將第j個(gè)樣本加入到標(biāo)準(zhǔn)數(shù)據(jù)集后分類器的正判率,αi-1為此次迭代前分類器的正判率。步驟3:識(shí)別出在一次迭代中使正判率增量最大的那個(gè)樣本(如有多個(gè)取第一個(gè)),永久性地加入到標(biāo)準(zhǔn)數(shù)據(jù)集,并完成對(duì)分類器參數(shù)的修正,此即為最優(yōu)進(jìn)入策略。步驟4:使用修正后的分類器(此時(shí)αi≥αi-1),執(zhí)行下一次迭代。仍然使用案例A的數(shù)據(jù)集進(jìn)行驗(yàn)證,原有的794個(gè)樣本構(gòu)成標(biāo)準(zhǔn)數(shù)據(jù)集,樸素貝葉斯分類器的初始正判率α0=56.3%。模擬產(chǎn)生25000個(gè)樣本構(gòu)成未標(biāo)注數(shù)據(jù)集,使用上述的迭代算法和最優(yōu)進(jìn)入策略,讓樸素貝葉斯分類器通分類細(xì)分1細(xì)分2細(xì)分3細(xì)分4細(xì)分5細(xì)分6總體占比(%)19.322.018.022.38.

效果圖,分類預(yù)測(cè),逐步實(shí)施,分階段


銆門(mén)斜鴟治齔⑹怨菇縟突Ъ壑凳侗鶼低常嘞聳奔俁縝彝?金融資產(chǎn)和收入等涉敏感性信息不可獲得,即普通、中端或高端客戶類型事先不可知。遵循發(fā)展客戶細(xì)分方案時(shí)分階段逐步實(shí)施的思路,本文先將整體市場(chǎng)(即零售銀行客戶)構(gòu)建判別模型預(yù)測(cè)歸入普通、中端和高端客戶三類,正判率為73.5%;然后,針對(duì)三類客戶分別構(gòu)建判別模型預(yù)測(cè)歸入各自細(xì)分群體。最終,這樣分階段逐步實(shí)施的分類預(yù)測(cè)的整體正判率為58.9%,對(duì)比使用同樣預(yù)測(cè)變量集一次實(shí)施的判別分類(整體正判率為57.4%)有更好的預(yù)測(cè)效果率。以上分析過(guò)程及預(yù)測(cè)效果概括在圖2中。事實(shí)上,分階段逐步實(shí)施的分類預(yù)測(cè)不但是一種易于理解的自然做法,而且因在起始階段的預(yù)測(cè)正判率往往較高,后續(xù)階段的錯(cuò)判更多被局限在同屬的大類內(nèi),這樣因錯(cuò)判而對(duì)實(shí)際業(yè)務(wù)發(fā)展帶來(lái)的潛在風(fēng)險(xiǎn)相對(duì)較小,也值得在實(shí)踐中應(yīng)用。此外,在各階段總體和類內(nèi)的分類預(yù)測(cè)分別實(shí)施,這為分析提供了更大的靈活性,每一模型均可依據(jù)最佳的自身可分性在預(yù)測(cè)變量集內(nèi)選擇變量組合去構(gòu)建判別函數(shù)。當(dāng)然,分階段逐步實(shí)施的過(guò)程要復(fù)雜一些。5總結(jié)分類預(yù)測(cè)模型正在不同領(lǐng)域得到廣泛應(yīng)用,模型優(yōu)良性的一個(gè)直觀的評(píng)估指標(biāo)是其預(yù)測(cè)準(zhǔn)確度(即正判率)。本文從四個(gè)不同的角度出發(fā),,討論了如何審慎地選擇或以恰當(dāng)?shù)姆绞竭\(yùn)用一種或幾種合適的分類算法,來(lái)有效地提升分類預(yù)測(cè)的準(zhǔn)確度。其中,基于混合策略的組合預(yù)測(cè)法對(duì)單一方法下預(yù)測(cè)準(zhǔn)確度的提升最為明顯,而持續(xù)學(xué)習(xí)的樸素貝葉斯分類器優(yōu)化模型也顯得簡(jiǎn)單而有效,都有廣闊的應(yīng)用前景。一個(gè)分類預(yù)測(cè)模型效果的持續(xù)改進(jìn),需要深刻地領(lǐng)悟算法的實(shí)質(zhì)、以及背后隱藏的關(guān)鍵成功因素,在實(shí)際應(yīng)用中還需確保系統(tǒng)運(yùn)行的高效。參考文獻(xiàn):[1][奧地利]DietmarJannach,AlexanderFelfe
【作者單位】: 北京特恩斯市場(chǎng)研究咨詢有限公司;
【分類號(hào)】:O211.67

【相似文獻(xiàn)】

相關(guān)期刊論文 前2條

1 楊小平;;二分Logistic模型在分類預(yù)測(cè)中的應(yīng)用分析[J];四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期

2 ;[J];;年期

相關(guān)會(huì)議論文 前1條

1 沈杰;李衛(wèi)華;唐峗;;一種基于化合物子結(jié)構(gòu)模式識(shí)別的分類預(yù)測(cè)方法[A];中國(guó)化學(xué)會(huì)第27屆學(xué)術(shù)年會(huì)第15分會(huì)場(chǎng)摘要集[C];2010年

相關(guān)博士學(xué)位論文 前1條

1 劉惠;蛋白質(zhì)序列數(shù)據(jù)的分類預(yù)測(cè)研究[D];上海交通大學(xué);2007年

相關(guān)碩士學(xué)位論文 前6條

1 張吉寬;蛋白質(zhì)熱穩(wěn)定性分類預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];遼寧大學(xué);2016年

2 安俊峰;游戲評(píng)價(jià)數(shù)據(jù)的分類預(yù)測(cè)研究[D];東華大學(xué);2014年

3 黃建華;蛋白質(zhì)分類預(yù)測(cè)中的新方法研究[D];南昌大學(xué);2010年

4 石雪娜;基于壓縮感知的蛋白質(zhì)功能分類預(yù)測(cè)[D];北京交通大學(xué);2014年

5 廖旺宇;面向分類預(yù)測(cè)的增量關(guān)聯(lián)規(guī)則應(yīng)用研究[D];四川師范大學(xué);2010年

6 肖芳;工業(yè)產(chǎn)品運(yùn)輸需求分類預(yù)測(cè)理論研究[D];長(zhǎng)安大學(xué);2011年



本文編號(hào):2536364

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/yysx/2536364.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e4853***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com