天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于正則化樸素貝葉斯的用戶分類算法的研究

發(fā)布時(shí)間:2020-02-06 01:22
【摘要】:推薦系統(tǒng)在電子商務(wù)和信息推送等場(chǎng)合有十分重要的應(yīng)用,它把訓(xùn)練數(shù)據(jù)中的用戶進(jìn)行預(yù)分類,然后根據(jù)用戶預(yù)分類結(jié)果,判斷一個(gè)具體用戶的個(gè)人偏好并推送個(gè)性化服務(wù)信息,提高了用戶的體驗(yàn)滿意度。樸素貝葉斯分類器具有優(yōu)良的分類性能,已被應(yīng)用在推薦系統(tǒng)的用戶分類中,但由于推薦系統(tǒng)的訓(xùn)練數(shù)據(jù)集存在高維度、不完備等問(wèn)題,導(dǎo)致用戶分類的精度、計(jì)算時(shí)間、抗噪音干擾等性能不佳。針對(duì)這些問(wèn)題,本文研究使用Shrinkage正則化技術(shù)改進(jìn)樸素貝葉斯分類算法,提出正則化樸素貝葉斯用戶分類算法,主要研究?jī)?nèi)容如下:高斯樸素貝葉斯相當(dāng)于一個(gè)對(duì)角協(xié)方差的樸素貝葉斯分類器,一定程度上減弱樣本屬性條件獨(dú)立假設(shè)對(duì)分類結(jié)果的負(fù)面影響,但數(shù)據(jù)樣本聯(lián)合概率估計(jì)誤差大的問(wèn)題仍存在。在訓(xùn)練數(shù)據(jù)時(shí),在高斯密度函數(shù)中引入罰因子和Shrinkage正則化方法,自動(dòng)調(diào)整屬性條件的權(quán)重,將非關(guān)鍵屬性的權(quán)重降低,使協(xié)方差估計(jì)值接近原矩陣向量,避免過(guò)擬合,減小樣本聯(lián)合概率估計(jì)的誤差,從而改善算法的分類效果,提高了分類精度。應(yīng)用Adaptive Boosting(Ada Boost)自適應(yīng)提升算法改進(jìn)正則化樸素貝葉斯用戶分類器的精度。首先設(shè)定初始弱分類器權(quán)重,然后通過(guò)迭代方法,獲取弱分類器的最優(yōu)組合權(quán)重系統(tǒng),把弱分類器組合成強(qiáng)分類器,提升了分類器的精度。最后將所提的算法應(yīng)用于用戶分類問(wèn)題,在Movie-leans和UCI數(shù)據(jù)集上驗(yàn)證算法的可行性,并與傳統(tǒng)樸素貝葉斯、核函數(shù)貝葉斯、支持向量機(jī)、決策樹(shù)等分類算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明:所提算法的分類精度優(yōu)于相比較的其他算法,計(jì)算時(shí)間比傳統(tǒng)樸素貝葉斯算法有數(shù)倍的提高,本文引入Shrinkage正則化方法和Ada Boost提升技術(shù)對(duì)減少高斯貝葉斯聯(lián)合概率密度誤差和優(yōu)化計(jì)算時(shí)間是可行的。
【圖文】:

高斯分布


fW邋=邋expf^M£ZL^l邐(3-8)逡逑I邋。邋J逡逑上式為高斯分布的密度函數(shù)標(biāo)準(zhǔn)形態(tài),高斯分布圖3-1中,左側(cè)線條均值是-4,標(biāo)準(zhǔn)差逡逑是1,右側(cè)線條均值是6,標(biāo)準(zhǔn)差是1.5,很明顯看到高斯函數(shù)被分為兩部分,此刻分類逡逑出現(xiàn),如果一個(gè)點(diǎn)出現(xiàn)在偏左側(cè)區(qū)域,則該點(diǎn)歸類為左側(cè)類,反之則歸類為右側(cè)類。逡逑曲逡逑挺應(yīng)&3?^^-.1.,么'幫於泌成.:》'?化'‘’--.、-;巧。-,?;'邋*-/邋<邋>.邋'sr->WH?sssSa??邋'逡逑圖3-1高斯分布度逡逑Figure邋3-1邋Gaussian邋distributio打出agram逡逑由上述分析可得,如果建立了良好的高斯分布函數(shù)模型,即知道訓(xùn)練數(shù)據(jù)集的均但、逡逑方差,那么就可找到分類的臨界點(diǎn)。對(duì)于樸素貝葉斯中p(x|c)可理解為C類中,X逡逑特征發(fā)生的概率一X的概率密度。那么整個(gè)高斯貝葉斯分類器架構(gòu)就是:逡逑1)選取輸入樣本的屬性特征,并采用高斯密度函數(shù)對(duì)各個(gè)類別的概率密度函數(shù)進(jìn)行創(chuàng)逡逑建,將創(chuàng)建的密度函數(shù)作為先驗(yàn)概率;逡逑巧在預(yù)測(cè)時(shí)

對(duì)比圖,準(zhǔn)確率,對(duì)比圖,算法


邐邐0.0024邐0.0072邐0.1440邐0.0017逡逑準(zhǔn)確率邐0.5314邐0.7196邐0.9119邐0.9341逡逑soybean邐AUC邐0.9169邐0.9783邐0.9969邐0.9965逡逑-邋時(shí)間邐0.0464邐0.4950邐2.6872邐0.0092逡逑準(zhǔn)確率邐0.9045邐0.9125邐0.9168邐0.9069逡逑balance邐AUC邐0.9570邐0.9468邐0.9845邐0.9776逡逑時(shí)間邐0.0023邐0.0076邐0.3227邐0.0020逡逑準(zhǔn)確率邐0.9301邐0.7207邐-邐0.9416逡逑dna邐AUC邐0.W89邐0.9161邐-邐0.9920逡逑^邐0.1304邐0.3409邐-邐0.0451逡逑準(zhǔn)確率邐0.6428邐0.7053邐-邐0.8822逡逑letter邐AUC邐0.9506邐0.9769邐-邐0.9961逡逑^邐0.0522邐0.2528邐-邐0.1712逡逑表3-3是本文算法在五個(gè)數(shù)據(jù)集情況下與其他算法在不同評(píng)價(jià)指標(biāo)下的比較。逡逑
【學(xué)位授予單位】:廣西大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 錢(qián)穎能;胡運(yùn)發(fā);;用樸素貝葉斯分類法選股[J];計(jì)算機(jī)應(yīng)用與軟件;2007年06期

2 歐陽(yáng)澤華;郭華平;范明;;在逐漸縮小的空間上漸進(jìn)學(xué)習(xí)樸素貝葉斯參數(shù)[J];計(jì)算機(jī)應(yīng)用;2012年01期

3 裴亞輝;熊盛武;;樸素貝葉斯及其擴(kuò)展模型[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2007年08期

4 趙彥琦;謝小西;荀宇暢;;樸素貝葉斯分類法的應(yīng)用[J];電子制作;2013年07期

5 菅小艷;崔彩霞;;基于樸素貝葉斯的文本分類[J];電腦開(kāi)發(fā)與應(yīng)用;2013年12期

6 王實(shí);高文;;增強(qiáng)型樸素貝葉斯學(xué)習(xí)[J];計(jì)算機(jī)科學(xué);2000年04期

7 楊忠強(qiáng);秦亮曦;;一種基于屬性加權(quán)的樸素貝葉斯改進(jìn)算法[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期

8 張彩麗;楊帆;張玉杰;;柴油機(jī)供油系統(tǒng)狀態(tài)的樸素貝葉斯診斷方法研究[J];計(jì)算機(jī)測(cè)量與控制;2008年08期

9 白耀輝;陳明;王舉群;;利用樸素貝葉斯方法實(shí)現(xiàn)異常檢測(cè)[J];計(jì)算機(jī)工程與應(yīng)用;2005年34期

10 王雙成;冷翠平;侯彩虹;;操作風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)的樸素貝葉斯方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年12期

相關(guān)會(huì)議論文 前2條

1 石志偉;吳功宜;;改善樸素貝葉斯在文本分類中的穩(wěn)定性[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

2 李海軍;王鉦旋;王利民;苑森淼;;基于主成分分析提升樸素貝葉斯[A];中國(guó)儀器儀表學(xué)會(huì)第六屆青年學(xué)術(shù)會(huì)議論文集[C];2004年

相關(guān)碩士學(xué)位論文 前10條

1 李Pr;基于樸素貝葉斯的文本分類研究及其在微博分類中的應(yīng)用[D];北京理工大學(xué);2015年

2 李冬梅;樸素貝葉斯與決策樹(shù)混合分類方法的研究[D];大連海事大學(xué);2016年

3 張帆;貝葉斯算法在校園留言板垃圾過(guò)濾中的應(yīng)用研究[D];鄭州大學(xué);2016年

4 石剛;一種基于知識(shí)圖譜的用戶搜索意圖挖掘方法的研究[D];國(guó)際關(guān)系學(xué)院;2016年

5 張予瑤;基于正則化樸素貝葉斯的用戶分類算法的研究[D];廣西大學(xué);2016年

6 胡為成;基于遺傳算法的樸素貝葉斯分類研究[D];合肥工業(yè)大學(xué);2006年

7 劉勇華;基于樸素貝葉斯的中文段落情感分析[D];太原理工大學(xué);2015年

8 周龍;基于樸素貝葉斯的分類方法研究[D];安徽大學(xué);2006年

9 王翔;基于樸素貝葉斯和One-R的入侵檢測(cè)問(wèn)題研究[D];合肥工業(yè)大學(xué);2008年

10 周遠(yuǎn)陽(yáng);基于樸素貝葉斯方法的新聞分類系統(tǒng)的實(shí)現(xiàn)[D];暨南大學(xué);2012年

,

本文編號(hào):2576770

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/2576770.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e75a8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com