天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 金融論文 >

樸素貝葉斯分類算法的改進(jìn)及其應(yīng)用

發(fā)布時(shí)間:2017-03-30 02:14

  本文關(guān)鍵詞:樸素貝葉斯分類算法的改進(jìn)及其應(yīng)用,,由筆耕文化傳播整理發(fā)布。


【摘要】:分類能力是人類在社會(huì)活動(dòng)中最重要而基本的能力之一,分類技術(shù)是數(shù)據(jù)挖掘領(lǐng)域研究的一項(xiàng)核心內(nèi)容。樸素貝葉斯分類算法以完善的理論體系、清晰簡單的星形結(jié)構(gòu)、良好的適應(yīng)能力和較高的分類正確率而聞名,但其前提假設(shè)在現(xiàn)實(shí)運(yùn)用中往往無法成立。為了解決這一問題并提高算法性能,本文以樸素貝葉斯分類算法為基礎(chǔ),研究現(xiàn)有的屬性加權(quán)樸素貝葉斯算法,并考慮了實(shí)際應(yīng)用中數(shù)據(jù)類型對分類算法的影響,提出了基于Tau-y相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法和基于Kendall τ相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法。具體研究工作如下:(1)通過研究樸素貝葉斯分類算法及其各種改進(jìn)算法,提出了基于Tau-y相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法,以Tau-y系數(shù)確定權(quán)值,并通過實(shí)驗(yàn)檢驗(yàn)其分類性能,新改進(jìn)算法能有效的提高分類效率,特別是在樣本總量較小的數(shù)據(jù)集中展現(xiàn)了良好的分類效果。(2)為了更好的提取數(shù)據(jù)中的有用信息,解決實(shí)際中的某些特殊問題,引入非參數(shù)統(tǒng)計(jì)中的Kendall τ相關(guān)系數(shù),提出了基于Kendall τ相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法,實(shí)驗(yàn)結(jié)果顯示該算法能獲得較高的分類正確率,且在類標(biāo)記數(shù)量較多的數(shù)據(jù)中性能更佳。(3)對新算法在銀行個(gè)人客戶分類這一實(shí)際問題中的應(yīng)用進(jìn)行了研究,在一定程度上進(jìn)一步驗(yàn)證了新算法的性能。
【關(guān)鍵詞】:分類算法 樸素貝葉斯 權(quán)值 相關(guān)系數(shù)
【學(xué)位授予單位】:北京林業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F830.91;F224
【目錄】:
  • 摘要3-4
  • ABSTRACT4-9
  • 1 緒論9-14
  • 1.1 研究背景及意義9-10
  • 1.2 國內(nèi)外研究現(xiàn)狀10-12
  • 1.3 研究目的與研究內(nèi)容12-13
  • 1.4 論文的組織結(jié)構(gòu)13-14
  • 2 基礎(chǔ)理論概述14-25
  • 2.1 概率論基礎(chǔ)14-16
  • 2.1.1 條件概率和乘法原理14
  • 2.1.2 全概率公式與貝葉斯定理14-15
  • 2.1.3 極大后驗(yàn)假設(shè)與極大似然假設(shè)15-16
  • 2.1.4 事件的獨(dú)立性16
  • 2.2 樸素貝葉斯分類算法16-20
  • 2.2.1 貝葉斯分類算法16-17
  • 2.2.2 樸素貝葉斯分類算法(NB)17-20
  • 2.3 樸素貝葉斯改進(jìn)算法20-24
  • 2.3.1 樹增強(qiáng)型樸素貝葉斯分類算法(TAN)20-22
  • 2.3.2 貝葉斯網(wǎng)絡(luò)(BN)22-23
  • 2.3.3 樸素貝葉斯樹算法(NBTree)23-24
  • 2.4 本章小結(jié)24-25
  • 3 加權(quán)樸素貝葉斯分類算法25-28
  • 3.1 引言25
  • 3.2 算法步驟25-26
  • 3.3 常見的加權(quán)樸素貝葉斯分類算法26-27
  • 3.3.1 基于卡方統(tǒng)計(jì)量的加權(quán)樸素貝葉斯分類算法26-27
  • 3.3.2 基于粗糙集的加權(quán)樸素貝葉斯分類算法27
  • 3.4 本章小結(jié)27-28
  • 4 基于相關(guān)關(guān)系的加權(quán)樸素貝葉斯分類算法28-36
  • 4.1 引言28
  • 4.2 相關(guān)關(guān)系和相關(guān)系數(shù)28-30
  • 4.2.1 相關(guān)關(guān)系28-29
  • 4.2.2 相關(guān)系數(shù)29-30
  • 4.3 基于Tau-y系數(shù)的加權(quán)樸素貝葉斯分類算法30-32
  • 4.3.1 算法的構(gòu)造30-31
  • 4.3.2 權(quán)值的確定31-32
  • 4.3.3 算法步驟32
  • 4.4 基于Kendall τ相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法32-35
  • 4.4.1 算法提出的背景32-33
  • 4.4.2 Kendall τ的思想及計(jì)算33-35
  • 4.4.3 算法步驟35
  • 4.5 本章小結(jié)35-36
  • 5 實(shí)驗(yàn)驗(yàn)證與結(jié)果分析36-46
  • 5.1 實(shí)驗(yàn)背景36
  • 5.2 實(shí)驗(yàn)數(shù)據(jù)36-38
  • 5.3 實(shí)驗(yàn)流程38-39
  • 5.3.1 數(shù)據(jù)準(zhǔn)備38
  • 5.3.2 數(shù)據(jù)處理38-39
  • 5.3.3 算法性能比較39
  • 5.4 實(shí)驗(yàn)結(jié)果及其分析39-45
  • 5.4.1 實(shí)驗(yàn)Ⅰ39-42
  • 5.4.2 實(shí)驗(yàn)Ⅱ42-45
  • 5.5 本章小結(jié)45-46
  • 6 改進(jìn)的樸素貝葉斯分類算法在銀行客戶分類中的應(yīng)用46-52
  • 6.1 引言46-47
  • 6.2 數(shù)據(jù)與變量47-49
  • 6.2.1 評估指標(biāo)概述47-48
  • 6.2.2 數(shù)據(jù)來源及預(yù)處理48-49
  • 6.3 實(shí)驗(yàn)結(jié)果與分析49-51
  • 6.3.1 算法的應(yīng)用49
  • 6.3.2 實(shí)驗(yàn)結(jié)果分析及建議49-51
  • 6.4 本章小結(jié)51-52
  • 7 總結(jié)及展望52-54
  • 7.1 本文的貢獻(xiàn)及創(chuàng)新點(diǎn)52
  • 7.2 工作展望52-54
  • 參考文獻(xiàn)54-57
  • 個(gè)人簡介57-58
  • 導(dǎo)師簡介58-59
  • 獲得成果目錄清單59-60
  • 致謝60

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 董毅;;統(tǒng)計(jì)中一些相關(guān)系數(shù)的關(guān)系及其在投資組合中的應(yīng)用研究[J];蚌埠學(xué)院學(xué)報(bào);2012年01期

2 俞純權(quán);;關(guān)于相關(guān)系數(shù)應(yīng)注意的兩個(gè)問題[J];廣西商專學(xué)報(bào);1993年03期

3 傅德印;;直線相關(guān)系數(shù)是計(jì)算各種其它相關(guān)系數(shù)的基礎(chǔ)[J];蘭州商學(xué)院學(xué)報(bào);1993年03期

4 傅德印;相關(guān)系數(shù)體系探討[J];財(cái)經(jīng)問題研究;1994年01期

5 蘇為華;應(yīng)用斯庇爾曼相關(guān)系數(shù)應(yīng)注意的兩個(gè)問題[J];浙江統(tǒng)計(jì);1994年09期

6 韓雪峰;淺議相關(guān)系數(shù)與偏相關(guān)系數(shù)的使用[J];山西統(tǒng)計(jì);1994年05期

7 周沅帆;;擔(dān)保債券違約相關(guān)系數(shù)求解模式及增信有效性[J];中央財(cái)經(jīng)大學(xué)學(xué)報(bào);2008年09期

8 郭斌;;多元資產(chǎn)組合中的收益與風(fēng)險(xiǎn)[J];價(jià)值工程;2011年30期

9 范文正;論相關(guān)系數(shù)的實(shí)質(zhì)[J];統(tǒng)計(jì)與決策;2002年06期

10 李秀敏;江衛(wèi)華;;相關(guān)系數(shù)與相關(guān)性度量[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2006年12期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 黃文楠;吳英秦;方志行;陳俊成;鄧清政;陳思翰;;基于相關(guān)系數(shù)概念之電性測試規(guī)劃探討[A];2006中國電工技術(shù)學(xué)會(huì)電力電子學(xué)會(huì)第十屆學(xué)術(shù)年會(huì)論文摘要集[C];2006年

2 趙剛;;用相關(guān)系數(shù)表征沖擊波形相似程度[A];2006全國電工測試技術(shù)學(xué)術(shù)交流會(huì)論文集[C];2006年

3 許婧婧;楊子生;;云南省耕地?cái)?shù)量分布的影響因素分析[A];中國土地資源可持續(xù)利用與新農(nóng)村建設(shè)研究[C];2008年

4 蔣文瀚;陳炳為;鄭建光;李萬慶;李杰;;相關(guān)系數(shù)meta分析在R語言中的實(shí)現(xiàn)[A];2011年中國衛(wèi)生統(tǒng)計(jì)學(xué)年會(huì)會(huì)議論文集[C];2011年

5 宋金常;王曉鈞;羅蘇梅;;相關(guān)系數(shù)的meta分析方法述評[A];第十一屆全國心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年

6 唐凌;楊海萍;張巖;李艷;陸娟;盛軍;;基于TE48C系列的大氣自動(dòng)監(jiān)測中CO分析儀的原理及維護(hù)[A];自動(dòng)化技術(shù)與冶金流程節(jié)能減排——全國冶金自動(dòng)化信息網(wǎng)2008年會(huì)論文集[C];2008年

7 高翔;白麗娜;;基于廣義相關(guān)系數(shù)的多元軌跡預(yù)測及數(shù)據(jù)恢復(fù)方法[A];2007中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年

8 陳思寶;姚志強(qiáng);胡郁;王仁華;;基于樹的相關(guān)系數(shù)補(bǔ)償滿方差建模技術(shù)研究[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2007年

9 李衛(wèi)國;張俊梅;;相關(guān)系數(shù)MA(q)序列與其威利譜的關(guān)系[A];全國第十屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)年會(huì)論文集[C];2006年

10 蔡秀華;曹鴻興;牛保山;;列序分析及其在大氣環(huán)境中的應(yīng)用[A];新世紀(jì)氣象科技創(chuàng)新與大氣科學(xué)發(fā)展——中國氣象學(xué)會(huì)2003年年會(huì)“大氣氣溶膠及其對氣候環(huán)境的影響”分會(huì)論文集[C];2003年

中國重要報(bào)紙全文數(shù)據(jù)庫 前4條

1 張光平;上海期銅與國際期銅市場相關(guān)性分析[N];期貨日報(bào);2003年

2 中國社會(huì)科學(xué)院學(xué)部委員、經(jīng)濟(jì)學(xué)部副主任 劉樹成;不可忽視GDP[N];中國經(jīng)濟(jì)時(shí)報(bào);2012年

3 高潮生;滬深證交所同一屋檐成對手[N];國際金融報(bào);2003年

4 代立軍;LLDPE運(yùn)行還看上游“臉色”[N];期貨日報(bào);2009年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 宋棟鳴;復(fù)雜金融網(wǎng)絡(luò)若干問題研究[D];華東理工大學(xué);2013年

2 孫立力;電性距離矢量用于藥物定量構(gòu)效關(guān)系研究[D];重慶大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 劉丹;互斥風(fēng)險(xiǎn)性質(zhì)的幾種新的證明[D];曲阜師范大學(xué);2015年

2 蔣敬;負(fù)相關(guān)二元泊松變量的生成方法研究[D];上海交通大學(xué);2015年

3 喻凱西;樸素貝葉斯分類算法的改進(jìn)及其應(yīng)用[D];北京林業(yè)大學(xué);2016年

4 李飛;基于局部相關(guān)系數(shù)的美國次債危機(jī)傳染分析[D];中國科學(xué)技術(shù)大學(xué);2015年

5 郭華峰;尾部相關(guān)系數(shù)與資產(chǎn)選擇研究[D];廈門大學(xué);2014年

6 白華寧;基于相關(guān)系數(shù)的過程控制系統(tǒng)故障檢測與診斷研究[D];西安科技大學(xué);2014年

7 王玲玉;文獻(xiàn)共引分析中的關(guān)聯(lián)強(qiáng)度和相關(guān)系數(shù)改進(jìn)研究[D];鄭州大學(xué);2011年

8 吳婉瑩;猶豫模糊信息的相關(guān)系數(shù)和熵測度及其在群決策中的應(yīng)用[D];安徽大學(xué);2014年

9 李宏偉;廣義相關(guān)測量的穩(wěn)健性估計(jì)[D];東北師范大學(xué);2013年

10 鄧斌;上證A股板塊指數(shù)收益率相關(guān)系數(shù)和股市波動(dòng)的關(guān)系研究[D];湖南大學(xué);2011年


  本文關(guān)鍵詞:樸素貝葉斯分類算法的改進(jìn)及其應(yīng)用,由筆耕文化傳播整理發(fā)布。



本文編號:275990

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/guojijinrong/275990.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a3c3d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com