面向不平衡分類的邏輯回歸算法
發(fā)布時(shí)間:2021-05-13 21:01
類分布不平衡的數(shù)據(jù)集在現(xiàn)實(shí)生活中大量存在,傳統(tǒng)的成熟分類算法大多建立在數(shù)據(jù)集類分布大致平衡這一假設(shè)上,而對(duì)于類分布不平衡的數(shù)據(jù)集往往取得較差的分類效果。而且,在不平衡分類問(wèn)題中往往少數(shù)類比多數(shù)類具有更重要的意義,因此不能僅僅使用準(zhǔn)確率來(lái)評(píng)估不平衡分類算法的性能,對(duì)于不平衡分類問(wèn)題可用召回率、g-mean值以及f-measure值等評(píng)估指標(biāo)對(duì)不平衡分類算法進(jìn)行評(píng)估。邏輯回歸算法是數(shù)據(jù)挖掘中常用的分類方法,尤其對(duì)于兩類分類問(wèn)題。邏輯回歸算法最明顯的優(yōu)勢(shì)就是它是基于概率的分類算法并且很容易被擴(kuò)展到多類問(wèn)題,但是邏輯回歸并不適應(yīng)于不平衡分類問(wèn)題,因?yàn)槠淠繕?biāo)函數(shù)是最大化每個(gè)實(shí)例被正確分類的概率的對(duì)數(shù)之和,而不考慮該實(shí)例是少數(shù)類還是多數(shù)類,這樣會(huì)導(dǎo)致將更多的少數(shù)類實(shí)例誤分為多數(shù)類。因此在邏輯回歸的基礎(chǔ)處上,本文根據(jù)類分布不平衡數(shù)據(jù)集的特點(diǎn),結(jié)合傳統(tǒng)的邏輯回歸算法和三個(gè)不平衡分類問(wèn)題的評(píng)價(jià)指標(biāo)召回率、g-mean值以及f-measure值提出了三種適合于不平衡分類的目標(biāo)函數(shù)LRM(Logistic and Recall based Metric)、GBM(G-mean based Metric)和F...
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:48 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 本文的主要貢獻(xiàn)
1.3 本文的組織架構(gòu)
2 相關(guān)知識(shí)
2.1 不平衡數(shù)據(jù)集及不平衡數(shù)據(jù)分類方法
2.1.1 不平衡數(shù)據(jù)集
2.1.2 不平衡數(shù)據(jù)分類方法
2.2 邏輯回歸原理
2.3 最優(yōu)化方法
2.3.1 最速下降法
2.3.2 牛頓法
2.3.3 擬牛頓法
2.4 本章小結(jié)
3 目標(biāo)函數(shù)的設(shè)計(jì)
3.1 基于recall的目標(biāo)函數(shù)
3.2 基于g-mean的目標(biāo)函數(shù)
3.3 基于f-measure的目標(biāo)函數(shù)
3.4 本章小結(jié)
4 面向不平衡分類的邏輯回歸算法
4.1 算法描述
4.2 本章小結(jié)
5 實(shí)驗(yàn)
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 實(shí)驗(yàn)設(shè)置
5.3 評(píng)價(jià)指標(biāo)
5.4 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 下一步工作
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)介
1 個(gè)人簡(jiǎn)歷
2 發(fā)表的學(xué)術(shù)論文及著作權(quán)
【參考文獻(xiàn)】:
期刊論文
[1]一種面向非平衡數(shù)據(jù)集分類問(wèn)題的組合選擇方法[J]. 職為梅,郭華平,張銀峰,范明. 小型微型計(jì)算機(jī)系統(tǒng). 2014(04)
[2]基于密度估計(jì)的邏輯回歸模型[J]. 毛毅,陳穩(wěn)霖,郭寶龍,陳一昕. 自動(dòng)化學(xué)報(bào). 2014(01)
[3]多標(biāo)簽代價(jià)敏感分類集成學(xué)習(xí)算法[J]. 付忠良. 自動(dòng)化學(xué)報(bào). 2014(06)
[4]AdaBoost算法研究進(jìn)展與展望[J]. 曹瑩,苗啟廣,劉家辰,高琳. 自動(dòng)化學(xué)報(bào). 2013(06)
[5]基于支持向量機(jī)的不平衡數(shù)據(jù)分類的改進(jìn)欠采樣方法[J]. 趙自翔,王廣亮,李曉東. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[6]非平衡數(shù)據(jù)集分類方法探討[J]. 職為梅,郭華平,范明,葉陽(yáng)東. 計(jì)算機(jī)科學(xué). 2012(S1)
[7]基于改進(jìn)SMOTE的非平衡數(shù)據(jù)集分類研究[J]. 王超學(xué),潘正茂,董麗麗,馬春森,張星. 計(jì)算機(jī)工程與應(yīng)用. 2013(02)
[8]不平衡多分類問(wèn)題的連續(xù)AdaBoost算法研究[J]. 付忠良. 計(jì)算機(jī)研究與發(fā)展. 2011(12)
[9]不平衡數(shù)據(jù)采樣方法的對(duì)比學(xué)習(xí)[J]. 王曉娟,郭躬德. 微計(jì)算機(jī)信息. 2011(12)
[10]一種基于重取樣的代價(jià)敏感學(xué)習(xí)算法[J]. 谷瓊,袁磊,寧彬,熊啟軍,華麗,李文新. 計(jì)算機(jī)工程與科學(xué). 2011(09)
博士論文
[1]擬牛頓法及其收斂性[D]. 周偉軍.湖南大學(xué) 2006
碩士論文
[1]基于邏輯回歸的推薦技術(shù)研究及應(yīng)用[D]. 劉力銀.電子科技大學(xué) 2013
本文編號(hào):3184697
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:48 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 本文的主要貢獻(xiàn)
1.3 本文的組織架構(gòu)
2 相關(guān)知識(shí)
2.1 不平衡數(shù)據(jù)集及不平衡數(shù)據(jù)分類方法
2.1.1 不平衡數(shù)據(jù)集
2.1.2 不平衡數(shù)據(jù)分類方法
2.2 邏輯回歸原理
2.3 最優(yōu)化方法
2.3.1 最速下降法
2.3.2 牛頓法
2.3.3 擬牛頓法
2.4 本章小結(jié)
3 目標(biāo)函數(shù)的設(shè)計(jì)
3.1 基于recall的目標(biāo)函數(shù)
3.2 基于g-mean的目標(biāo)函數(shù)
3.3 基于f-measure的目標(biāo)函數(shù)
3.4 本章小結(jié)
4 面向不平衡分類的邏輯回歸算法
4.1 算法描述
4.2 本章小結(jié)
5 實(shí)驗(yàn)
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 實(shí)驗(yàn)設(shè)置
5.3 評(píng)價(jià)指標(biāo)
5.4 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 下一步工作
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)介
1 個(gè)人簡(jiǎn)歷
2 發(fā)表的學(xué)術(shù)論文及著作權(quán)
【參考文獻(xiàn)】:
期刊論文
[1]一種面向非平衡數(shù)據(jù)集分類問(wèn)題的組合選擇方法[J]. 職為梅,郭華平,張銀峰,范明. 小型微型計(jì)算機(jī)系統(tǒng). 2014(04)
[2]基于密度估計(jì)的邏輯回歸模型[J]. 毛毅,陳穩(wěn)霖,郭寶龍,陳一昕. 自動(dòng)化學(xué)報(bào). 2014(01)
[3]多標(biāo)簽代價(jià)敏感分類集成學(xué)習(xí)算法[J]. 付忠良. 自動(dòng)化學(xué)報(bào). 2014(06)
[4]AdaBoost算法研究進(jìn)展與展望[J]. 曹瑩,苗啟廣,劉家辰,高琳. 自動(dòng)化學(xué)報(bào). 2013(06)
[5]基于支持向量機(jī)的不平衡數(shù)據(jù)分類的改進(jìn)欠采樣方法[J]. 趙自翔,王廣亮,李曉東. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[6]非平衡數(shù)據(jù)集分類方法探討[J]. 職為梅,郭華平,范明,葉陽(yáng)東. 計(jì)算機(jī)科學(xué). 2012(S1)
[7]基于改進(jìn)SMOTE的非平衡數(shù)據(jù)集分類研究[J]. 王超學(xué),潘正茂,董麗麗,馬春森,張星. 計(jì)算機(jī)工程與應(yīng)用. 2013(02)
[8]不平衡多分類問(wèn)題的連續(xù)AdaBoost算法研究[J]. 付忠良. 計(jì)算機(jī)研究與發(fā)展. 2011(12)
[9]不平衡數(shù)據(jù)采樣方法的對(duì)比學(xué)習(xí)[J]. 王曉娟,郭躬德. 微計(jì)算機(jī)信息. 2011(12)
[10]一種基于重取樣的代價(jià)敏感學(xué)習(xí)算法[J]. 谷瓊,袁磊,寧彬,熊啟軍,華麗,李文新. 計(jì)算機(jī)工程與科學(xué). 2011(09)
博士論文
[1]擬牛頓法及其收斂性[D]. 周偉軍.湖南大學(xué) 2006
碩士論文
[1]基于邏輯回歸的推薦技術(shù)研究及應(yīng)用[D]. 劉力銀.電子科技大學(xué) 2013
本文編號(hào):3184697
本文鏈接:http://www.sikaile.net/shekelunwen/ljx/3184697.html
最近更新
教材專著