融合改進(jìn)K近鄰和隨機(jī)森林的機(jī)器學(xué)習(xí)方法
本文關(guān)鍵詞: 機(jī)器學(xué)習(xí) K近鄰 隨機(jī)森林 支持向量機(jī) 目標(biāo)分類 出處:《計(jì)算機(jī)工程與設(shè)計(jì)》2017年08期 論文類型:期刊論文
【摘要】:對(duì)K近鄰和隨機(jī)森林學(xué)習(xí)方法進(jìn)行改進(jìn),提出一種融合的機(jī)器學(xué)習(xí)方法。通過(guò)計(jì)算待分類特征與訓(xùn)練庫(kù)中各個(gè)類中心之間的距離,進(jìn)行最近鄰分類,增強(qiáng)K近鄰學(xué)習(xí)方法的魯棒性,提高其運(yùn)算效率;通過(guò)隨機(jī)劃分將改進(jìn)KNN分類器的多元輸出轉(zhuǎn)化為二元輸出,用其構(gòu)建隨機(jī)森林中各個(gè)決策結(jié)點(diǎn)的決策函數(shù),降低各決策結(jié)點(diǎn)數(shù)據(jù)的錯(cuò)分率,提高隨機(jī)森林學(xué)習(xí)方法的目標(biāo)分類正確率。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)手寫數(shù)字目標(biāo)的分類正確率高于經(jīng)典的K近鄰、Adaboost、支持向量機(jī)和隨機(jī)森林學(xué)習(xí)方法。
[Abstract]:The K-nearest neighbor and random forest learning methods are improved, and a fusion machine learning method is proposed. The nearest neighbor classification is carried out by calculating the distance between the feature to be classified and the distance between each class center in the training database. Enhance the robustness of K-nearest neighbor learning method and improve its computational efficiency; The multivariate output of the improved KNN classifier is transformed into a binary output by random partitioning, and the decision function of each decision node in the random forest is constructed to reduce the error rate of the data of each decision node. The experimental results show that the classification accuracy of this method is higher than that of classical K-nearest neighbor Adaboost. Support vector machine and stochastic forest learning method.
【作者單位】: 成都師范學(xué)院計(jì)算機(jī)科學(xué)學(xué)院;中原工學(xué)院信息商務(wù)學(xué)院信息技術(shù)系;
【基金】:中國(guó)博士后科學(xué)基金面上基金項(xiàng)目(2014M560730) 四川省科技廳應(yīng)用基礎(chǔ)基金項(xiàng)目(2015JY0071) 成都師范學(xué)院高層次引進(jìn)人才專項(xiàng)科研基金項(xiàng)目(YJRC2014-9);成都師范學(xué)院自然科學(xué)類培育基金項(xiàng)目(CS14ZD02)
【分類號(hào)】:TP181
【正文快照】: 0引言目前經(jīng)典的機(jī)器學(xué)習(xí)[1-3]方法有多種,如:K近鄰(K-nearest neighbor,KNN)學(xué)習(xí)方法是一種簡(jiǎn)單的機(jī)器學(xué)習(xí)方法,實(shí)質(zhì)上是一種統(tǒng)計(jì)分類器,分類時(shí)首先計(jì)算待分類特征向量與數(shù)據(jù)庫(kù)中每一個(gè)特征向量之間的距離,選擇最鄰近的k個(gè)類別,然后統(tǒng)計(jì)這k個(gè)最鄰近類別中每類訓(xùn)練樣本出現(xiàn)的
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王象剛;;基于K均值隨機(jī)森林快速算法及入侵檢測(cè)中的應(yīng)用[J];科技通報(bào);2013年08期
2 張華偉;王明文;甘麗新;;基于隨機(jī)森林的文本分類模型研究[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
3 邱一卉;林成德;;基于隨機(jī)森林方法的異常樣本檢測(cè)方法[J];福建工程學(xué)院學(xué)報(bào);2007年04期
4 馬昕;王雪;楊洋;;基于隨機(jī)森林算法的大學(xué)生異動(dòng)情況的預(yù)測(cè)[J];江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
5 楊帆;林琛;周綺鳳;符長(zhǎng)虹;羅林開(kāi);;基于隨機(jī)森林的潛在k近鄰算法及其在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J];系統(tǒng)工程理論與實(shí)踐;2012年04期
6 聶斌;王卓;杜建強(qiáng);朱明峰;林劍鳴;艾國(guó)平;熊玲珠;;基于粗糙集和隨機(jī)森林算法輔助糖尿病并發(fā)癥分類研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
7 郭穎婕;劉曉燕;郭茂祖;鄒權(quán);;植物抗性基因識(shí)別中的隨機(jī)森林分類方法[J];計(jì)算機(jī)科學(xué)與探索;2012年01期
8 邱一卉;林成德;;基于隨機(jī)森林和單類支持向量機(jī)的電信行業(yè)客戶流失預(yù)測(cè)[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期
9 于化龍;高尚;趙靖;秦斌;;基于過(guò)采樣技術(shù)和隨機(jī)森林的不平衡微陣列數(shù)據(jù)分類方法研究[J];計(jì)算機(jī)科學(xué);2012年05期
10 姚登舉;楊靜;詹曉娟;;基于隨機(jī)森林的特征選擇算法[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2014年01期
相關(guān)博士學(xué)位論文 前2條
1 張乾;基于隨機(jī)森林的視覺(jué)數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2016年
2 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 朱琪;基于最大平衡度與最大共識(shí)的改進(jìn)隨機(jī)森林算法研究[D];吉林大學(xué);2016年
2 馬驪;隨機(jī)森林算法的優(yōu)化改進(jìn)研究[D];暨南大學(xué);2016年
3 程政;城市道路短時(shí)車流量預(yù)測(cè)模型研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
4 陳實(shí);基于隨機(jī)森林的神經(jīng)肽剪切位點(diǎn)預(yù)測(cè)方法研究[D];華中科技大學(xué);2015年
5 胡宗杰;基于極值隨機(jī)森林的慢性胃炎中醫(yī)問(wèn)診證候分類研究[D];華東理工大學(xué);2017年
6 康雅文;基于隨機(jī)森林的醫(yī)療行業(yè)供應(yīng)商的等級(jí)評(píng)估模型[D];安徽大學(xué);2017年
7 李貞貴;隨機(jī)森林改進(jìn)的若干研究[D];廈門大學(xué);2013年
8 姚明煌;隨機(jī)森林及其在遙感圖像分類中的應(yīng)用[D];華僑大學(xué);2014年
9 肖堅(jiān);基于隨機(jī)森林的不平衡數(shù)據(jù)分類方法研究[D];哈爾濱工業(yè)大學(xué);2013年
10 雍凱;隨機(jī)森林的特征選擇和模型優(yōu)化算法研究[D];哈爾濱工業(yè)大學(xué);2008年
,本文編號(hào):1448580
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1448580.html