決策樹ID3算法的分析與改進
[Abstract]:In order to remedy the shortcomings of ID3 algorithm [1-3], an improved algorithm based on ID3 algorithm is designed. It uses modified parameters to modify the information gain, overcomes the disadvantage of ID3 algorithm, which tends to select attributes with more values, and discretizes the attributes of continuous values and solves the problem of processing continuous attributes. By using the idea that samples with unknown values are randomly distributed according to the relative frequency of known values, samples lacking attribute values can be processed. This paper describes the concrete steps of generating decision tree [4] by improved ID3 algorithm, and applies the improved algorithm to customer churn analysis in customer relationship management system. Through the analysis and comparison of the experimental results, the improved algorithm has higher prediction accuracy than the original ID3 algorithm, which shows the effectiveness of the algorithm.
【作者單位】: 四川大學計算機學院;
【分類號】:TP181
【參考文獻】
相關期刊論文 前8條
1 曲開社,成文麗,王俊紅;ID3算法的一種改進算法[J];計算機工程與應用;2003年25期
2 葉明全;胡學鋼;;一種基于灰色關聯(lián)度的決策樹改進算法[J];計算機工程與應用;2007年32期
3 韓松來,張輝,周華平;基于關聯(lián)度函數(shù)的決策樹分類算法[J];計算機應用;2005年11期
4 段玉春;朱曉艷;孫玉強;;一種改進的ID3算法[J];南陽師范學院學報(社會科學版);2006年09期
5 王艷兵;趙銳;姚青;;基于可變精度的ID3改進算法[J];計算機工程與設計;2006年14期
6 狄文輝;李卿;樓新遠;;基于修正系數(shù)的決策樹分類算法[J];計算機工程與設計;2008年24期
7 魏紅寧;決策樹剪枝方法的比較[J];西南交通大學學報;2005年01期
8 馮少榮;肖文俊;;基于樣本選取的決策樹改進算法[J];西南交通大學學報;2009年05期
相關碩士學位論文 前2條
1 王峰;基于決策樹分類算法的企業(yè)CRM研究[D];長春理工大學;2008年
2 劉浩熙;數(shù)據(jù)挖掘在客戶關系管理綜合決策中的應用[D];北京郵電大學;2008年
【共引文獻】
相關期刊論文 前10條
1 王永梅;胡學鋼;;決策樹中ID3算法的研究[J];安徽大學學報(自然科學版);2011年03期
2 廖燕玲;;模糊聚類技術在甘蔗種植戶信息分析中的應用[J];安徽農(nóng)業(yè)科學;2007年28期
3 陳志民;李亭;楊敬鋒;彭曉琴;;融入監(jiān)督信息的k-mean聚類瓜薊馬預警模型[J];安徽農(nóng)業(yè)科學;2009年30期
4 萬雅奇;侯亞榮;王勇;張書杰;;教育考試數(shù)據(jù)挖掘系統(tǒng)研究與實現(xiàn)[J];北京工業(yè)大學學報;2009年05期
5 安穎;;基于Apriori算法的興趣集加權關聯(lián)規(guī)則挖掘[J];北京聯(lián)合大學學報(自然科學版);2008年04期
6 朱學冬;胡平;;基于最優(yōu)二叉樹的多故障分類器的設計[J];北京聯(lián)合大學學報(自然科學版);2009年02期
7 楊曉;張迎新;;Apriori算法在消費市場價格分析中的研究與應用[J];北京工商大學學報(自然科學版);2009年03期
8 柏彬;牛紅利;;基于二叉樹模型的HTML轉(zhuǎn)換為XML的方法[J];才智;2010年03期
9 馬英芝;程鳳林;;基于數(shù)據(jù)挖掘技術的高校圖書館讀者分析[J];科技創(chuàng)新與應用;2012年01期
10 曹萍;;商務智能在電子商務中的應用研究[J];科技和產(chǎn)業(yè);2009年05期
相關會議論文 前10條
1 肖健;沈彩霞;;淺談數(shù)據(jù)挖掘技術現(xiàn)狀[A];廣西計算機學會2008年年會論文集[C];2008年
2 張宇;;基于XML的Web數(shù)據(jù)自動挖掘[A];科技創(chuàng)新與節(jié)能減排——吉林省第五屆科學技術學術年會論文集(上冊)[C];2008年
3 劉東升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全國開放式分布與并行計算學術會議論文集[C];2005年
4 錢學君;胡小建;;決策樹算法在焊接工藝設計中的應用[A];2008年安徽省科協(xié)年會機械工程分年會論文集[C];2008年
5 卜亞杰;胡朝舉;;一種改進的ID3算法[A];第一屆中國高校通信類院系學術研討會論文集[C];2007年
6 劉杰;周志杰;;分布式關聯(lián)規(guī)則挖掘在分級網(wǎng)絡管理中的研究[A];2008通信理論與技術新發(fā)展——第十三屆全國青年通信學術會議論文集(下)[C];2008年
7 陳媛媛;李曉;田二明;;基于粗糙集和BP網(wǎng)絡的車牌字符識別[A];2008中國儀器儀表與測控技術進展大會論文集(Ⅰ)[C];2008年
8 李錦澤;葉曉俊;;關聯(lián)規(guī)則挖掘算法研究現(xiàn)狀[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
9 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應用[A];紀念中國農(nóng)業(yè)工程學會成立30周年暨中國農(nóng)業(yè)工程學會2009年學術年會(CSAE 2009)論文集[C];2009年
10 田琨;郭鳳霞;楊寧;;基于k-近鄰法的雷暴預報[A];第28屆中國氣象學會年會——S13雷電物理、監(jiān)測預警和防護[C];2011年
相關博士學位論文 前10條
1 沈懿珍;基于協(xié)同智能的蛋白質(zhì)相互作用及其網(wǎng)絡研究[D];東華大學;2011年
2 葉紅云;面向金融營銷問題的個性化推薦方法研究[D];合肥工業(yè)大學;2011年
3 王煉紅;人工免疫優(yōu)化與分類算法及其應用研究[D];湖南大學;2009年
4 彭光金;小樣本工程造價數(shù)據(jù)的智能學習方法及其在輸變電工程中的應用研究[D];重慶大學;2010年
5 孔令東;基于模糊Petri網(wǎng)的瓦斯突出空間預測模型研究[D];中國礦業(yè)大學;2011年
6 何月順;關聯(lián)規(guī)則挖掘技術的研究及應用[D];南京航空航天大學;2010年
7 梁艷紅;基于專利挖掘的創(chuàng)新設計關鍵技術研究[D];河北工業(yè)大學;2011年
8 劉智;關聯(lián)規(guī)則挖掘方法及其在冠心病中醫(yī)診療中的應用研究[D];大連海事大學;2012年
9 章政;基于遺傳編程的電力變壓器絕緣故障診斷模型研究[D];上海交通大學;2007年
10 周鶯;古代情志病證醫(yī)案信息數(shù)理分析[D];廣州中醫(yī)藥大學;2007年
相關碩士學位論文 前10條
1 郭慧;數(shù)據(jù)挖掘技術對放射工作人員知覺壓力因素分析[D];鄭州大學;2010年
2 李媛;電子商務個性化推薦關鍵技術研究[D];哈爾濱工程大學;2010年
3 叢強;基于模糊關聯(lián)規(guī)則Web挖掘算法的研究[D];哈爾濱工程大學;2010年
4 王宏云;基于數(shù)據(jù)挖掘的煤礦安全監(jiān)測系統(tǒng)研究[D];遼寧工程技術大學;2009年
5 聶小芳;模糊粗糙集與支持向量機在煤與瓦斯突出預測中的應用研究[D];遼寧工程技術大學;2009年
6 周翔;決策支持技術在企業(yè)銷售系統(tǒng)中的應用研究[D];中國海洋大學;2010年
7 劉曉霞;數(shù)據(jù)挖掘技術在高校教學管理系統(tǒng)中的應用研究[D];中國海洋大學;2010年
8 韓成勇;高校學評教決策支持系統(tǒng)設計與實現(xiàn)[D];蘇州大學;2010年
9 張睿;ID3決策樹算法分析與改進[D];蘭州大學;2010年
10 葛苗苗;基于校園網(wǎng)的網(wǎng)絡用戶行為分析研究[D];南京財經(jīng)大學;2010年
【二級參考文獻】
相關期刊論文 前10條
1 吉慶華;加強客戶關系管理,提高顧客忠誠度[J];北京大學學報(哲學社會科學版);2004年S1期
2 張祥建,徐晉,郭嵐;企業(yè)營銷中的客戶價值、驅(qū)動因素及策略[J];商業(yè)研究;2004年21期
3 劉文君;鄒樹梁;王鐵驪;;對我國會展企業(yè)實施CRM的戰(zhàn)略性思考[J];商業(yè)研究;2005年21期
4 王扶東,朱云龍,薛勁松,李兵;基于數(shù)據(jù)挖掘的客戶關系分析評價系統(tǒng)[J];東南大學學報(哲學社會科學版);2002年S2期
5 周明;李相平;易怡;;基于生命周期的客戶知識管理策略[J];重慶大學學報(自然科學版);2006年07期
6 潘薇,葉曉俊;提高客戶滿意度的決策支持模型[J];哈爾濱工業(yè)大學學報;2005年04期
7 喬琳,許暉,于玉,周水庚;復雜企業(yè)決策支持環(huán)境下的數(shù)據(jù)倉庫體系結(jié)構的演化[J];計算機工程與應用;2000年07期
8 李智,王正肖,方水良;基于決策支持的客戶關系管理研究[J];計算機工程與應用;2003年08期
9 曲開社,成文麗,王俊紅;ID3算法的一種改進算法[J];計算機工程與應用;2003年25期
10 劉鵬;一種健壯有效的決策樹改進模型[J];計算機工程與應用;2005年33期
相關碩士學位論文 前2條
1 文專;基于神經(jīng)網(wǎng)絡的分類數(shù)據(jù)挖掘?qū)傩赃x擇和規(guī)則抽取研究[D];天津大學;2004年
2 孫_";數(shù)據(jù)挖掘中的決策樹方法及其在客戶分類中的應用[D];大連理工大學;2004年
【相似文獻】
相關期刊論文 前10條
1 孫友友;郭曉燕;;決策樹與聚類算法在數(shù)據(jù)挖掘中的研究及應用[J];科技創(chuàng)新導報;2007年34期
2 王善俠;王振華;王吉永;;基于決策樹和聚類理論的XML文檔數(shù)據(jù)挖掘的研究[J];科技信息(科學教研);2007年34期
3 彭玉樓,劉亞輝;利用決策樹和聚類理論對XML文檔數(shù)據(jù)挖掘的研究[J];株洲工學院學報;2005年04期
4 李會;胡笑梅;;決策樹中ID3算法與C4.5算法分析與比較[J];水電能源科學;2008年02期
5 于承敏;鄭麗萍;劉永濤;;數(shù)據(jù)挖掘在高校學生綜合測評成績分析中的應用[J];電腦與電信;2009年10期
6 鄭麗萍;;Id3算法的研究及應用[J];硅谷;2008年24期
7 陶靈姣;孫繼銀;李智;郭文普;;遠程教育考試成績分析決策樹的構造方法[J];計算機工程與設計;2006年06期
8 王永梅;;ID3算法在計算機成績分析中的應用[J];合肥學院學報(自然科學版);2010年01期
9 郭娜;田亞菲;郝潔;賈存麗;;一種基于改進DRNN網(wǎng)絡的決策樹構建方法[J];軟件;2010年11期
10 黃維維;葉建偉;張宏莉;;基于ID3決策樹的木馬動態(tài)檢測技術研究[J];智能計算機與應用;2011年03期
相關會議論文 前10條
1 武森;金海燕;高學東;;數(shù)據(jù)挖掘中CABOSFV聚類算法的實現(xiàn)與應用[A];全國第八屆工業(yè)工程與企業(yè)信息化學術會議論文集[C];2004年
2 段巍巍;;電信客戶流失預測主題建模[A];第十屆中國科協(xié)年會信息化與社會發(fā)展學術討論會分會場論文集[C];2008年
3 陳平;喬秀全;劉臻;田小萍;;數(shù)據(jù)挖掘網(wǎng)格中決策樹并行算法設計及性能分析[A];中國通信學會通信軟件技術委員會2009年學術會議論文集[C];2009年
4 朱強生;田英;周延泉;何華燦;;銀行業(yè)中的客戶數(shù)據(jù)挖掘[A];2006通信理論與技術新進展——第十一屆全國青年通信學術會議論文集[C];2006年
5 黃章樹;黃麗欽;;數(shù)據(jù)挖掘技術在電信增值服務行業(yè)中的應用[A];2004年中國管理科學學術會議論文集[C];2004年
6 周紅梅;薛青;;數(shù)據(jù)挖掘技術及其在裝備作戰(zhàn)仿真系統(tǒng)中的應用[A];第五屆全國仿真器學術會論文集[C];2004年
7 姜慧;張冬艷;;決策樹在建設工程款拖欠問題中的應用研究[A];全國第19屆計算機技術與應用(CACIS)學術會議論文集(下冊)[C];2008年
8 劉建華;;一個智能搜索引擎的用戶行為聚類分析[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年
9 李小明;孫金城;;數(shù)據(jù)挖掘在漢語語音合成中的應用[A];圖像 仿真 信息技術——第二屆聯(lián)合學術會議論文集[C];2002年
10 孫迎;;醫(yī)院信息的數(shù)據(jù)挖掘與方法研究[A];中華醫(yī)學會第十次全國醫(yī)學信息學術會議論文匯編[C];2004年
相關重要報紙文章 前10條
1 記者 晏燕;數(shù)據(jù)挖掘讓決策者告別“拍腦袋”[N];科技日報;2006年
2 創(chuàng)智集團副總裁 胡樂群博士;數(shù)據(jù)挖掘在CRM中的應用[N];中國計算機報;2002年
3 李開宇 黃建軍 田長春;把“數(shù)據(jù)挖掘”作用發(fā)揮出來[N];中國國防報;2009年
4 華萊士;“數(shù)據(jù)挖掘”讓銀行贏利更多[N];國際金融報;2003年
5 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學計算機科學與技術學院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
6 張立明;數(shù)據(jù)挖掘之道[N];網(wǎng)絡世界;2003年
7 中圣信息技術有限公司 李輝;數(shù)據(jù)挖掘在CRM中的作用[N];中國計算機報;2001年
8 田紅生;數(shù)據(jù)挖掘在CRM中的應用[N];中國經(jīng)濟時報;2002年
9 王廣宇;數(shù)據(jù)挖掘 加速銀行CRM一體化[N];中國計算機報;2004年
10 周蓉蓉;數(shù)據(jù)挖掘需要點想像力[N];計算機世界;2004年
相關博士學位論文 前10條
1 黃定軒;企業(yè)核心能力智能挖掘應用基礎研究[D];西南交通大學;2005年
2 王曙燕;醫(yī)學圖像智能分類算法研究[D];西北大學;2006年
3 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學;2005年
4 趙基;基于數(shù)據(jù)挖掘的銀行客戶分析管理關鍵技術研究[D];浙江大學;2005年
5 李興森;智能知識及其管理模式研究[D];中國科學院研究生院;2008年
6 孫麗;工藝知識管理及其若干關鍵技術研究[D];大連交通大學;2005年
7 胡志坤;復雜有色金屬熔煉過程操作模式智能優(yōu)化方法研究[D];中南大學;2005年
8 賀琳;基于數(shù)據(jù)挖掘的道路運行安全風險分析[D];大連海事大學;2012年
9 劉革平;基于數(shù)據(jù)挖掘的遠程學習評價研究[D];西南師范大學;2005年
10 劉寨華;基于臨床數(shù)據(jù)分析的病毒性心肌炎證候演變規(guī)律研究[D];黑龍江中醫(yī)藥大學;2006年
相關碩士學位論文 前10條
1 易s,
本文編號:2331099
本文鏈接:http://www.sikaile.net/guanlilunwen/kehuguanxiguanli/2331099.html