特征選擇方法及其在紅斑鱗狀皮膚病診斷中的應用研究
本文選題:特征選擇 切入點:F-score 出處:《陜西師范大學》2010年碩士論文 論文類型:學位論文
【摘要】: 特征選擇作為一種數(shù)據(jù)預處理的重要方法,是監(jiān)督學習算法中的一個重要組成部分,在數(shù)據(jù)挖掘、機器學習,模式識別等相關領域的研究和應用中有重要地位。近年來,圖像處理、文本識別、基因表達等大規(guī)模問題的不斷出現(xiàn),特征選擇算法越來越受到人們的重視,并對其提出了嚴峻的挑戰(zhàn),尋找能夠適應大規(guī)模數(shù)據(jù)的準確性和運行效率等綜合性能較好的特征選擇方法成為一種迫切的需要。本文對高維數(shù)據(jù)的特征選擇算法作了一些研究,提出了一種適用于多類別模式識別問題特征選擇的特征重要性度量策略,并將所提出的特征選擇算法應用到紅斑鱗狀皮膚病診斷中研究中。本文的主要工作包括以下幾個部分。 首先,對目前特征選擇的研究現(xiàn)狀和問題進行了具體而又深入的研究,分析了特征選擇的定義,特征選擇算法與特征提取的關系,特征選擇的四個方面,特征選擇的兩種模式,歸納了幾種常見的搜索算法,并提出了特征選擇算法的選用技巧。 其次,提出了一種改進的F-score特征選擇方法。傳統(tǒng)的F-score特征選擇方法是度量樣本特征在兩類之間的辨別能力的方法,本文對其進行推廣,提出了改進的F-score,使其不但能夠評價樣本特征在兩類之間的辨別能力,而且能夠度量樣本特征在多類之間的辨別能力大小。另外,結合Filter和Wrapper各自的優(yōu)缺點,提出了基于IFSFS (Improved F-score and Sequential Forward Search(順序前進法))與SVM (Support Vector Machines,支持向量機)的特征選擇方法。它以改進的F-score作為特征選擇準則,順序前進法(SFS)作為特征選擇的搜索方法,用支持向量機作為分類方法來評估特征子集的有效性,實現(xiàn)有效的特征選擇,并將該方法應用到紅斑鱗狀皮膚病的診斷中。通過實驗結果證明該特征選擇方法的有效性。 最后,針對SFS的主要缺點,即一旦某個特征已入選,即使由于后加入的特征使它變?yōu)槎嘤?也無法再把它剔除,本文提出了基于IFSFFS(Improved F-score and Sequential Forward Floating Search(順序前進浮動搜索))與SVM相結合的特征選擇方法。將IFSFFS+SVM特征選擇方法應用到紅斑鱗狀皮膚病診斷中進行實驗測試發(fā)現(xiàn),該方法取得了非常好的診斷效果。
[Abstract]:As an important method of data preprocessing, feature selection is an important part of supervised learning algorithm, and plays an important role in the research and application of data mining, machine learning, pattern recognition and so on. With the emergence of large scale problems such as image processing, text recognition, gene expression and so on, feature selection algorithms have been paid more and more attention to, and put forward a severe challenge to them. It is an urgent need to find feature selection methods that can adapt to the accuracy and efficiency of large scale data. In this paper, we do some research on the feature selection algorithm for high dimensional data. In this paper, a feature importance measurement strategy for multi-class pattern recognition problem is proposed, and the proposed feature selection algorithm is applied to the diagnosis of erythema squamous dermatosis. The main work of this paper includes the following parts. First of all, the current research status and problems of feature selection are studied in detail, and the definition of feature selection, the relationship between feature selection algorithm and feature extraction, the four aspects of feature selection are analyzed. Two patterns of feature selection, several common search algorithms are summarized, and the selection skills of feature selection algorithms are proposed. Secondly, an improved F-score feature selection method is proposed. In this paper, an improved F-score-based algorithm is proposed, which can not only evaluate the discriminative ability of sample features between two classes, but also measure the discriminative ability of sample features between different classes. In addition, combining the advantages and disadvantages of Filter and Wrapper, the improved F-score. A new feature selection method based on IFSFS improved F-score and Sequential Forward search and SVM support Vector machines is proposed. The improved F-score is used as the feature selection criterion, and the sequential forward method is used as the search method for feature selection. Support vector machine (SVM) is used as classification method to evaluate the effectiveness of feature subset and to realize effective feature selection. The method is applied to the diagnosis of erythema squamous dermatosis. The experimental results show that the feature selection method is effective. Finally, the main drawback of SFS is that once a feature has been selected, it can no longer be eliminated, even if it becomes redundant because of the added feature. In this paper, a feature selection method based on IFSFFS(Improved F-score and Sequential Forward Floating search and SVM is proposed. The IFSFFS SVM feature selection method is applied to the diagnosis of erythema squamous skin disease. This method has achieved a very good diagnostic effect.
【學位授予單位】:陜西師范大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:R758.6;TP181
【相似文獻】
相關期刊論文 前10條
1 許朝霞;王憶勤;顏建軍;郭睿;劉國萍;燕海霞;李福鳳;徐t;郝一鳴;錢鵬;;基于支持向量機和人工神經(jīng)網(wǎng)絡的心血管疾病中醫(yī)證候分類識別研究[J];北京中醫(yī)藥大學學報;2011年08期
2 董書琴;謝宏;;基于CSP與SVM算法的警覺度腦電信號分類[J];微型機與應用;2011年16期
3 劉偉;王建平;張崇巍;;基于SVM的生物電阻抗人體內(nèi)臟脂肪測量研究[J];電子測量與儀器學報;2011年07期
4 李淑賢;陳超;王淑美;鄧小慧;梁生旺;;支持向量機回歸算法用于篩選腦得生抗血栓有效部位[J];中藥材;2011年07期
5 周酥;朱蒂;吳效明;黃岳山;;基于小波變換的心音包絡提取算法及應用[J];中國組織工程研究與臨床康復;2011年30期
6 李立奇;張瑗;周躍;王開發(fā);;基于氨基酸對含纖連蛋白域蛋白質(zhì)亞細胞的定位預測(英文)[J];中國組織工程研究與臨床康復;2011年21期
7 賴麗娟;王志剛;吳效明;熊冬生;;基于支持向量機的ICU中急性低血壓預測模型研究[J];生物醫(yī)學工程學雜志;2011年03期
8 黃志華;李明泓;馬原野;周昌樂;;事件誘發(fā)電位信號分類的時空特征提取方法[J];生物化學與生物物理進展;2011年09期
9 李蓉;孫媛;;機器學習技術在胸癌診斷中的應用[J];科學技術與工程;2011年20期
10 孟秋池;邵偉;葛成偉;程浩;丁建東;;基于臨床與基因圖譜的結腸癌基因標簽提取[J];數(shù)學的實踐與認識;2011年14期
相關會議論文 前10條
1 林杰華;張斌;李冬森;宋華茂;余志強;王浩;;支持向量機在電力客戶信用評級中的應用[A];全國第21屆計算機技術與應用學術會議(CACIS·2010)暨全國第2屆安全關鍵技術與應用學術會議論文集[C];2010年
2 蔣鐵軍;張懷強;李積源;;多變量系統(tǒng)預測的支持向量機方法研究[A];管理科學與系統(tǒng)科學研究新進展——第7屆全國青年管理科學與系統(tǒng)科學學術會議論文集[C];2003年
3 黃淑云;孫興玉;梁汝萍;邱建丁;;基于小波支持向量機預測蛋白質(zhì)亞細胞定位研究[A];第十一屆全國計算(機)化學學術會議論文摘要集[C];2011年
4 謝湘;匡鏡明;;支持向量機在語音識別中的應用研究[A];現(xiàn)代通信理論與信號處理進展——2003年通信理論與信號處理年會論文集[C];2003年
5 涂冬成;薛龍;劉木華;趙進輝;沈杰;吁芳;;基于支持向量機的鵝肉肉色客觀評定研究[A];中國農(nóng)業(yè)工程學會電氣信息與自動化專業(yè)委員會、中國電機工程學會農(nóng)村電氣化分會科技與教育專委會2010年學術年會論文摘要[C];2010年
6 楊凌;劉玉樹;;基于支持向量機的坦克識別算法[A];第三屆全國數(shù)字成像技術及相關材料發(fā)展與應用學術研討會論文摘要集[C];2004年
7 師旭超;巴松濤;;基于支持向量機方法的深基坑變形預測[A];科技、工程與經(jīng)濟社會協(xié)調(diào)發(fā)展——河南省第四屆青年學術年會論文集(上冊)[C];2004年
8 張軍;;支持向量機方法在地下水位干擾排除中的初步應用[A];2007年地震流體學術研討會論文摘要集[C];2007年
9 許建生;盛立東;;基于改進的支持向量機和BP神經(jīng)網(wǎng)絡的識別算法[A];第八屆全國漢字識別學術會議論文集[C];2002年
10 榮海娜;張葛祥;張翠芳;;基于支持向量機的非線性系統(tǒng)辨識方法[A];中國自動化學會、中國儀器儀表學會2004年西南三省一市自動化與儀器儀表學術年會論文集[C];2004年
相關重要報紙文章 前10條
1 課題主持人 李心丹 課題協(xié)調(diào)人 上海證券交易所 施東暉 傅浩 課題研究員 宋素榮 查曉磊 賓紅輝 張許宏 郭靜靜 黃雋 南京大學工程管理學院;內(nèi)幕交易與市場操縱的行為動機與判別監(jiān)管研究[N];中國證券報;2007年
2 李水根;計算機詳解配伍與藥效關系[N];健康報;2005年
3 清華大學 蘇光大;非接觸式人臉識別技術[N];計算機世界;2006年
4 YMG記者 李仁 通訊員 曲華明 孫運智;我市九項目進入省“盤子”[N];煙臺日報;2010年
5 上海大學理學院教授、副院長 陸文聰;酷愛化學 孜孜以求[N];中國化工報;2006年
6 ;選擇合適的數(shù)據(jù)挖掘算法[N];計算機世界;2007年
7 周穎;王米渠與中醫(yī)心理學[N];中國中醫(yī)藥報;2006年
8 記者 耿挺;蛋白質(zhì)功能算出來[N];上?萍紙;2007年
9 記者 張云普邋通訊員 全攀峰 安強強;大慶物探深度域地震資料巖性解釋技術獲得五大突破[N];中國石油報;2008年
10 本報記者 馮治恩;敢與“雷公”試比高[N];銅川日報;2008年
相關博士學位論文 前10條
1 于哲夫;一種新的特征選擇方法及其在路面使用性能分析中的應用[D];大連海事大學;2011年
2 杜小芳;基于CPFR的農(nóng)產(chǎn)品采購模型研究[D];華中科技大學;2005年
3 劉育明;動態(tài)過程數(shù)據(jù)的多變量統(tǒng)計監(jiān)控方法研究[D];浙江大學;2006年
4 欒鋒;支持向量機(SVM)和徑向基神經(jīng)網(wǎng)絡(RBFNN)方法在化學、環(huán)境化學和藥物化學中的應用研究[D];蘭州大學;2006年
5 孫薇;市場條件下抽水蓄能電站效益綜合評價及運營模式研究[D];華北電力大學(河北);2007年
6 常群;支持向量機的核方法及其模型選擇[D];哈爾濱工業(yè)大學;2007年
7 朱燕飛;鋅鋇白回轉窯煅燒過程智能建模研究[D];華南理工大學;2005年
8 田英杰;支持向量回歸機及其應用研究[D];中國農(nóng)業(yè)大學;2005年
9 燕忠;基于蟻群優(yōu)化算法的若干問題的研究[D];東南大學;2005年
10 任東;基于支持向量機的植物病害識別研究[D];吉林大學;2007年
相關碩士學位論文 前10條
1 張寶華;支持向量機在入侵檢測系統(tǒng)中的研究和應用[D];天津理工大學;2010年
2 江鋒;支持向量機在分類及人臉檢測應用中的研究[D];南京理工大學;2003年
3 傅正鋼;基于統(tǒng)計學習的人工智能在數(shù)字游戲和數(shù)字娛樂上的應用[D];浙江大學;2004年
4 朱曉芳;基于支持向量機的田間雜草識別方法研究[D];江蘇大學;2010年
5 朱明玲;基于改進的小波變換和支持向量機的紡織細紗機故障自動診斷[D];東華大學;2011年
6 賴永標;支持向量機在地下工程中的應用研究[D];山東科技大學;2004年
7 劉偉麗;基于粒子群算法和支持向量機的中文文本分類研究[D];河南工業(yè)大學;2010年
8 沈徐輝;基于核主成分與支持向量機的體內(nèi)藥物代謝預測[D];浙江大學;2011年
9 李錚;基于支持向量機的道路交通標志識別的研究[D];燕山大學;2011年
10 王啟超;基于組合核函數(shù)支持向量機的軟測量技術及其應用研究[D];江西理工大學;2011年
,本文編號:1570276
本文鏈接:http://www.sikaile.net/yixuelunwen/pifb/1570276.html