天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 醫(yī)學(xué)論文 > 精神病論文 >

基于代價敏感的特征選擇算法研究及應(yīng)用

發(fā)布時間:2020-05-15 06:23
【摘要】:在疾病數(shù)據(jù)的處理過程中,特征選擇是一個非常重要的前置步驟。但疾病數(shù)據(jù)集通常具有樣本量小、特征維度高、類別不平衡、沒有區(qū)分疾病亞型等特點。常用的特征選擇算法因為沒有考慮到這些特點帶來的問題,從而導(dǎo)致在處理這些數(shù)據(jù)時,會忽略掉一些有用的特征。因此,本文圍繞上述問題,展開了如下研究:1、在理論層面,為解決常用算法中基于統(tǒng)計的評價指標(biāo)不適應(yīng)疾病數(shù)據(jù)特點的問題,提出了一種基于代價敏感的、針對疾病數(shù)據(jù)特點的過濾式特征選擇算法,并在公開數(shù)據(jù)集上與其它常用算法進(jìn)行了對比測試。結(jié)果顯示,該算法選出的特征能有效提升分類器表現(xiàn),并能在一定程度上避免選入冗余特征。2、在應(yīng)用層面,為在語音中找到能夠用于識別抑郁癥的關(guān)鍵特征,將本文提出的特征選擇算法應(yīng)于基于語音的抑郁癥識別研究中。根據(jù)特征選擇結(jié)果,得出了抑郁癥患者在語音上具有遲緩、沙啞等特點的結(jié)論。進(jìn)一步分析發(fā)現(xiàn),在不同任務(wù)中,語音特征上的差異也各不相同。得出了在訪談、朗讀這兩類任務(wù)中采集的語音能更有效地區(qū)分抑郁癥的結(jié)論。3、基于上述工作,將選擇出的特征與不同任務(wù)下的語音納入綜合考慮,并以此構(gòu)建了一個通過語音識別抑郁癥的模型。該模型在一期實驗范式的男性、女性樣本集上分別達(dá)到了80.7%、74.7%的分類正確率,在二期實驗范式的男性、女性樣本集上分別達(dá)到了66.7%、67.8%的分類正確率。綜上所述,本文工作主要聚焦于特征選擇算法設(shè)計,提出了一種基于代價敏感的、針對疾病數(shù)據(jù)特點的特征選擇算法。然后將該算法應(yīng)用于基于語音的抑郁癥識別研究,在對實驗采集的數(shù)據(jù)進(jìn)行了特征選擇和分析后,將語音也看作特征的一個維度,與其余特征組合在一起,構(gòu)建了一個新的抑郁癥識別模型。
【圖文】:

序列,特征選擇


圖 1-1 特征選擇的基本框架如圖 1-1 所示,目前的特征選擇算法是一套包含了多種方法與策略的框架,其中包含了特征評價指標(biāo)、特征搜索過程、搜索停止準(zhǔn)則、驗證評估方法等多個內(nèi)容[30]。一般的特征選擇所需步驟如下所述:1、首先,使用特征評價指標(biāo)對單個特征或特征子集的有效性進(jìn)行評價。在這一步驟中,用到的評價指標(biāo)計算方式有:方差分析、互信息、卡方檢驗、分類器的分類正確率等。按照評價指標(biāo)的原理和作用范圍,可將特征選擇方法分為過濾式(Filter)、包裹式(Wrapper)、嵌入式(Embedded)等。2、然后,基于評價指標(biāo)制定一定的搜索策略,尋找最優(yōu)的特征子集,在這一部分中根據(jù)其搜索方法又可以分為窮舉、啟發(fā)式增刪、隨機(jī)選擇等策略。例如窮舉搜索中的廣度優(yōu)先搜索、深度優(yōu)先搜索,以及啟發(fā)式搜索中的序列前向搜索、序列后向搜索、遺傳算法等。3、搜索停止準(zhǔn)則是在搜索過程中,根據(jù)一定的指標(biāo)停止搜索過程。例如選擇的特征數(shù)目達(dá)到指定數(shù)目、特征評價指標(biāo)達(dá)到指定閾值等。

集成學(xué)習(xí)


蘭州大學(xué)碩士學(xué)位論文 基于代價敏感的特征選擇算法研究及應(yīng)用要么陷入局部最優(yōu)導(dǎo)致過擬合,要么無法進(jìn)行有效尋優(yōu)導(dǎo)致在驗證集和測試集上分類正確率很低。要在單個模型上同時解決這兩個問題是非常困難的。因此,可以考慮退而求其次,通過劃分?jǐn)?shù)據(jù),用各個部分的數(shù)據(jù)子集所包含的信息去訓(xùn)練多個模型[41]。一個很可能的結(jié)果是,每一個模型都擁有各自的優(yōu)缺點,且因為每一個模型所用的訓(xùn)練數(shù)據(jù)各不相同,它們的優(yōu)點之間是可以互相彌補(bǔ)的。然后,根據(jù)一定的融合策略,如加權(quán)、投票等,將每個模型組合在一起,得到最終的模型。其基本框架如圖 2-1 所示所示。在這過程中,每一個分類器被稱為基學(xué)習(xí)器;鶎W(xué)習(xí)器在一定集成提升策略下,,共同構(gòu)成一個集成學(xué)習(xí)模型。
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP181;R749.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳中華;鄭瑋;;基于?_(2,1)范數(shù)的在線流特征選擇算法[J];計算機(jī)與數(shù)字工程;2019年06期

2 代琨;于宏毅;馬學(xué)剛;李青;;基于支持向量機(jī)的特征選擇算法綜述[J];信息工程大學(xué)學(xué)報;2014年01期

3 陳建華;王治和;蔣蕓;許虎寅;樊東輝;;一種改進(jìn)的文本分類特征選擇算法[J];微電子學(xué)與計算機(jī);2011年12期

4 張文靜;王備戰(zhàn);張志宏;;基于圖的特征選擇算法綜述[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2017年01期

5 孫剛;張靖;;面向高維微陣列數(shù)據(jù)的集成特征選擇算法[J];計算機(jī)工程與科學(xué);2016年07期

6 張自敏;;大數(shù)據(jù)中基于稀疏投影的在線特征選擇算法[J];湖南科技大學(xué)學(xué)報(自然科學(xué)版);2018年03期

7 陳曉明;;海量高維數(shù)據(jù)下分布式特征選擇算法的研究與應(yīng)用[J];科技通報;2013年08期

8 李富星;蒙祖強(qiáng);;一種改進(jìn)的類別區(qū)分詞特征選擇算法[J];計算機(jī)與現(xiàn)代化;2019年03期

9 劉飛飛;;特征選擇算法及應(yīng)用綜述[J];辦公自動化;2018年21期

10 侯嶼;秦小林;彭皓月;張力戈;;全局調(diào)距和聲特征選擇算法[J];計算機(jī)工程與應(yīng)用;2019年02期

相關(guān)會議論文 前10條

1 甄超;鄭濤;許潔萍;;音樂流派分類中特征選擇算法研究[A];第18屆全國多媒體學(xué)術(shù)會議(NCMT2009)、第5屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2009)、第5屆全國普適計算學(xué)術(shù)會議(PCC2009)論文集[C];2009年

2 陳偉海;李建軍;趙志華;曹丹陽;李晉宏;;數(shù)據(jù)挖掘特征選擇算法研究及其在鋁電解中的應(yīng)用[A];2011中國有色金屬行業(yè)儀表自動化學(xué)術(shù)會議論文集[C];2011年

3 張仰森;曹元大;;最大熵建模方法中一種改進(jìn)的特征選擇算法[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年

4 張錚;胡社教;江萍;;基于EP模式的特征選擇算法[A];2011中國儀器儀表與測控技術(shù)大會論文集[C];2011年

5 周炎濤;唐劍波;王家琴;;基于信息熵的改進(jìn)TFIDF特征選擇算法[A];第二十六屆中國控制會議論文集[C];2007年

6 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

7 李文法;段m#毅;劉悅;孫春來;;一種面向流分類的特征選擇算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

8 戴鍵;楊宏暉;;用于水聲目標(biāo)識別的自適應(yīng)免疫克隆特征選擇算法[A];2011'中國西部聲學(xué)學(xué)術(shù)交流會論文集[C];2011年

9 楊宏暉;李江濤;甘安琴;姚曉輝;;用于水下目標(biāo)識別的無監(jiān)督譜特征選擇算法[A];2016年中國造船工程學(xué)會水中目標(biāo)特性學(xué)組學(xué)術(shù)交流會論文集[C];2016年

10 羅勇;周超;許超;;文本分類在商品廣告分類中的應(yīng)用[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議?(第一冊)[C];2011年

相關(guān)博士學(xué)位論文 前10條

1 田肅巖;吸納通路信息識別相關(guān)基因的特征選擇算法的研究[D];吉林大學(xué);2018年

2 黃鑫;基于特征關(guān)聯(lián)關(guān)系的特征選擇算法研究[D];大連理工大學(xué);2018年

3 李云;特征選擇算法及其在基于內(nèi)容圖像檢索中的應(yīng)用研究[D];重慶大學(xué);2005年

4 張靖;面向高維小樣本數(shù)據(jù)的分類特征選擇算法研究[D];合肥工業(yè)大學(xué);2014年

5 劉華文;基于信息熵的特征選擇算法研究[D];吉林大學(xué);2010年

6 史彩娟;網(wǎng)絡(luò)空間圖像標(biāo)注中半監(jiān)督稀疏特征選擇算法研究[D];北京交通大學(xué);2015年

7 楊杰明;文本分類中文本表示模型和特征選擇算法研究[D];吉林大學(xué);2013年

8 潘巍巍;故障嚴(yán)重程度識別的有序分類特征分析方法[D];哈爾濱工業(yè)大學(xué);2013年

9 楊峻山;生物組學(xué)數(shù)據(jù)的集成特征選擇研究[D];深圳大學(xué);2017年

10 王劍橋;基于局部特性的毫米波距離像識別方法研究[D];南京理工大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 李昌聰;基于代價敏感的特征選擇算法研究及應(yīng)用[D];蘭州大學(xué);2019年

2 李森;基于多目標(biāo)進(jìn)化優(yōu)化的癌癥數(shù)據(jù)特征選擇算法研究[D];安徽大學(xué);2019年

3 郭偉;大樣本高維數(shù)據(jù)下基于進(jìn)化多目標(biāo)優(yōu)化的特征選擇算法研究[D];安徽大學(xué);2019年

4 唐莉;基于樣本差異性分析的多標(biāo)記特征選擇算法研究[D];閩南師范大學(xué);2019年

5 趙凱;Android惡意應(yīng)用檢測中特征選擇算法的研究[D];湖南大學(xué);2016年

6 趙軍;基于Top-r方法的特征選擇算法研究[D];湖南大學(xué);2014年

7 樊力文;基于Spark的穩(wěn)定特征及流式特征選擇算法研究[D];河南大學(xué);2018年

8 脫倩娟;基于數(shù)據(jù)相似性的特征選擇算法研究[D];閩南師范大學(xué);2018年

9 張夢林;基于SAL框架的特征選擇算法[D];吉林大學(xué);2018年

10 施瑞朗;中文文本分類中特征選擇算法的研究與改進(jìn)[D];杭州電子科技大學(xué);2018年



本文編號:2664609

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/jsb/2664609.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aa50b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com