天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于正規(guī)化回歸模型的醫(yī)療診斷數(shù)據(jù)挖掘應(yīng)用研究

發(fā)布時(shí)間:2021-08-24 14:16
  數(shù)據(jù)挖掘方法是一種有效的信息抽取和發(fā)現(xiàn)方法,這種方法是把數(shù)據(jù)從醫(yī)院的數(shù)據(jù)庫(kù)系統(tǒng)中提取出來(lái),然后對(duì)提取出的數(shù)據(jù)進(jìn)行分析評(píng)估,找到數(shù)據(jù)中隱藏的價(jià)值,為醫(yī)療診斷提供科學(xué)依據(jù)。對(duì)于數(shù)據(jù)挖掘算法中的隨機(jī)森林算法(Random Forest,RF)具有可以處理非線性、高維度數(shù)據(jù)集的優(yōu)點(diǎn),因此在很多的領(lǐng)域中得到了廣泛的應(yīng)用。然而,RF算法存在著兩個(gè)問(wèn)題:第一,對(duì)該算法提出的改進(jìn)方法都沒(méi)有得到理論證明從而不能用于實(shí)際應(yīng)用中;第二,對(duì)RF算法效率提升的改進(jìn)仍然有很多不足之處。根據(jù)上述存在問(wèn)題本文分別做出相應(yīng)分析,提出了一種基于最優(yōu)抽樣倍數(shù)和不放回抽樣的隨機(jī)森林算法(Optimal Sampling Times and No Release Random Forest Algorithm,OSNR-RF),對(duì)提出的優(yōu)化算法的合理性進(jìn)行實(shí)驗(yàn)驗(yàn)證。論文主要內(nèi)容如下:首先,介紹數(shù)據(jù)挖掘的基本理論知識(shí),說(shuō)明數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘工作中必不可少的一步,并且詳細(xì)介紹數(shù)據(jù)預(yù)處理方法中的特征選擇算法。同時(shí)介紹正規(guī)化回歸模型以及該模型中的嶺回歸(Ridge Regression,RR)模型,正規(guī)化回歸模型具有預(yù)測(cè)準(zhǔn)確率高、模... 

【文章來(lái)源】:蘭州交通大學(xué)甘肅省

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于正規(guī)化回歸模型的醫(yī)療診斷數(shù)據(jù)挖掘應(yīng)用研究


特征子集選擇流程圖

嶺跡


(0) 0i i ,表明ix有著非常顯著的作用,然而定的值為負(fù)而且,根據(jù)古典回歸的原理認(rèn)為ix對(duì) y 的分析的原理認(rèn)為ix對(duì) y 的顯著因素為“負(fù)”影響。我們可以看出1 ( k)和2 ( k)都表現(xiàn)出很不穩(wěn)定的現(xiàn)此種情況主要是因?yàn)?x和2x相關(guān)性很大,也就是說(shuō)從變量選擇的角度看,我們需要對(duì)變量二選一,這號(hào)不符合常理的情況。從實(shí)際情況出發(fā),1 和2 R 分析給出了相應(yīng)的解釋。,我們需要把所有的回歸系數(shù)都反映在一張圖上才到嶺回歸分析中去,要是呈現(xiàn)的嶺跡圖很不穩(wěn)定,估計(jì)能否在嶺回歸估計(jì)中表現(xiàn)良好。圖 3.1(e)顯此時(shí)的最小二乘估計(jì)是合理的并且是可行的。如果以通過(guò)選擇最優(yōu)的 k 值來(lái)進(jìn)行確定。

嶺跡


值的選擇用的嶺參數(shù)的嶺跡分析方法估計(jì)的回歸系數(shù)回歸系數(shù)的符號(hào)不合理的的嶺回歸系數(shù)具有平方和沒(méi)有發(fā)生太大的改變明如圖 3.2 可知都趨向于穩(wěn)定值蘭州交通大學(xué)工程碩士學(xué)位論文參數(shù) k 值選擇方法[38]。的嶺跡分析方法,選取k值的一般原則是:的回歸系數(shù)基本穩(wěn)定;符號(hào)不合理的,在用最小二乘估計(jì)時(shí)其嶺估回歸系數(shù)具有現(xiàn)實(shí)意義;平方和沒(méi)有發(fā)生太大的改變;可知,k值的選擇取0k處,由圖中我們可以都趨向于穩(wěn)定值,此時(shí)取0k k。其嶺估由圖中我們可以

【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林的PM2.5實(shí)時(shí)預(yù)報(bào)系統(tǒng)[J]. 侯俊雄,李琦,朱亞杰,馮逍,毛曦.  測(cè)繪科學(xué). 2017(01)
[2]主成分回歸和嶺回歸在新疆農(nóng)業(yè)經(jīng)濟(jì)的應(yīng)用[J]. 開(kāi)璇,張莉莉.  遼寧農(nóng)業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào). 2017(01)
[3]基于小波變換和隨機(jī)森林的森林類型分類研究[J]. 呂杰,汪康寧,李崇貴,馬婷.  西北林學(xué)院學(xué)報(bào). 2016(06)
[4]基于隨機(jī)森林分類模型的DDoS攻擊檢測(cè)方法[J]. 于鵬程,戚湧,李千目.  計(jì)算機(jī)應(yīng)用研究. 2017(10)
[5]基于隨機(jī)森林深度特征選擇的人體姿態(tài)估計(jì)[J]. 朱玨鈺,曹亞微,周書(shū)仁,李峰.  計(jì)算機(jī)工程與應(yīng)用. 2017(02)
[6]大數(shù)據(jù)相關(guān)分析綜述[J]. 梁吉業(yè),馮晨嬌,宋鵬.  計(jì)算機(jī)學(xué)報(bào). 2016(01)
[7]L1正則化機(jī)器學(xué)習(xí)問(wèn)題求解分析[J]. 孔康,汪群山,梁萬(wàn)路.  計(jì)算機(jī)工程. 2011(17)
[8]基于out-of-bag樣本的隨機(jī)森林算法的超參數(shù)估計(jì)[J]. 李毓,張春霞.  系統(tǒng)工程學(xué)報(bào). 2011(04)
[9]特征選擇算法綜述[J]. 計(jì)智偉,胡珉,尹建新.  電子設(shè)計(jì)工程. 2011(09)
[10]隨機(jī)森林方法研究綜述[J]. 方匡南,吳見(jiàn)彬,朱建平,謝邦昌.  統(tǒng)計(jì)與信息論壇. 2011(03)

碩士論文
[1]基于甲狀腺疾病的臨床數(shù)據(jù)挖掘與分析研究[D]. 許騰.東華大學(xué) 2016
[2]隨機(jī)森林在文本分類中的應(yīng)用[D]. 賀捷.華南理工大學(xué) 2015
[3]基于排序熵的有序決策樹(shù)高效算法研究[D]. 陳建凱.河北大學(xué) 2014



本文編號(hào):3360145

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/3360145.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3db4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com