天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

布爾向量數(shù)據(jù)模式分類關(guān)鍵問題及中醫(yī)診斷量表研制

發(fā)布時間:2021-06-30 06:55
  論文提出和研究了布爾向量數(shù)據(jù)模式分類中的關(guān)鍵問題,并將研究結(jié)果應(yīng)用于中醫(yī)學診斷量表研制當中。對布爾向量模式分類中的相似系數(shù)、降維以及權(quán)重這三個關(guān)鍵問題進行了系統(tǒng)地研究。為后續(xù)進一步研究針對布爾向量數(shù)據(jù)的模式分類問題完成了初步性的工作。論文主要工作和創(chuàng)新點總結(jié)如下:一、對布爾向量的相似系數(shù)及其性質(zhì)進行了研究,并在此基礎(chǔ)上對目前常見的相似系數(shù)的性質(zhì)進行了對比和分析,針對一些模式分類問題中的相似系數(shù)選擇問題,提出了多參數(shù)相似系數(shù)族及其優(yōu)化方法。通過真實數(shù)據(jù)的實驗結(jié)果,驗證了本文提出的相似系數(shù)族在布爾向量模式分類問題的相似系數(shù)優(yōu)化中的有效性。二、對于布爾向量數(shù)據(jù)的降維從特征提取和特征選擇兩個方面進行了研究:其一,根據(jù)布爾向量數(shù)據(jù)的特點,提出和研究了基于分片求和的特征提取降維算法,通過理論分析和真實數(shù)據(jù)實驗,驗證了本文方法的有效性;其二,針對兩類互斥問題、多類非互斥問題,分別提出了基于布爾向量相似系數(shù)的過濾式和混合式特征選擇降維算法,通過真實數(shù)據(jù)的實驗結(jié)果,驗證了這些算法在解決這兩類問題時的有效性。三、在對現(xiàn)有特征權(quán)重方法研究的基礎(chǔ)上,針對k-NN特征權(quán)重算法計算量大速度慢的缺點,提出了改進算法... 

【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:138 頁

【學位級別】:博士

【部分圖文】:

布爾向量數(shù)據(jù)模式分類關(guān)鍵問題及中醫(yī)診斷量表研制


均勻分布時布爾向量樣本對之間的距離期望與維數(shù)m的關(guān)系

概率分布,布爾向量,范數(shù),值分布


幾ble1.1ProbabilityofBinomialdistributions}月},012…k…。一1尹,,(每)。了即。”一‘C廠尸,!币,…心尸‘。”一‘…即一,。則列向量月的入范數(shù)的期望為E(x;)一nP’,方差a(x:)一行面。對于隨機變量每各個可能取值的相應(yīng)概率可以用表l.l進行計算,但如果.1中的表達式逐個計算的工作量很大,因此對于隨機變量每各個可能取值率一般使用下面的式(l.2)進行計算。則當。固定等于10,p=0.2、0.5、0的概率分布如圖1.3所示;當p固定等于0.2,n=5、10、20時對應(yīng)的概圖1.4所示。由此圖1.3及1.4可見,布爾向量的八范數(shù)值的分布不但與中1的出現(xiàn)概率有關(guān),并且與布爾向量的維數(shù)m有關(guān)。夕,(k+l)=n一kk+1P,’一’P,L叼(1.2)

均勻分布,失真率,概率,樣本


圖3.4.樣本失真率:、失真概率p。,隨分片長度l的變化情.3.4TrendofsamPlesdistortion公anddistortionProbabilityP。withPiecinglengthl多個分片組合樣地,首先假設(shè)樣本集按圖3.2的模式服從均勻分布(即樣本集從二項分布),并且假設(shè)樣本矩陣的屬性之間(即列向量之間)相面我們對于單個分片內(nèi)的失真率、失真概率及隨分片長度不同了分析。因為布爾向量矩陣常常為稀疏矩陣,所以我們不妨設(shè)1的個數(shù)都小于某個值t(即t=max,(ll戈}};)),則對于高維。下面我們將對稀疏布爾向量樣本集,對多個分片組合成的情形分片長度為l二2(不妨設(shè)m可以被l整除,若不能整除可進行如操作,此處不再贅述)。顯然,此時分片數(shù):=m/l=m/2。對于,如圖3.5所示,當且僅當,兩個樣本對分別為【0,l]和【1,0]時,為2分0,此時完全失真。因為樣本集服從均勻分布,則對于該

【參考文獻】:
期刊論文
[1]文本層次分類中特征項權(quán)重算法的比較研究[J]. 譚金波.  情報雜志. 2007(09)
[2]粒度世界拓撲結(jié)構(gòu)的理論研究[J]. 蒙祖強,史忠植.  控制與決策. 2007(09)
[3]基于PSO面向K近鄰分類的特征權(quán)重學習算法[J]. 任江濤,卓曉嵐,許盛燦,印鑒.  計算機科學. 2007(05)
[4]高維索引機制中的降維方法綜述[J]. 吳玲達,賀玲,蔡益朝.  計算機應(yīng)用研究. 2006(12)
[5]高維空間中數(shù)據(jù)的相似性度量[J]. 賀玲,吳玲達,蔡益朝.  數(shù)學的實踐與認識. 2006(09)
[6]循證醫(yī)學與實驗診斷學[J]. 梁勤.  中國實驗診斷學. 2006(03)
[7]最小距離分類器的改進算法——加權(quán)最小距離分類器[J]. 任靖,李春平.  計算機應(yīng)用. 2005(05)
[8]基于SVM的特征加權(quán)KNN算法[J]. 陳振洲,李磊,姚正安.  中山大學學報(自然科學版). 2005(01)
[9]文本自動分類中特征權(quán)重算法的改進研究[J]. 徐鳳亞,羅振聲.  計算機工程與應(yīng)用. 2005(01)
[10]基于Relief的組合式特征選擇[J]. 張麗新,王家廞,趙雁南,楊澤紅.  復(fù)旦學報(自然科學版). 2004(05)



本文編號:3257270

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/projectlw/xtxlw/3257270.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶edf74***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com