面向多特征集成的;7椒捌鋺醚芯
發(fā)布時間:2018-06-28 20:56
本文選題:多粒度 + 信息;; 參考:《江蘇科技大學》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展,特別是近年來云計算、物聯(lián)網(wǎng)、社交網(wǎng)絡等新興服務的快速普及,人類社會產(chǎn)生的數(shù)據(jù)規(guī)模正以一種前所未有的速度增長.從大規(guī)模復雜數(shù)據(jù)中,以應用需求為目標,挖掘有效的信息已經(jīng)成為現(xiàn)代科技發(fā)展的主要驅(qū)動力.然而,現(xiàn)代數(shù)據(jù)具有描述的多樣性、來源的廣博性、結(jié)構(gòu)的復雜性、增長的飛速性等典型特征,探尋如何從規(guī)模龐大且復雜異構(gòu)的數(shù)據(jù)中獲取蘊含的深層信息和隱含知識,相對于傳統(tǒng)的數(shù)據(jù)挖掘與知識發(fā)現(xiàn)任務而言,顯得任重而道遠且極具挑戰(zhàn)性.目前很多大規(guī)模復雜數(shù)據(jù)處理方法中,分而治之是一種能被廣泛接受的策略,即先采用適當?shù)某闃踊蚍謱蛹夹g對復雜數(shù)據(jù)進行合理的“分割”,再建立高效的學習機制對各部分數(shù)據(jù)進行針對性地處理,該策略體現(xiàn)了人類面臨復雜問題時所擁有的多粒度認知能力.但粒度世界的多樣性致使有關多粒度的研究面臨計算復雜度高、對指定目標特性掌握不夠、缺乏足夠的融合思想與動態(tài)學習能力等嚴峻挑戰(zhàn),鑒于此,本文將在復雜數(shù)據(jù)背景下,分別從標記多特征空間的信息;(shù)多特征空間的分類器設計、多特征空間的融合學習方法等方面來探索高效的多粒度信息;夹g,并以此為基礎發(fā)展新的多粒度建模與知識獲取方法.具體而言,本文的研究內(nèi)容和創(chuàng)新性成果主要在于:(1)單標記下的特征空間轉(zhuǎn)換策略與粗糙數(shù)據(jù)分析.有關粗糙集的研究大多建立在原始特征空間之上,并未考慮具有不同決策類別的樣本可能擁有自身特定的性質(zhì),而這些特性往往有助于產(chǎn)生更為精準的規(guī)則.為此,本文針對決策系統(tǒng)中不同的決策類,提出了一種能夠反映各個決策類性質(zhì)的多特征空間轉(zhuǎn)換策略,并給出了多特征空間下決策系統(tǒng)近似質(zhì)量和條件熵的定義方法,有效地降低了決策系統(tǒng)的不確定性程度,提升了分類性能.(2)多標記下的特征空間轉(zhuǎn)換策略與粗糙數(shù)據(jù)分析.考慮到不同標記可能會帶有其自身的一些特性,故為多標記學習構(gòu)建類屬特征空間顯得尤為重要.然而,類屬特征空間的構(gòu)建可能導致特征空間維度的增加,且含有大量冗余信息.為了緩解該不足,本文借助模糊粗糙近似約簡的思想,提出了兩種基于類屬特征空間維度約簡的多標記學習方法,即:FRS-LIFT和FRS-SS-LIFT.其中,FRS-SS-LIFT在FRS-LIFT的基礎上,采用了樣本選擇策略,大幅降低了維度約簡的時間消耗.相關實驗結(jié)果驗證了本文算法在提升多標記學習系統(tǒng)預測性能的可行性和高效性.(3)參數(shù)化特征空間下的協(xié)同分類方法.在鄰域粗糙集模型中,隨著信息粒尺寸的增長,基于多數(shù)投票原則的鄰域分類器容易對未知樣本的類別產(chǎn)生誤判.為了緩解該不足,本文借助協(xié)同表達的思想,提出了一種鄰域協(xié)同分類器NCC.該算法在未知樣本的鄰域空間內(nèi),通過協(xié)同表達的方式找出與未知樣本具有最小重構(gòu)誤差的類別作為預測的類別標記.相關實驗結(jié)果在驗證本文算法能夠提升較大尺寸信息粒下鄰域分類器分類性能的同時,也表明該算法是一種降低傳統(tǒng)CRC算法時間消耗的有效手段.(4)多特征空間融合策略下的蛋白質(zhì)結(jié)構(gòu)類型預測方法.本文針對生物信息學中蛋白質(zhì)二級結(jié)構(gòu)類型的預測問題,先從Pse AAC和Pse PSSM兩個視角抽取了蛋白質(zhì)序列的特征,并將兩者以串行方式融合,再以k-近鄰錯誤率最小化為目標,借助啟發(fā)式搜索策略,提出了一種基于k-近鄰錯誤率下降的蛋白質(zhì)結(jié)構(gòu)類型預測方法.相關實驗結(jié)果表明本文算法對蛋白質(zhì)二級結(jié)構(gòu)預測的準確率有一定程度地提升.
[Abstract]:With the rapid development of Internet technology , especially the rapid popularization of new services such as cloud computing , Internet of Things , social network and so on in recent years , the scale of data generated by human society has become the main driving force for modern science and technology . In order to alleviate this deficiency , this paper proposes two kinds of methods for predicting the structure types of protein structures based on fuzzy rough approximation . In order to alleviate this deficiency , this paper presents a new method for predicting the structure types of protein structures based on the concept of fuzzy rough approximation .
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP18
【參考文獻】
相關期刊論文 前9條
1 楊習貝;徐蘇平;戚ng;於東軍;;基于多特征空間的粗糙數(shù)據(jù)分析方法[J];江蘇科技大學學報(自然科學版);2016年04期
2 張云泉;徐葳;龍桂魯;;數(shù)據(jù)科學:問題導向的交叉學科創(chuàng)新[J];科學通報;2015年Z1期
3 吳偉志;高倉健;李同軍;;序粒度標記結(jié)構(gòu)及其粗糙近似[J];計算機研究與發(fā)展;2014年12期
4 蔣亦樟;鄧趙紅;王駿;錢鵬江;王士同;;熵加權多視角協(xié)同劃分模糊聚類算法[J];軟件學報;2014年10期
5 張維;苗奪謙;高燦;岳曉冬;;鄰域粗糙協(xié)同分類模型[J];計算機研究與發(fā)展;2014年08期
6 李霖;毛凱;譚永濱;;地標分層多粒度路徑導引描述方法[J];測繪學報;2014年01期
7 王磊;李天瑞;劉清;黎敏;;對象集變化時近似集動態(tài)維護的矩陣方法[J];計算機研究與發(fā)展;2013年09期
8 王國胤;張清華;;不同知識粒度下粗糙集的不確定性研究[J];計算機學報;2008年09期
9 胡清華;于達仁;謝宗霞;;基于鄰域;痛植诒平臄(shù)值屬性約簡[J];軟件學報;2008年03期
相關博士學位論文 前1條
1 楊習貝;不完備信息系統(tǒng)中粗糙集理論研究[D];南京理工大學;2010年
,本文編號:2079324
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2079324.html
最近更新
教材專著