天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 地質(zhì)論文 >

一種改進(jìn)的基于密度的半監(jiān)督聚類及其在測(cè)井巖性識(shí)別中的應(yīng)用

發(fā)布時(shí)間:2020-09-24 15:53
   隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)的規(guī)模呈現(xiàn)爆炸式增長(zhǎng)。從錯(cuò)綜復(fù)雜的數(shù)據(jù)中挖掘出有價(jià)值的信息具有巨大的實(shí)際意義。聚類算法作為機(jī)器學(xué)習(xí)領(lǐng)域中的一類重要方法,被廣泛應(yīng)用于數(shù)據(jù)分析與挖掘中。DBSCAN算法是一種典型的聚類算法,以數(shù)據(jù)密度為度量,可以識(shí)別數(shù)據(jù)集中任意形狀的類及噪音點(diǎn)。但是,算法在聚類過(guò)程中使用固定的參數(shù)聚類,對(duì)于非均勻密度的樣本的聚類效果會(huì)大打折扣。本文以DBSCAN算法為研究對(duì)象,針對(duì)其對(duì)聚類參數(shù)敏感、在處理非均勻密度數(shù)據(jù)集時(shí)效果不理想等問(wèn)題進(jìn)行研究,提出了改進(jìn)方法V-DBSCAN算法。V-DBSCAN可以更好的適合非均勻密度聚類。該算法的主要思想是先找出高密度的類簇,然后改變參數(shù)值繼續(xù)聚類,發(fā)現(xiàn)較低密度的類簇。不斷改變參數(shù)的值,這樣不同密度的類簇就會(huì)被區(qū)分。在不斷的聚類過(guò)程中也伴隨著類簇的合并。這時(shí)加入半監(jiān)督的學(xué)習(xí)方法,用已知點(diǎn)的標(biāo)簽信息或者約束信息實(shí)現(xiàn)已生成的類簇的合并,提高合并過(guò)程的速度和精度。同時(shí),建立了R樹索引,以提高程序的運(yùn)行效率。由于地質(zhì)儲(chǔ)層數(shù)據(jù)的復(fù)雜性,傳統(tǒng)的測(cè)井巖性識(shí)別方法效果并不理想,所以將本文改進(jìn)的方法運(yùn)用在巖性識(shí)別上,作為改進(jìn)的算法的實(shí)際應(yīng)用檢驗(yàn)。實(shí)驗(yàn)在測(cè)井巖性識(shí)別上運(yùn)用了V-DBSCAN算法,采用了三種不同的距離與K-means,KNN和NBC算法做比較,分析了這四種算法在巖性識(shí)別的準(zhǔn)確率上的差異,實(shí)驗(yàn)結(jié)果說(shuō)明了該算法應(yīng)用在測(cè)井?dāng)?shù)據(jù)的巖性識(shí)別的準(zhǔn)確性高于其他算法,證明了V-DBSCAN能較好地應(yīng)用于測(cè)井巖性識(shí)別。
【學(xué)位單位】:中國(guó)地質(zhì)大學(xué)(北京)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP311.13;P631.81
【部分圖文】:

示意圖,聚類過(guò)程,密度,示意圖


度對(duì)樣本點(diǎn)間相似關(guān)系的傳遞,DBSCAN 保證了樣本的連通性和最大型(孫凌燕,2009)。下圖則很好地說(shuō)明了 DBSCAN 的計(jì)算過(guò)程。圖3-1 密度聚類過(guò)程示意圖算法的偽代碼如下算法1 DBSCAN輸入:D, Eps, MinPts輸出: cluster,noiseC = 0(1) for each unvisited point P in dataset Dmark P as visited

聚類數(shù)據(jù),密度


于密度的檢測(cè)聚類的方法是基于這樣的思想,即簇內(nèi)數(shù)據(jù)點(diǎn)的密度,或者密度變化與其他簇相比通常是大的。同時(shí),也可以利用距離鄰域的形狀和大小。此外,包含噪聲數(shù)據(jù)點(diǎn)的區(qū)域的密度低于任何里的關(guān)鍵思想是簇內(nèi)鄰域半徑中的每個(gè)數(shù)據(jù)點(diǎn)附近的數(shù)字?jǐn)?shù)據(jù)點(diǎn)總據(jù)點(diǎn)(周紅芳, 2012)。顯然,屬于聚類的每個(gè)數(shù)據(jù)點(diǎn)附近的密度應(yīng)鄰域半徑的預(yù)定義閾值,否則點(diǎn)被認(rèn)為是噪聲(吳月嫻等, 2006)。于在進(jìn)行聚類時(shí),傳統(tǒng)的 DBSCAN 算法使用的是全局密度參數(shù),類的錯(cuò)誤。如圖 3-2 所示,在同一類的軌跡中,明顯存在密度不同的用固定的全局密度,會(huì)把同一類的樣本點(diǎn)錯(cuò)誤地劃分到不同的類別 2015)。如圖,在密度出現(xiàn)變化的區(qū)間,就可能產(chǎn)生錯(cuò)誤。如果選擇會(huì)使同屬一類但密度較稀疏點(diǎn),尤其為邊界點(diǎn)不能聚類在一起,出結(jié)果。而如果選擇較小的 Eps,則會(huì)把距離較近但不屬于一類的樣于同一類。

樹結(jié)構(gòu)


1) 相同路徑矩形所包含的面積應(yīng)該取最小,盡可能不要被上級(jí)矩形和下級(jí)形所覆蓋。2) 為了減少運(yùn)算時(shí)間,不同路徑的矩形的面積不要有重疊。3) 矩形的邊長(zhǎng)盡可能為最小。由幾何知識(shí)可知,正方形可使得滿足包含條的邊長(zhǎng)最小(李春葆等, 2007)。為了減小矩形面積,也可以把邊長(zhǎng)方差小的矩形 包含在一起。4) 優(yōu)化存儲(chǔ)空間。保持樹的結(jié)構(gòu)在一個(gè)較低的高度,可以有效提高查詢效有證據(jù)表明,樹的高度對(duì)查詢的速度影響很大。經(jīng)典的 R 樹結(jié)構(gòu)如下所示

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 熊忠陽(yáng),孫思,張玉芳,王秀瓊;一種基于劃分的不同參數(shù)值的DBSCAN算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年09期

2 蔡穎琨,謝昆青,馬修軍;屏蔽了輸入?yún)?shù)敏感性的DBSCAN改進(jìn)算法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期

3 張楓;邱保志;;基于網(wǎng)格的高效DBSCAN算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年17期

4 張燦龍;李忠利;陳華彬;;一種改進(jìn)DBSCAN密度聚類算法[J];數(shù)字技術(shù)與應(yīng)用;2016年11期

5 馮少榮;肖文俊;;一種提高DBSCAN聚類算法質(zhì)量的新方法[J];西安電子科技大學(xué)學(xué)報(bào);2008年03期

6 趙文;夏桂書;茍智堅(jiān);閆振興;;一種改進(jìn)的DBSCAN算法[J];四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年02期

7 陳敏;高學(xué)東;;并行DBSCAN聚類算法[J];中國(guó)管理信息化;2010年05期

8 王小龍;;論DBSCAN算法在圖像分割中分類的實(shí)現(xiàn)[J];電子技術(shù)與軟件工程;2013年12期

9 陳立潮;聶躍光;李靜;姜燕;;DBSCAN算法在公路選線中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2008年S1期

10 王桂芝;王廣亮;;快速DBSCAN算法的研究與實(shí)現(xiàn)[J];福建電腦;2010年06期

相關(guān)會(huì)議論文 前10條

1 宮蕊;舒紅平;郭遠(yuǎn)遠(yuǎn);;基于DBSCAN的密度聚類算法的研究[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

2 馬帥;宋國(guó)杰;唐世渭;楊冬青;王騰蛟;;基于單元?jiǎng)澐值腄BSCAN聚類算法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

3 朵春紅;王翠茹;;基于取樣的DBSCAN聚類算法及其遺傳優(yōu)化[A];第一屆中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集[C];2007年

4 張偉;徐遠(yuǎn);;兩步聚類方法[A];全國(guó)第十屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)年會(huì)論文集[C];2006年

5 王李_g;孫斌;;基于改進(jìn)的DBSCAN聚類算法的云任務(wù)調(diào)度策略研究[A];2016年全國(guó)通信軟件學(xué)術(shù)會(huì)議程序冊(cè)與交流文集[C];2016年

6 于健;陳子軍;李霞;李煒;;一種新的多密度聚類算法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年

7 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年

8 劉彤;孫永香;張振洪;;一種有效的基于密度和層次的聚類算法[A];2007'儀表,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年

9 曹晶;周水庚;范曄;周傲英;;數(shù)據(jù)分區(qū):一種改善基于密度的聚類算法的方法[A];第十六屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1999年

10 任偉;閆桂英;;利用聚類算法來(lái)研究基因選擇問(wèn)題[A];中國(guó)運(yùn)籌學(xué)會(huì)第八屆學(xué)術(shù)交流會(huì)論文集[C];2006年

相關(guān)重要報(bào)紙文章 前3條

1 張秋;突破聚類市場(chǎng)的信息化盲區(qū)[N];中國(guó)計(jì)算機(jī)報(bào);2007年

2 特約記者 白陽(yáng) 王剛 顏冬;山東電信開放聚類市場(chǎng)承包經(jīng)營(yíng)[N];通信信息報(bào);2012年

3 本報(bào)記者 張軼群;聚類成為大數(shù)據(jù)認(rèn)知突破口[N];中國(guó)電子報(bào);2015年

相關(guān)博士學(xué)位論文 前10條

1 王振佳;基于基因表達(dá)數(shù)據(jù)的雙聚類算法研究[D];山東大學(xué);2016年

2 張強(qiáng);聚類算法的維度分析[D];天津大學(xué);2007年

3 張琳;基于期刊聚類的科學(xué)結(jié)構(gòu)研究[D];大連理工大學(xué);2010年

4 任亞洲;高維數(shù)據(jù)上的聚類方法研究[D];華南理工大學(xué);2014年

5 許玉杰;云計(jì)算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學(xué);2014年

6 朱紅;粒度聚類方法研究[D];中國(guó)礦業(yè)大學(xué);2013年

7 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年

8 李颯;數(shù)據(jù)流軟聚類理論及其在瓦斯災(zāi)害預(yù)警中的應(yīng)用[D];遼寧工程技術(shù)大學(xué);2014年

9 王佐;基于粗糙集的聚類算法研究[D];吉林大學(xué);2013年

10 蘭遠(yuǎn)東;基于圖的半監(jiān)督學(xué)習(xí)理論、算法及應(yīng)用研究[D];華南理工大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 丁寧;一種改進(jìn)的基于密度的半監(jiān)督聚類及其在測(cè)井巖性識(shí)別中的應(yīng)用[D];中國(guó)地質(zhì)大學(xué)(北京);2018年

2 李靜;結(jié)合蟻群算法與基于劃分的DBSCAN聚類算法的研究[D];東北師范大學(xué);2011年

3 王俊;面向大數(shù)據(jù)的DBSCAN聚類算法研究[D];解放軍信息工程大學(xué);2017年

4 田路強(qiáng);基于DBSCAN的分布式聚類及增量聚類的研究與應(yīng)用[D];北京工業(yè)大學(xué);2016年

5 張楓;基于網(wǎng)格的DBSCAN算法和聚類邊界技術(shù)的研究[D];鄭州大學(xué);2007年

6 白雪;一種基于網(wǎng)格的密度聚類算法研究及應(yīng)用[D];哈爾濱工程大學(xué);2009年

7 馮振華;基于DBSCAN聚類算法的研究與應(yīng)用[D];江南大學(xué);2016年

8 虞倩倩;基于數(shù)據(jù)劃分的DBSCAN算法研究[D];江南大學(xué);2013年

9 王實(shí)美;基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D];北京交通大學(xué);2017年

10 吳林敏;針對(duì)非均勻數(shù)據(jù)集的DBSCAN過(guò)濾式改進(jìn)算法[D];重慶大學(xué);2009年



本文編號(hào):2825932

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/diqiudizhi/2825932.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7bd4c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com