一種改進(jìn)的基于密度的半監(jiān)督聚類及其在測(cè)井巖性識(shí)別中的應(yīng)用
【學(xué)位單位】:中國(guó)地質(zhì)大學(xué)(北京)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP311.13;P631.81
【部分圖文】:
度對(duì)樣本點(diǎn)間相似關(guān)系的傳遞,DBSCAN 保證了樣本的連通性和最大型(孫凌燕,2009)。下圖則很好地說(shuō)明了 DBSCAN 的計(jì)算過(guò)程。圖3-1 密度聚類過(guò)程示意圖算法的偽代碼如下算法1 DBSCAN輸入:D, Eps, MinPts輸出: cluster,noiseC = 0(1) for each unvisited point P in dataset Dmark P as visited
于密度的檢測(cè)聚類的方法是基于這樣的思想,即簇內(nèi)數(shù)據(jù)點(diǎn)的密度,或者密度變化與其他簇相比通常是大的。同時(shí),也可以利用距離鄰域的形狀和大小。此外,包含噪聲數(shù)據(jù)點(diǎn)的區(qū)域的密度低于任何里的關(guān)鍵思想是簇內(nèi)鄰域半徑中的每個(gè)數(shù)據(jù)點(diǎn)附近的數(shù)字?jǐn)?shù)據(jù)點(diǎn)總據(jù)點(diǎn)(周紅芳, 2012)。顯然,屬于聚類的每個(gè)數(shù)據(jù)點(diǎn)附近的密度應(yīng)鄰域半徑的預(yù)定義閾值,否則點(diǎn)被認(rèn)為是噪聲(吳月嫻等, 2006)。于在進(jìn)行聚類時(shí),傳統(tǒng)的 DBSCAN 算法使用的是全局密度參數(shù),類的錯(cuò)誤。如圖 3-2 所示,在同一類的軌跡中,明顯存在密度不同的用固定的全局密度,會(huì)把同一類的樣本點(diǎn)錯(cuò)誤地劃分到不同的類別 2015)。如圖,在密度出現(xiàn)變化的區(qū)間,就可能產(chǎn)生錯(cuò)誤。如果選擇會(huì)使同屬一類但密度較稀疏點(diǎn),尤其為邊界點(diǎn)不能聚類在一起,出結(jié)果。而如果選擇較小的 Eps,則會(huì)把距離較近但不屬于一類的樣于同一類。
1) 相同路徑矩形所包含的面積應(yīng)該取最小,盡可能不要被上級(jí)矩形和下級(jí)形所覆蓋。2) 為了減少運(yùn)算時(shí)間,不同路徑的矩形的面積不要有重疊。3) 矩形的邊長(zhǎng)盡可能為最小。由幾何知識(shí)可知,正方形可使得滿足包含條的邊長(zhǎng)最小(李春葆等, 2007)。為了減小矩形面積,也可以把邊長(zhǎng)方差小的矩形 包含在一起。4) 優(yōu)化存儲(chǔ)空間。保持樹的結(jié)構(gòu)在一個(gè)較低的高度,可以有效提高查詢效有證據(jù)表明,樹的高度對(duì)查詢的速度影響很大。經(jīng)典的 R 樹結(jié)構(gòu)如下所示
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 熊忠陽(yáng),孫思,張玉芳,王秀瓊;一種基于劃分的不同參數(shù)值的DBSCAN算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年09期
2 蔡穎琨,謝昆青,馬修軍;屏蔽了輸入?yún)?shù)敏感性的DBSCAN改進(jìn)算法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
3 張楓;邱保志;;基于網(wǎng)格的高效DBSCAN算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年17期
4 張燦龍;李忠利;陳華彬;;一種改進(jìn)DBSCAN密度聚類算法[J];數(shù)字技術(shù)與應(yīng)用;2016年11期
5 馮少榮;肖文俊;;一種提高DBSCAN聚類算法質(zhì)量的新方法[J];西安電子科技大學(xué)學(xué)報(bào);2008年03期
6 趙文;夏桂書;茍智堅(jiān);閆振興;;一種改進(jìn)的DBSCAN算法[J];四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年02期
7 陳敏;高學(xué)東;;并行DBSCAN聚類算法[J];中國(guó)管理信息化;2010年05期
8 王小龍;;論DBSCAN算法在圖像分割中分類的實(shí)現(xiàn)[J];電子技術(shù)與軟件工程;2013年12期
9 陳立潮;聶躍光;李靜;姜燕;;DBSCAN算法在公路選線中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2008年S1期
10 王桂芝;王廣亮;;快速DBSCAN算法的研究與實(shí)現(xiàn)[J];福建電腦;2010年06期
相關(guān)會(huì)議論文 前10條
1 宮蕊;舒紅平;郭遠(yuǎn)遠(yuǎn);;基于DBSCAN的密度聚類算法的研究[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
2 馬帥;宋國(guó)杰;唐世渭;楊冬青;王騰蛟;;基于單元?jiǎng)澐值腄BSCAN聚類算法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
3 朵春紅;王翠茹;;基于取樣的DBSCAN聚類算法及其遺傳優(yōu)化[A];第一屆中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集[C];2007年
4 張偉;徐遠(yuǎn);;兩步聚類方法[A];全國(guó)第十屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)年會(huì)論文集[C];2006年
5 王李_g;孫斌;;基于改進(jìn)的DBSCAN聚類算法的云任務(wù)調(diào)度策略研究[A];2016年全國(guó)通信軟件學(xué)術(shù)會(huì)議程序冊(cè)與交流文集[C];2016年
6 于健;陳子軍;李霞;李煒;;一種新的多密度聚類算法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
7 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年
8 劉彤;孫永香;張振洪;;一種有效的基于密度和層次的聚類算法[A];2007'儀表,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年
9 曹晶;周水庚;范曄;周傲英;;數(shù)據(jù)分區(qū):一種改善基于密度的聚類算法的方法[A];第十六屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1999年
10 任偉;閆桂英;;利用聚類算法來(lái)研究基因選擇問(wèn)題[A];中國(guó)運(yùn)籌學(xué)會(huì)第八屆學(xué)術(shù)交流會(huì)論文集[C];2006年
相關(guān)重要報(bào)紙文章 前3條
1 張秋;突破聚類市場(chǎng)的信息化盲區(qū)[N];中國(guó)計(jì)算機(jī)報(bào);2007年
2 特約記者 白陽(yáng) 王剛 顏冬;山東電信開放聚類市場(chǎng)承包經(jīng)營(yíng)[N];通信信息報(bào);2012年
3 本報(bào)記者 張軼群;聚類成為大數(shù)據(jù)認(rèn)知突破口[N];中國(guó)電子報(bào);2015年
相關(guān)博士學(xué)位論文 前10條
1 王振佳;基于基因表達(dá)數(shù)據(jù)的雙聚類算法研究[D];山東大學(xué);2016年
2 張強(qiáng);聚類算法的維度分析[D];天津大學(xué);2007年
3 張琳;基于期刊聚類的科學(xué)結(jié)構(gòu)研究[D];大連理工大學(xué);2010年
4 任亞洲;高維數(shù)據(jù)上的聚類方法研究[D];華南理工大學(xué);2014年
5 許玉杰;云計(jì)算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學(xué);2014年
6 朱紅;粒度聚類方法研究[D];中國(guó)礦業(yè)大學(xué);2013年
7 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年
8 李颯;數(shù)據(jù)流軟聚類理論及其在瓦斯災(zāi)害預(yù)警中的應(yīng)用[D];遼寧工程技術(shù)大學(xué);2014年
9 王佐;基于粗糙集的聚類算法研究[D];吉林大學(xué);2013年
10 蘭遠(yuǎn)東;基于圖的半監(jiān)督學(xué)習(xí)理論、算法及應(yīng)用研究[D];華南理工大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 丁寧;一種改進(jìn)的基于密度的半監(jiān)督聚類及其在測(cè)井巖性識(shí)別中的應(yīng)用[D];中國(guó)地質(zhì)大學(xué)(北京);2018年
2 李靜;結(jié)合蟻群算法與基于劃分的DBSCAN聚類算法的研究[D];東北師范大學(xué);2011年
3 王俊;面向大數(shù)據(jù)的DBSCAN聚類算法研究[D];解放軍信息工程大學(xué);2017年
4 田路強(qiáng);基于DBSCAN的分布式聚類及增量聚類的研究與應(yīng)用[D];北京工業(yè)大學(xué);2016年
5 張楓;基于網(wǎng)格的DBSCAN算法和聚類邊界技術(shù)的研究[D];鄭州大學(xué);2007年
6 白雪;一種基于網(wǎng)格的密度聚類算法研究及應(yīng)用[D];哈爾濱工程大學(xué);2009年
7 馮振華;基于DBSCAN聚類算法的研究與應(yīng)用[D];江南大學(xué);2016年
8 虞倩倩;基于數(shù)據(jù)劃分的DBSCAN算法研究[D];江南大學(xué);2013年
9 王實(shí)美;基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D];北京交通大學(xué);2017年
10 吳林敏;針對(duì)非均勻數(shù)據(jù)集的DBSCAN過(guò)濾式改進(jìn)算法[D];重慶大學(xué);2009年
本文編號(hào):2825932
本文鏈接:http://www.sikaile.net/kejilunwen/diqiudizhi/2825932.html