移動(dòng)時(shí)間勢(shì)能聚類算法的研究與應(yīng)用
發(fā)布時(shí)間:2021-03-24 17:04
2016年Yonggang Lu等人提出了一種移動(dòng)時(shí)間層次聚類算法TTHC(Travel-Time based Hierarchical Clustering)。TTHC算法根據(jù)對(duì)數(shù)據(jù)點(diǎn)勢(shì)能的分析,采用全新的以移動(dòng)時(shí)間為基礎(chǔ)的相似性度量,能夠獲得更佳的聚類效果和聚類精度。但是TTHC算法也有著一些問題:TTHC算法得事先人工設(shè)置類簇個(gè)數(shù),并且TTHC算法在給數(shù)據(jù)點(diǎn)分配類別的時(shí)候只根據(jù)數(shù)據(jù)點(diǎn)與數(shù)據(jù)點(diǎn)的相似度,TTHC算法沒有考慮到數(shù)據(jù)點(diǎn)的勢(shì)能和數(shù)據(jù)點(diǎn)到其父節(jié)點(diǎn)的距離的影響;TTHC算法不能對(duì)數(shù)據(jù)集里的噪聲數(shù)據(jù)作出識(shí)別,噪聲數(shù)據(jù)容易干擾聚類結(jié)果,以上問題限制了TTHC算法的應(yīng)用。本文改進(jìn)了TTHC算法的以上問題,然后把改進(jìn)之后的ACTT算法和APCTT算法運(yùn)用到微博文本聚類里。本文詳細(xì)內(nèi)容主要有如下幾方面:(1)針對(duì)TTHC算法人工設(shè)置類簇中心個(gè)數(shù)且在給數(shù)據(jù)點(diǎn)分配類別的時(shí)候產(chǎn)生問題,提出了一種自動(dòng)確定聚類中心的移動(dòng)時(shí)間勢(shì)能聚類算法(ACTT:Automatically Clustering based on Travel-Time)。ACTT算法先是計(jì)算數(shù)據(jù)點(diǎn)的勢(shì)能和數(shù)據(jù)點(diǎn)之間的相似度,然...
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
勢(shì)能分布示例
表示互動(dòng)的微博轉(zhuǎn)發(fā)微博的時(shí)候,之前的轉(zhuǎn)發(fā)過的用戶的微博ID以及//@標(biāo)識(shí)符都會(huì)出現(xiàn)一遍
圖 5-2 表示互動(dòng)的微博轉(zhuǎn)發(fā)微博的時(shí)候,之前的轉(zhuǎn)發(fā)過的用戶的微博 ID 以及//@標(biāo)識(shí)符都會(huì)出現(xiàn)一遍。這容對(duì)于微博本身內(nèi)容的表達(dá)也不具實(shí)際意義,因此應(yīng)該刪去這些內(nèi)容。如圖 5-3 所微博。
【參考文獻(xiàn)】:
期刊論文
[1]基于Chameleon聚類分析的多錯(cuò)誤定位方法[J]. 曹鶴玲,姜淑娟. 電子學(xué)報(bào). 2017(02)
[2]基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘[J]. 王元卓,賈巖濤,劉大偉,靳小龍,程學(xué)旗. 計(jì)算機(jī)研究與發(fā)展. 2015(02)
[3]蛋白質(zhì)相互作用網(wǎng)絡(luò)的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計(jì)算機(jī)學(xué)報(bào). 2012(01)
[4]基于改進(jìn)CURE聚類算法的無監(jiān)督異常檢測(cè)方法[J]. 周亞建,徐晨,李繼國(guó). 通信學(xué)報(bào). 2010(07)
[5]基于權(quán)重的Jaccard相似度度量的實(shí)體識(shí)別方法[J]. 潘磊,雷鈺麗,王崇駿,謝俊元. 北京交通大學(xué)學(xué)報(bào). 2009(06)
[6]幾個(gè)多面體網(wǎng)格剖分問題的NP難度證明[J]. 田延軍,鄧俊輝. 軟件學(xué)報(bào). 2008(04)
[7]面向海量數(shù)據(jù)的數(shù)據(jù)一致性研究[J]. 周婧,王意潔,阮煒,李思昆. 計(jì)算機(jī)科學(xué). 2006(04)
[8]面向信息檢索的自適應(yīng)中文分詞系統(tǒng)[J]. 曹勇剛,曹羽中,金茂忠,劉超. 軟件學(xué)報(bào). 2006(03)
[9]中文停用詞表的自動(dòng)選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學(xué)學(xué)報(bào). 2005(04)
[10]基于社會(huì)網(wǎng)絡(luò)分析的產(chǎn)業(yè)集群建模及實(shí)證檢驗(yàn)[J]. 王霄寧. 系統(tǒng)工程. 2005(03)
博士論文
[1]聚類分析中的相似性度量及其應(yīng)用研究[D]. 白雪.北京交通大學(xué) 2012
[2]基因表達(dá)數(shù)據(jù)聚類分析算法研究和應(yīng)用[D]. 楊春梅.天津大學(xué) 2006
碩士論文
[1]基于蛋白質(zhì)相互作用網(wǎng)絡(luò)及聚類算法的蛋白質(zhì)功能預(yù)測(cè)方法研究[D]. 蔡娟.中南大學(xué) 2012
[2]聚類分析算法CLIQUE的改進(jìn)及應(yīng)用[D]. 陳朝華.中南大學(xué) 2009
本文編號(hào):3098068
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
勢(shì)能分布示例
表示互動(dòng)的微博轉(zhuǎn)發(fā)微博的時(shí)候,之前的轉(zhuǎn)發(fā)過的用戶的微博ID以及//@標(biāo)識(shí)符都會(huì)出現(xiàn)一遍
圖 5-2 表示互動(dòng)的微博轉(zhuǎn)發(fā)微博的時(shí)候,之前的轉(zhuǎn)發(fā)過的用戶的微博 ID 以及//@標(biāo)識(shí)符都會(huì)出現(xiàn)一遍。這容對(duì)于微博本身內(nèi)容的表達(dá)也不具實(shí)際意義,因此應(yīng)該刪去這些內(nèi)容。如圖 5-3 所微博。
【參考文獻(xiàn)】:
期刊論文
[1]基于Chameleon聚類分析的多錯(cuò)誤定位方法[J]. 曹鶴玲,姜淑娟. 電子學(xué)報(bào). 2017(02)
[2]基于開放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘[J]. 王元卓,賈巖濤,劉大偉,靳小龍,程學(xué)旗. 計(jì)算機(jī)研究與發(fā)展. 2015(02)
[3]蛋白質(zhì)相互作用網(wǎng)絡(luò)的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計(jì)算機(jī)學(xué)報(bào). 2012(01)
[4]基于改進(jìn)CURE聚類算法的無監(jiān)督異常檢測(cè)方法[J]. 周亞建,徐晨,李繼國(guó). 通信學(xué)報(bào). 2010(07)
[5]基于權(quán)重的Jaccard相似度度量的實(shí)體識(shí)別方法[J]. 潘磊,雷鈺麗,王崇駿,謝俊元. 北京交通大學(xué)學(xué)報(bào). 2009(06)
[6]幾個(gè)多面體網(wǎng)格剖分問題的NP難度證明[J]. 田延軍,鄧俊輝. 軟件學(xué)報(bào). 2008(04)
[7]面向海量數(shù)據(jù)的數(shù)據(jù)一致性研究[J]. 周婧,王意潔,阮煒,李思昆. 計(jì)算機(jī)科學(xué). 2006(04)
[8]面向信息檢索的自適應(yīng)中文分詞系統(tǒng)[J]. 曹勇剛,曹羽中,金茂忠,劉超. 軟件學(xué)報(bào). 2006(03)
[9]中文停用詞表的自動(dòng)選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學(xué)學(xué)報(bào). 2005(04)
[10]基于社會(huì)網(wǎng)絡(luò)分析的產(chǎn)業(yè)集群建模及實(shí)證檢驗(yàn)[J]. 王霄寧. 系統(tǒng)工程. 2005(03)
博士論文
[1]聚類分析中的相似性度量及其應(yīng)用研究[D]. 白雪.北京交通大學(xué) 2012
[2]基因表達(dá)數(shù)據(jù)聚類分析算法研究和應(yīng)用[D]. 楊春梅.天津大學(xué) 2006
碩士論文
[1]基于蛋白質(zhì)相互作用網(wǎng)絡(luò)及聚類算法的蛋白質(zhì)功能預(yù)測(cè)方法研究[D]. 蔡娟.中南大學(xué) 2012
[2]聚類分析算法CLIQUE的改進(jìn)及應(yīng)用[D]. 陳朝華.中南大學(xué) 2009
本文編號(hào):3098068
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3098068.html
最近更新
教材專著