天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

非獨(dú)立同分布下的K中心點(diǎn)算法研究

發(fā)布時(shí)間:2021-10-21 22:48
  隨著科技的不斷發(fā)展,數(shù)據(jù)挖掘成為當(dāng)下幫助用戶從大量的數(shù)據(jù)中提取出有效信息的重要手段,與此同時(shí),作為數(shù)據(jù)挖掘中重要分支的聚類分析也越來越受到各方面的關(guān)注。K-中心點(diǎn)算法是聚類分析中具有代表性的算法之一,克服了K-均值算法對(duì)于孤立點(diǎn)較為敏感的缺點(diǎn),具有較強(qiáng)的魯棒性,但是K-中心點(diǎn)算法仍在某些方面存在缺陷,例如,算法中的相似性度量大多采用距離的度量方式,這種方式均假設(shè)數(shù)據(jù)對(duì)象及屬性之間是獨(dú)立同分布的,但實(shí)際情況中,數(shù)據(jù)對(duì)象及屬性之間是非獨(dú)立同分布的,因此,K-中心點(diǎn)算法的相似性度量方式有待改進(jìn);除此之外,K-中心點(diǎn)算法本身時(shí)間復(fù)雜度較大,初始中心點(diǎn)的選取對(duì)算法而言尤為重要。為提高算法的聚類效果與運(yùn)行效率,本文對(duì)此進(jìn)行了如下改進(jìn):針對(duì)K-中心點(diǎn)算法的度量方式為假設(shè)數(shù)據(jù)對(duì)象及屬性之間是獨(dú)立同分布的缺點(diǎn),本文引入了無監(jiān)督學(xué)習(xí)中的名義耦合相似性計(jì)算方法,用非獨(dú)立同分布計(jì)算公式對(duì)傳統(tǒng)歐氏距離計(jì)算相似度方法進(jìn)行了替換,同時(shí),由于此公式主要計(jì)算依據(jù)為屬性值的頻率,但數(shù)值型數(shù)據(jù)對(duì)于頻率并不敏感,因此,針對(duì)數(shù)值型數(shù)據(jù),本文在引入公式之前,將數(shù)值型數(shù)據(jù)按屬性列根據(jù)歐氏距離進(jìn)行聚類與替換,設(shè)計(jì)了NI-PAM算法,... 

【文章來源】: 韓冰 齊魯工業(yè)大學(xué)

【文章頁數(shù)】:75 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 論文研究工作
        1.3.1 論文的內(nèi)容組織
第2章 聚類分析技術(shù)與非獨(dú)立同分布概述
    2.1 數(shù)據(jù)挖掘技術(shù)概述
        2.1.1 數(shù)據(jù)挖掘系統(tǒng)的主要功能
        2.1.2 數(shù)據(jù)挖掘的步驟
    2.2 聚類分析技術(shù)概述
    2.3 聚類的主要過程
    2.4 主要聚類方法的分類
        2.4.1 基于層次的聚類方法
        2.4.2 基于劃分的聚類方法
        2.4.3 基于密度的聚類方法
        2.4.4 基于網(wǎng)格的聚類方法
        2.4.5 基于模型的聚類方法
        2.4.6 其它熱點(diǎn)聚類算法
    2.5 現(xiàn)有聚類分析技術(shù)的挑戰(zhàn)
    2.6 非獨(dú)立同分布學(xué)習(xí)
    2.7 非獨(dú)立同分布思想的典型應(yīng)用
    2.8 非獨(dú)立同分布層次介紹
    2.9 K-中心點(diǎn)算法中的耦合關(guān)系
    2.10 本章小結(jié)
第3章 NI-PAM算法的設(shè)計(jì)與分析
    3.1 PAM算法介紹
    3.2 現(xiàn)有相似性度量計(jì)算方法
    3.3 非獨(dú)立同分布下的耦合相似度
        3.3.1 內(nèi)部耦合相似度
        3.3.2 外部耦合相似度
        3.3.3 總體耦合相似度
        3.3.4 數(shù)據(jù)對(duì)象間耦合相似度
    3.4 非獨(dú)立同分布環(huán)境下的NI-PAM算法
    3.5 NI-PAM算法步驟
    3.6 實(shí)驗(yàn)結(jié)果與分析
        3.6.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
        3.6.2 實(shí)驗(yàn)結(jié)果對(duì)比
        3.6.3 實(shí)驗(yàn)結(jié)果分析
    3.7 本章小結(jié)
第4章 NI-PAM算法的優(yōu)化
    4.1 PAM算法缺陷
    4.2 NI-PAM算法的初始中心點(diǎn)選擇方法改進(jìn)
        4.2.1 相似度矩陣的建立
        4.2.2 鄰域半徑
    4.3 改進(jìn)后NI-PAM算法步驟
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
        4.4.2 實(shí)驗(yàn)結(jié)果對(duì)比
        4.4.3 實(shí)驗(yàn)結(jié)果分析
    4.5 本章小結(jié)
第5章 N-NI-PAM算法的設(shè)計(jì)與分析
    5.1 非獨(dú)立同分布下的數(shù)值型耦合相似度
        5.1.1 修改后的斯皮爾曼等級(jí)相關(guān)系數(shù)
        5.1.2 屬性內(nèi)耦合相似性
        5.1.3 屬性外耦合相似性
        5.1.4 數(shù)據(jù)對(duì)象之間的耦合相似性
    5.2 N-NI-PAM算法步驟
    5.3 實(shí)驗(yàn)結(jié)果與分析
        5.3.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
        5.3.2 實(shí)驗(yàn)結(jié)果對(duì)比
        5.3.3 實(shí)驗(yàn)結(jié)果分析
    5.4 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文總結(jié)
        6.1.1 論文的創(chuàng)新點(diǎn)
    6.2 未來展望
參考文獻(xiàn)
致謝
在學(xué)期間主要科研成果
    一、發(fā)表學(xué)術(shù)論文
    二、其他科研成果
    三、獲獎(jiǎng)


【參考文獻(xiàn)】:
期刊論文
[1]GPU加速的改進(jìn)PAM聚類算法研究與應(yīng)用[J]. 周恩波,毛善君,李梅,孫振明.  地球信息科學(xué)學(xué)報(bào). 2017(06)
[2]基于距離不等式的K-medoids聚類算法[J]. 余冬華,郭茂祖,劉揚(yáng),任世軍,劉曉燕,劉國軍.  軟件學(xué)報(bào). 2017 (12)
[3]一種MapReduce架構(gòu)下基于遺傳算法的K-Medoids聚類[J]. 賴向陽,宮秀軍,韓來明.  計(jì)算機(jī)科學(xué). 2017(03)
[4]非獨(dú)立同分布推薦系統(tǒng):推薦范式轉(zhuǎn)換的綜述和框架[J]. Longbing Cao.  Engineering. 2016(02)
[5]不確定數(shù)據(jù)聚類的U-PAM算法和UM-PAM算法的研究[J]. 何云斌,張志超,萬靜,李松.  計(jì)算機(jī)科學(xué). 2016(06)
[6]密度峰值優(yōu)化初始中心的K-medoids聚類算法[J]. 謝娟英,屈亞楠.  計(jì)算機(jī)科學(xué)與探索. 2016(02)
[7]基于稠密區(qū)域的K-medoids聚類算法[J]. 趙湘民,陳曦,潘楚.  計(jì)算機(jī)工程與應(yīng)用. 2016(16)
[8]基于寬度優(yōu)先搜索的K-medoids聚類算法[J]. 顏宏文,周雅梅,潘楚.  計(jì)算機(jī)應(yīng)用. 2015(05)
[9]基于遞減概率初始點(diǎn)選擇K中心點(diǎn)進(jìn)化算法[J]. 路浩,倪世宏,查翔,張鵬.  計(jì)算機(jī)仿真. 2014(09)
[10]一種改進(jìn)的基于粒子群的粗糙K-medoids算法[J]. 楊志,羅可.  計(jì)算機(jī)工程與應(yīng)用. 2014(20)

博士論文
[1]非獨(dú)立同分布推薦系統(tǒng)研究[D]. 李方方.北京理工大學(xué) 2014

碩士論文
[1]聚類分析及聚類結(jié)果評(píng)估算法研究[D]. 陳衡岳.東北大學(xué) 2006



本文編號(hào):3449866

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3449866.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶03069***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com