基于鏈接挖掘的郵件網(wǎng)絡(luò)中心性研究
發(fā)布時間:2017-11-29 08:06
本文關(guān)鍵詞:基于鏈接挖掘的郵件網(wǎng)絡(luò)中心性研究
更多相關(guān)文章: 鏈接挖掘 核數(shù) 網(wǎng)頁級別 復(fù)雜網(wǎng)絡(luò)中心性
【摘要】:在信息高速傳播的互聯(lián)網(wǎng)時代,電子郵件是大部分組織和公司正式通信的方式。郵件數(shù)據(jù)庫中蘊(yùn)含著大量未被挖掘的有用信息,是關(guān)于人類活動的隱形知識倉庫。電子郵件通信模式很早就被用來獲得底層社會網(wǎng)絡(luò)結(jié)構(gòu),通過觀察誰和誰通信以及通信頻率,郵件關(guān)系網(wǎng)絡(luò)可以和社交網(wǎng)絡(luò)相互映射。在網(wǎng)絡(luò)信息安全問題日益突出的今天,挖掘一個人的郵件數(shù)據(jù)庫可以提供不同維度下關(guān)于他或她有價值的活動的視角,所以郵件網(wǎng)絡(luò)分析也常常被應(yīng)用于發(fā)現(xiàn)社團(tuán)組織和信息傳播模式,識別犯罪欺詐活動和犯罪組織中的關(guān)鍵成員。本課題來源于實(shí)驗室的研發(fā)項目,通過研究郵件網(wǎng)絡(luò)中心性,挖掘出公司或組織里的社團(tuán)結(jié)構(gòu),定位核心人物。本文基于智能郵件分析平臺研究郵件網(wǎng)絡(luò)中心性,對Enron公司郵件數(shù)據(jù)庫進(jìn)行整理,通過可視化的方式展現(xiàn)郵件網(wǎng)絡(luò)各方面特性,直觀的演示了實(shí)驗效果。系統(tǒng)主要開發(fā)了郵件檢索,郵件網(wǎng)絡(luò)分析,社團(tuán)發(fā)現(xiàn)和信息要素分析等模塊,進(jìn)一步驗證改進(jìn)的PageRank算法的實(shí)用性。在已有的郵件網(wǎng)絡(luò)中心化研究中,由于傳統(tǒng)的PageRank算法對網(wǎng)絡(luò)擾動較為敏感,較多關(guān)注于評估節(jié)點(diǎn)級和鏈接級的參數(shù),容易受到度值高的干擾節(jié)點(diǎn)影響。本文利用復(fù)雜網(wǎng)絡(luò)中心化指標(biāo)中的核數(shù)來分解郵件網(wǎng)絡(luò)各層,以剔除外層干擾節(jié)點(diǎn),在保留重要成員的基礎(chǔ)上減少網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模,降低后續(xù)挖掘算法復(fù)雜度,并引入了改進(jìn)的PageRank算法,以解決權(quán)值分配偏移問題,定量分析網(wǎng)絡(luò)核心層的節(jié)點(diǎn)并排序,找出電子郵件網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。通過郵件網(wǎng)絡(luò)中心性挖掘?qū)嶒灡砻?該方法能降低算法復(fù)雜度,提高有效性。
【學(xué)位授予單位】:北京化工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.098
【參考文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 彭玲;基于主題及核心人物的郵件網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究[D];蘇州大學(xué);2010年
,本文編號:1236743
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1236743.html
最近更新
教材專著