天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于時間序列聚類的文獻主題分析研究

發(fā)布時間:2024-03-01 05:35
  主題分析能夠從文獻中選擇所有特征以及對重點主題內容進行分析,進而實現(xiàn)對文獻的檢索。也就是說,分析和把握文獻內容是主題分析的核心問題。為了提取主題概念,應選取與語義相對應的中心詞當作文獻的檢索標引。實際上,主題索引的質量受到主題分析質量的直接影響,情報檢索的有效性取決于主題分析的好壞。因此,為更好地進行主題分析,主要研究內容如下:(1)針對現(xiàn)有時間序列聚類方法效率低、時間復雜度高等問題,提出了一種基于矩陣輪廓和社會網(wǎng)絡技術的時間序列聚類方法。首先,利用矩陣概要文件(Matrix Profile)方法,從兩條時間序列中快速找到一對最相似的子序列,測量時間序列之間的相關性,降低時間復雜度。兩條時間序列之間的相關性是用最相似子序列對的數(shù)量來衡量的。其次,該方法構造了一個網(wǎng)絡來表示時間序列之間的相關性。該網(wǎng)絡將每條時間序列視為一個頂點,將時間序列之間的關系視為邊:對于相關性更強的兩條時間序列,它們之間邊的權值更大;最后,用社區(qū)檢測方法對網(wǎng)絡進行劃分。實驗采用經(jīng)典的時間序列聚類方法作對比:Louvain-εNN,k-medoids,k-shape。實驗結果表明,該方法是一種較好的時間序列聚類方法,...

【文章頁數(shù)】:80 頁

【學位級別】:碩士

【部分圖文】:

圖2.1時間序列和所有子序列都是

圖2.1時間序列和所有子序列都是

第2章理論基礎15圖2.1時間序列和所有子序列都是圖2.2和的距離矩陣定義4:距離剖面D是一個向量,是給定查詢序列與子序列集中每條子序列的歐式距離。給定兩條時間序列A和B,根據(jù)定義3,我們可以得到兩個相應的子序列集A和B,對于A中每條子序列A,計算其與B中每條子序列的距離,并且記....


圖2.2和的距離矩陣

圖2.2和的距離矩陣

第2章理論基礎15圖2.1時間序列和所有子序列都是圖2.2和的距離矩陣定義4:距離剖面D是一個向量,是給定查詢序列與子序列集中每條子序列的歐式距離。給定兩條時間序列A和B,根據(jù)定義3,我們可以得到兩個相應的子序列集A和B,對于A中每條子序列A,計算其與B中每條子序列的距離,并且記....


圖3.3A接A,B,C和D之接圖以及聚類之間的網(wǎng)絡連類結果

圖3.3A接A,B,C和D之接圖以及聚類之間的網(wǎng)絡連類結果

數(shù)據(jù),和圖3個節(jié)每條列的有向據(jù)式對用第為了說明其中V據(jù)集的大小,。分別為由圖3.2A,為了幫助3.2所示。節(jié)點表示,條邊進行定的距離最小向邊表示從式(3.3),得用更高的邊戀??怐惪耑怓?聮v耭聃悵?胴脛惕惐胊脅育??3章基于明序列之間的,,,校EW,和表示B,C和D之助理解構建....


圖3.4T1的所所有子序列和和相應的最小子序列所所在時間序列列

圖3.4T1的所所有子序列和和相應的最小子序列所所在時間序列列

相似3.1簇。得到性。的序獲得的最第似性較大,.4實例與過我們將包將所有的到與每個子圖圖3.4左序列;我們得的。利用最相似的子3章基于而不同簇內過程包含23條長的時間序列轉子序列最相似3.4T1的所上角的藍們稱它為T1。用MASS算法子序列,以及matrixprof內序列間的長度....



本文編號:3915497

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3915497.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶91827***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com