天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

事件序列概括與可視化分析

發(fā)布時(shí)間:2021-10-24 15:56
  事件序列數(shù)據(jù)是指一系列根據(jù)時(shí)間先后順序排列的離散事件,通常用以描述事件主體在一段時(shí)間內(nèi)的活動(dòng)。例如病人的電子醫(yī)療數(shù)據(jù)可以抽象成一系列帶有時(shí)間標(biāo)簽的醫(yī)療事件(例如診斷,化驗(yàn),用藥信息),用以描述病人在一段時(shí)間內(nèi)的治療過程。類似的,網(wǎng)絡(luò)訪客的點(diǎn)擊流事件(例如點(diǎn)擊鼠標(biāo),訪問頁面)也以事件序列的形式記錄了用戶從打開網(wǎng)頁到關(guān)閉網(wǎng)頁期間的瀏覽行為。事件序列數(shù)據(jù)有著非常廣泛的應(yīng)用場景,隨著信息電子化的進(jìn)程不斷被推進(jìn),越來越多的數(shù)據(jù)以事件序列的形式被記錄下來。分析人員也希望通過分析大量的事件序列數(shù)據(jù),從中找到事件之間的相關(guān)規(guī)律以及事件演化的普遍模式。然而由于事件序列具有很高的復(fù)雜性,主要體現(xiàn)在大量的事件類型以及事件在時(shí)間維度上的動(dòng)態(tài)變化上,因此需要通過事件序列概括分析的方法總結(jié)出簡潔的事件序列中隱藏的規(guī)律。近些年數(shù)據(jù)挖掘領(lǐng)域和可視化領(lǐng)域都有很多針對(duì)這一問題的研究。其中,數(shù)據(jù)挖掘領(lǐng)域的工作主要集中在通過對(duì)事件序列建模學(xué)習(xí)到事件間的相關(guān)性,或者是挖掘潛在的序列發(fā)展階段。這些方法的確可以學(xué)習(xí)到事件序列中存在的抽象結(jié)構(gòu),例如事件頻率之間的相互影響,序列之間的相似性,潛在的階段劃分方式等,但通常不能很好的將這些... 

【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:127 頁

【學(xué)位級(jí)別】:博士

【部分圖文】:

事件序列概括與可視化分析


可視化分析的研究結(jié)合了三個(gè)領(lǐng)域的研究知識(shí),包括可視化,數(shù)據(jù)分析和交互

可視化分析,基本流程


可視分析更加注重信息的視覺展示以及人的感知及反饋。可視分析過程就是將自動(dòng)化分析模型與信息的可視化展示通過用戶交互和反饋相聯(lián)通的過程 (見圖1.2)。在許多應(yīng)用場景中,異構(gòu)數(shù)據(jù)需要被預(yù)先整合才能被送進(jìn)模型訓(xùn)練或者是進(jìn)行可視化展示,因此可視分析流程的第一步就是數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)清洗,歸一化等等。數(shù)據(jù)在預(yù)處理完成后有兩種分析方式,一種是直接通過可視化展示傳遞給用戶進(jìn)行分析,另一種則是通過后臺(tái)的自動(dòng)化算法進(jìn)行分析后傳遞給可視化模塊進(jìn)行展示?梢暦治龉ぞ叩氖褂谜邉t可以通過可視化展示界面與數(shù)據(jù)和模型分析的結(jié)果進(jìn)行交互,比如過濾某一個(gè)子數(shù)據(jù)集合進(jìn)行分析,選擇分析模型或是指定分析的參數(shù)等。通過直觀的可視化展示,用戶可以去衡量和評(píng)估模型傳達(dá)的結(jié)果是否有效。就是這種允許用戶不斷的通過可視化界面對(duì)分析的所使用的方法或者是數(shù)據(jù)集進(jìn)行反饋的特性,使得可視分析方法比傳統(tǒng)自動(dòng)化的數(shù)據(jù)分析方法更為有效

架構(gòu)圖,論文,架構(gòu),內(nèi)容


是序列中事件的發(fā)出者或者是影響者,例如在電子醫(yī)療病例中,事件的主體就是病人,網(wǎng)絡(luò)訪問日志的事件主體是網(wǎng)絡(luò)訪問者,汽車保養(yǎng)記錄中事件的主體就是每一輛汽車。我們可以將事件序列集 D (圖1.3所示) 定義為包含 m 序列的集合:D = {S1, S2, . . . , Sm} (1.1)其中每一個(gè)序列 Si, i = 1, 2, . . . , m 都是一系列帶有時(shí)間戳的事件。我們假設(shè)所有事件類型可構(gòu)成有限集合 E, 那么每一個(gè)事件就是一個(gè)二元組 (e,t), 其中 e ∈ E是事件類型,t ∈ R 是時(shí)間戳,每一個(gè)序列包含 n 個(gè)事件 (序列長度為 n 的序列)則可以被描述為:S = (e1, t1) , (e2, t2) , . . . , (en, tn) , ti≤ ti+1(1.2)其中 ei與 ti, i = 1, 2, . . . , n 分別為序列中第 i 個(gè)事件對(duì)應(yīng)的事件類型與時(shí)間戳,值得注意的是,本文的研究充分考慮到了事件序列數(shù)據(jù)在時(shí)間上的動(dòng)態(tài)靈活性,因此允許數(shù)據(jù)集中出現(xiàn)同一時(shí)間發(fā)生的事件 (ti= ti+1)。1.2事件序列概括分析與可視化的機(jī)遇與挑戰(zhàn)事件序列的概括分析的基本目標(biāo)是找到事件序列數(shù)據(jù)集中潛在的事件相關(guān)關(guān)系以及序列演化模式。事件序列往往維度很高,包含很多事件類型,且具有時(shí)間動(dòng)態(tài)性,這給事件序列數(shù)據(jù)集的瀏覽以及規(guī)律的挖掘都帶來很大困難。事件序列概括則可以從兩個(gè)方面解決事件序列數(shù)據(jù)分析的難題:一方面事件序列概括可以幫助解決序列數(shù)據(jù)瀏覽困難的問題。面對(duì)不確定的數(shù)據(jù)集


本文編號(hào):3455554

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3455554.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dd1d3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com