天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 軍事論文 >

面向單幅不確定大圖的頻繁模式挖掘技術研究

發(fā)布時間:2020-05-17 15:29
【摘要】:在軍事信息系統中,軍事情報分析與處理分系統占據重要地位。隨著各類情報獲取手段的演進,軍事情報數據呈現出異構性和非結構化等特點,使得軍事情報分析與處理面臨極大的技術挑戰(zhàn)。海量文本情報分析是情報分析與處理中最重要和最基礎的組成部分。當前,一種從整體上把握文本情報的有效手段是構建以單個文本為節(jié)點、文本之間相互關系為聯系的文檔網絡圖,即單幅大圖(網絡)數據,并在此基礎上開展一系列分析研判。本文以文本情報分析為應用背景研究單幅大圖(網絡)上的數據挖掘問題。由于噪聲、測量誤差、保密性、不完整性等原因,不確定性在現實世界的數據中廣泛存在。作為一種具有廣泛建模能力的數據模型,圖數據中也存在著不確定性。除了前述的文檔網絡圖,生物信息學、社會網絡等領域中亦大量存在著不確定圖。因此,針對不確定圖的研究成為國內外的熱點。本文使用不確定圖建模文本軍事情報,并在此基礎上挖掘頻繁模式;目前在單幅不確定大圖上頻繁子圖挖掘的問題尚未見已公開的研究。首先,對單幅不確定大圖上子圖模式的支持度進行了定義,據此提出了基于枚舉-評估的支持度評估方法。枚舉策略采用與確定圖挖掘時相同的方式,本文主要關注支持度評估過程。其次,通過證明在單幅不確定圖上期望支持度的計算是#-P難的,設計了一種具有精度保證的近似算法以滿足實際應用需求。然后,為進一步增強算法效率,提出了兩種優(yōu)化策略,一是考慮對樣本圖計算結果的重用,二是引入檢查點機制和基于結構的上界,提前對不頻繁的分枝進行剪枝。上述兩種優(yōu)化策略的應用提升了挖掘性能。最后,在實際數據集上進行的實驗驗證了該挖掘方法及優(yōu)化策略的實際可用性和有效性。為了進一步評價所提技術的實際效用和意義,在真實文本情報數據上開展了應用研究。對于采集的公開文本情報數據,以文檔為節(jié)點、文檔間相似度為邊建立文檔關聯。使用LDA模型為節(jié)點附加標簽,使用基于知識庫的算法衡量節(jié)點間相似度;當相似度大于給定閾值時,則連接一條邊,并以相似度值作為邊上的概率。最終建立文檔網絡圖,并用所提技術對其進行挖掘。實驗結果表明,發(fā)現的模式具有可解釋性,所提挖掘技術具有較好的實際應用前景。
【圖文】:

優(yōu)化技術,運行時間


國防科學技術大學研究生院碩士學位論文5.3 評價優(yōu)化技術本節(jié)實驗評價在近似框架下,所提優(yōu)化技術的效果。特別地,,我們比較了三個算法,為了表達清晰,分別表示為基本,+重用,+剪枝;荆夯镜幕诿商乜宸抡妫诰騿蝹不確定圖的近似算法,即在 3.3 節(jié)中提出的算法 1;+重用:在基本上應用計算重用技術,即 4.1 節(jié)所提,重用三種開銷;+剪枝:進一步引入在 4.2 節(jié)提出的,基于檢查點機制的剪枝技術,在+重用的基礎上,+剪枝包含所有提出的優(yōu)化策略。

優(yōu)化技術,樣本量


(a)CIT 數據集 (b)COL 數據集圖 5-3 優(yōu)化技術樣本量對比進一步鑒別剪枝技術,我們研究總的樣本量。圖 5-3(a)和(b)描繪了在 CIT 和COL 上需要的總的樣本數量。重點需要觀察的是剪枝策略使得提前結束成為可能,使得需要更少的樣本。既然+重用并不考慮剪枝,那么其需要的樣本數量和基本是一樣的,因此我們忽略對其進行比較。兩個圖都反映了剪枝規(guī)則很有效,減少了約1 1~4 3的樣本量。最終使得運行速度加快?偟膩碇v,+重用相比基本體現了優(yōu)越性,而+剪枝比+重用更好。因此+剪枝作為最終的算法 fanta。接下來,我們評價參數值變化對于 fanta 不確定性,及可擴展性的影響。5.4 評價參數的影響除了 ,用戶定義的參數 與 也會影響算法性能。在本組實驗中,我們衡量 與 的變化對算法效率的影響程度,其中 fanta 與基本進行了比較與分析。我們
【學位授予單位】:國防科學技術大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:E11;TP391.1

【相似文獻】

相關期刊論文 前10條

1 陳鳳娟;;概率代表頻繁模式挖掘[J];牡丹江師范學院學報(自然科學版);2017年02期

2 陳鳳娟;;不確定數據的頻繁模式挖掘[J];白城師范學院學報;2016年05期

3 石杰;;一種快速頻繁模式挖掘算法[J];煙臺大學學報(自然科學與工程版);2015年02期

4 張艷芳;過仕明;;基于分類頻繁模式挖掘的書目推薦策略與算法[J];情報科學;2012年12期

5 張廣路;雷景生;;界標窗口數據流頻繁模式挖掘特性[J];計算機工程與應用;2011年10期

6 潘怡;杜紅燕;;概念格在頻繁模式挖掘中的應用研究[J];湖南科技大學學報(自然科學版);2010年02期

7 李群;;數據流的頻繁模式挖掘算法淺析[J];電腦知識與技術;2008年S2期

8 戰(zhàn)立強;劉大昕;;小波濾波在時間序列頻繁模式挖掘中的應用[J];哈爾濱工程大學學報;2008年01期

9 敖富江;顏躍進;黃健;黃柯棣;;數據流頻繁模式挖掘算法設計[J];計算機科學;2008年03期

10 馬連燈;王占剛;;基于滑動窗口模型的數據流加權頻繁模式挖掘算法[J];軟件工程;2016年10期

相關會議論文 前10條

1 侯俊杰;李春平;;一種基于內存索引的頻繁模式挖掘算法[A];第二十二屆中國數據庫學術會議論文集(研究報告篇)[C];2005年

2 袁晴晴;樓宇波;周皓峰;汪衛(wèi);施伯樂;;基于圖論的頻繁模式挖掘[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年

3 林景亮;董槐林;姜青山;吳書;;一種基于新增閾值的頻繁模式挖掘算法[A];第二十三屆中國數據庫學術會議論文集(研究報告篇)[C];2006年

4 孟軍;姜軍曉;劉秋水;;基于滑動窗口的流數據頻繁模式挖掘算法[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

5 王聞;謝伙生;;基于FP樹和對稱矩陣的最大頻繁模式挖掘算法[A];第二十五屆中國數據庫學術會議論文集(二)[C];2008年

6 韓蒙;張煒;李建中;;RAKING:一種高效的不確定圖K-極大頻繁模式挖掘算法[A];NDBC2010第27屆中國數據庫學術會議論文集A輯一[C];2010年

7 馬秀莉;劉健;童云海;唐世渭;楊冬青;;基于模式索引樹的增量挖掘[A];第二十屆全國數據庫學術會議論文集(技術報告篇)[C];2003年

8 曾濤;向勇;包小源;劉胤田;蔣永光;;中醫(yī)古方挖掘:一種頻繁藥組發(fā)現與功效標注算法[A];第二十五屆中國數據庫學術會議論文集(一)[C];2008年

9 高晶;李建中;張兆功;;挖掘數值型數據流中的最大頻繁模式[A];第二十一屆中國數據庫學術會議論文集(研究報告篇)[C];2004年

10 邱勇;蘭永杰;劉曉華;;高效FP-TREE創(chuàng)建算法[A];第二十一屆中國數據庫學術會議論文集(技術報告篇)[C];2004年

相關重要報紙文章 前1條

1 本報記者 姚琳;科學與追求相伴[N];廣西日報;2011年

相關博士學位論文 前10條

1 阮幼林;頻繁模式挖掘算法及在入侵檢測中的應用研究[D];華中科技大學;2004年

2 馬海兵;頻繁模式挖掘相關技術研究[D];復旦大學;2005年

3 戰(zhàn)立強;頻繁模式挖掘算法研究[D];哈爾濱工程大學;2007年

4 貝毅君;XML數據頻繁模式挖掘技術研究[D];浙江大學;2008年

5 林曉勇;頻繁模式挖掘和動態(tài)維護的理論與方法研究[D];北京化工大學;2008年

6 徐玉生;頻繁模式挖掘算法與剪枝策略研究[D];蘭州大學;2008年

7 劉勇;頻繁模式挖掘相關技術研究[D];復旦大學;2007年

8 王倩;基于位值壓縮存儲的頻繁模式挖掘方法及應用研究[D];燕山大學;2016年

9 于曉梅;面向不確定數據的頻繁模式挖掘方法研究[D];山東師范大學;2016年

10 楊厚群;半結構化數據頻繁模式挖掘相關技術研究[D];重慶大學;2010年

相關碩士學位論文 前10條

1 陳一帆;面向單幅不確定大圖的頻繁模式挖掘技術研究[D];國防科學技術大學;2015年

2 付夕;大規(guī)模數據流的頻繁模式挖掘方法的研究[D];中國科學技術大學;2018年

3 李杰;基于并行頻繁模式挖掘算法的博客推薦系統的設計與實現[D];內蒙古大學;2018年

4 袁二毛;生物序列近似頻繁模式挖掘研究[D];合肥工業(yè)大學;2017年

5 高璐宇;基于頻繁模式挖掘算法的業(yè)務量預測研究[D];北京郵電大學;2018年

6 鄭邦祺;基于時間序列的頻繁模式挖掘研究與應用[D];電子科技大學;2016年

7 劉金鳳;頻繁模式挖掘技術的研究及其在實時信號處理中的應用[D];電子科技大學;2016年

8 李寒;基于手機上下文的用戶頻繁模式挖掘技術研究[D];國防科學技術大學;2015年

9 王陽;頻繁模式挖掘技術及其在電信收入保障系統中的應用研究[D];湖南大學;2010年

10 杜叢強;不確定數據流中頻繁模式挖掘算法的研究[D];山東師范大學;2016年



本文編號:2668776

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shekelunwen/renwuzj/2668776.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶646bb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com