基于子圖模式的反恐情報(bào)關(guān)聯(lián)圖集分析
發(fā)布時(shí)間:2021-08-16 19:13
[目的/意義]利用子圖模式對暴恐案件中的人員關(guān)聯(lián)進(jìn)行分析可以發(fā)現(xiàn)涉恐人員關(guān)聯(lián)圖中的規(guī)律,為反恐情報(bào)分析提供有效參考。[方法/過程]首先對涉恐基礎(chǔ)數(shù)據(jù)進(jìn)行預(yù)處理,保證圖中各頂點(diǎn)的唯一性。通過計(jì)數(shù)統(tǒng)計(jì)出所有的頻繁1-子圖和頻繁2-子圖,然后不斷迭代生成其他候選子圖并篩選頻繁子圖,直到達(dá)到終止條件為止。[結(jié)果/結(jié)論]該方法根據(jù)反恐情報(bào)的特點(diǎn)進(jìn)行了優(yōu)化,避免了普通頻繁子圖挖掘中的大量圖同構(gòu)檢測,挖掘出的頻繁子圖可以反映不同類別涉恐人員之間的聯(lián)系規(guī)律和聯(lián)系特點(diǎn),發(fā)現(xiàn)暴恐案件線索,有效預(yù)測和打擊恐怖活動。
【文章來源】:現(xiàn)代情報(bào). 2019,39(07)CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
關(guān)聯(lián)圖集挖掘方法
文的分析中將不再討論圖同構(gòu)問題。4反恐情報(bào)中的子圖模式挖掘示例4.1涉恐人員關(guān)聯(lián)圖集樣本反恐情報(bào)子圖模式挖掘前,除了常規(guī)的數(shù)據(jù)挖掘預(yù)處理外,還要將所有的人員關(guān)聯(lián)統(tǒng)計(jì)出來并生成原始樣本圖集。首先按照基礎(chǔ)人員的涉恐特征,將不同的人員分為幾大類;A(chǔ)涉恐人員分類時(shí)以職業(yè)、教育水平、年齡、身高、體重、性別、收入水平等屬性特征劃分。分類后將人員劃定為A、B、C、D、E、F……等不同的人群,再利用風(fēng)險(xiǎn)分析為每個(gè)分類中的人員編號排序,保證唯一性。如圖3所示為一組涉恐人員關(guān)聯(lián)樣本圖集,圖集中共有4個(gè)子圖對應(yīng)4組人員數(shù)據(jù),分別包含5人、4人、4人、4人,即原始樣本圖集共由17名人員的數(shù)據(jù)生成,每個(gè)子圖中的人員編號表示類別和在對應(yīng)子圖中的排序。圖中的數(shù)據(jù)完全隨機(jī)生成,表1所示為對應(yīng)的事務(wù)表。例如圖G1中的邊(a1,b,p)前兩個(gè)元素為兩個(gè)頂點(diǎn)a1和b,表示兩個(gè)涉恐人員,p表示兩個(gè)人員之間的聯(lián)系權(quán)值大小。本文將以這四個(gè)虛擬的關(guān)聯(lián)圖詳細(xì)說明如何利用子圖模式挖掘發(fā)現(xiàn)涉恐人員的聯(lián)系規(guī)律。圖3涉恐人員關(guān)聯(lián)樣本圖集表1樣本數(shù)據(jù)人員關(guān)聯(lián)圖對應(yīng)事務(wù)表(a1,a2,p)(a1,b,p)(a2,c,r)(a2,d,r)(b,c,q)(b,d,p)G1111110G2110100G3111010G4001111—04—2019年7月第39卷第7期基于子圖模式的反恐情報(bào)關(guān)聯(lián)圖集分析July,2019Vol.39No.7
變的,所以對應(yīng)的鄰接矩陣一定是唯一的,對比子圖時(shí)只需要利用唯一的鄰接矩陣對比。MG1=0pp00p00rrp00q00rq000r000MG2=0pp0p00rp0000r00MG3=0pp0p00rp00q0rq0MG4=00rr00qprq00rp004.2量化分析過程設(shè)最小支持度閾值為40%,則頻繁子圖支持度計(jì)數(shù)至少為2(大于等于4*40%,數(shù)值4表示圖集中共有4個(gè)關(guān)聯(lián)圖),最小頂點(diǎn)數(shù)閾值為4。如圖4所示為樣本人員關(guān)聯(lián)圖的子圖模式挖掘過程,圖中圓括號內(nèi)數(shù)字表示支持度計(jì)數(shù)。當(dāng)子圖中只有1個(gè)節(jié)點(diǎn)(k=1)時(shí),只需對圖集中每個(gè)頂點(diǎn)計(jì)數(shù),如果候選1-子圖(只有1個(gè)單獨(dú)頂點(diǎn))計(jì)數(shù)大于或等于2時(shí),則滿足支持度條件,樣本圖集中有5個(gè)頂點(diǎn)滿足條件。接著在表1中利用頻繁1-子圖兩兩組合,通過計(jì)數(shù)挖掘出頻繁2-子圖(k=2),每個(gè)子圖中包含2個(gè)頂點(diǎn)和1條邊,共有5個(gè)頻繁2-子圖滿足條件。從挖掘頻繁k-子圖(k>2)開始,基于每兩個(gè)頻繁(k-1)-子圖共享“核”(相同的頻繁(k-2)-子圖,對應(yīng)鄰接矩陣除了最后一行和最后一列完全相同)生成候選k-子圖,然后利用先驗(yàn)原理和支持度計(jì)數(shù)統(tǒng)計(jì)選擇滿足條件的頻繁k-子圖。產(chǎn)生候選k-子圖和頻繁k-子圖的過程有以下幾種不同的情況。圖4子圖模式挖掘過程情況1:不存在新增頂點(diǎn)的對應(yīng)生成邊,即表1中沒有對應(yīng)事務(wù)(圖5中“問號”只能取0),表示涉恐人員之間沒有聯(lián)系。產(chǎn)生候選3-子圖的過程即為合并對應(yīng)的頻繁2-
【參考文獻(xiàn)】:
期刊論文
[1]貝葉斯理論在反恐情報(bào)分類分析中的應(yīng)用研究[J]. 李勇男. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于頻繁序列模式挖掘的反恐情報(bào)關(guān)聯(lián)分析[J]. 李勇男. 情報(bào)理論與實(shí)踐. 2018(10)
[3]時(shí)空軌跡頻繁模式在反恐情報(bào)分析中的應(yīng)用研究[J]. 李勇男. 情報(bào)雜志. 2018(08)
[4]空間模式挖掘在反恐情報(bào)分析中的應(yīng)用研究[J]. 李勇男. 情報(bào)雜志. 2018(04)
[5]反恐背景下的個(gè)人特征數(shù)據(jù)構(gòu)成與涉恐個(gè)體的挖掘分析[J]. 陳鵬,瞿珂,陳剛,汪勇. 情報(bào)雜志. 2018(04)
[6]反恐情報(bào)分析中的數(shù)據(jù)預(yù)處理研究[J]. 李勇男,梅建明,秦廣軍. 情報(bào)科學(xué). 2017(11)
[7]交互式話單數(shù)據(jù)的社會關(guān)系權(quán)值分析[J]. 侯麗波,王冠. 中國刑警學(xué)院學(xué)報(bào). 2017(05)
[8]“9·11”以來全球反恐戰(zhàn)略困境探析[J]. 王震. 社會科學(xué). 2017(09)
[9]基于頻繁模式樹的涉恐情報(bào)關(guān)聯(lián)分析[J]. 李勇男,梅建明. 情報(bào)科學(xué). 2017(09)
[10]基于頻繁子圖挖掘的數(shù)據(jù)服務(wù)Mashup推薦[J]. 張仲妹,王桂玲,張賽,韓燕波. 電子科技大學(xué)學(xué)報(bào). 2016(02)
碩士論文
[1]頻繁子圖挖掘算法的研究[D]. 張偉.燕山大學(xué) 2011
[2]頻繁子圖挖掘算法的研究與應(yīng)用[D]. 劉振.中南大學(xué) 2009
本文編號:3346234
【文章來源】:現(xiàn)代情報(bào). 2019,39(07)CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
關(guān)聯(lián)圖集挖掘方法
文的分析中將不再討論圖同構(gòu)問題。4反恐情報(bào)中的子圖模式挖掘示例4.1涉恐人員關(guān)聯(lián)圖集樣本反恐情報(bào)子圖模式挖掘前,除了常規(guī)的數(shù)據(jù)挖掘預(yù)處理外,還要將所有的人員關(guān)聯(lián)統(tǒng)計(jì)出來并生成原始樣本圖集。首先按照基礎(chǔ)人員的涉恐特征,將不同的人員分為幾大類;A(chǔ)涉恐人員分類時(shí)以職業(yè)、教育水平、年齡、身高、體重、性別、收入水平等屬性特征劃分。分類后將人員劃定為A、B、C、D、E、F……等不同的人群,再利用風(fēng)險(xiǎn)分析為每個(gè)分類中的人員編號排序,保證唯一性。如圖3所示為一組涉恐人員關(guān)聯(lián)樣本圖集,圖集中共有4個(gè)子圖對應(yīng)4組人員數(shù)據(jù),分別包含5人、4人、4人、4人,即原始樣本圖集共由17名人員的數(shù)據(jù)生成,每個(gè)子圖中的人員編號表示類別和在對應(yīng)子圖中的排序。圖中的數(shù)據(jù)完全隨機(jī)生成,表1所示為對應(yīng)的事務(wù)表。例如圖G1中的邊(a1,b,p)前兩個(gè)元素為兩個(gè)頂點(diǎn)a1和b,表示兩個(gè)涉恐人員,p表示兩個(gè)人員之間的聯(lián)系權(quán)值大小。本文將以這四個(gè)虛擬的關(guān)聯(lián)圖詳細(xì)說明如何利用子圖模式挖掘發(fā)現(xiàn)涉恐人員的聯(lián)系規(guī)律。圖3涉恐人員關(guān)聯(lián)樣本圖集表1樣本數(shù)據(jù)人員關(guān)聯(lián)圖對應(yīng)事務(wù)表(a1,a2,p)(a1,b,p)(a2,c,r)(a2,d,r)(b,c,q)(b,d,p)G1111110G2110100G3111010G4001111—04—2019年7月第39卷第7期基于子圖模式的反恐情報(bào)關(guān)聯(lián)圖集分析July,2019Vol.39No.7
變的,所以對應(yīng)的鄰接矩陣一定是唯一的,對比子圖時(shí)只需要利用唯一的鄰接矩陣對比。MG1=0pp00p00rrp00q00rq000r000MG2=0pp0p00rp0000r00MG3=0pp0p00rp00q0rq0MG4=00rr00qprq00rp004.2量化分析過程設(shè)最小支持度閾值為40%,則頻繁子圖支持度計(jì)數(shù)至少為2(大于等于4*40%,數(shù)值4表示圖集中共有4個(gè)關(guān)聯(lián)圖),最小頂點(diǎn)數(shù)閾值為4。如圖4所示為樣本人員關(guān)聯(lián)圖的子圖模式挖掘過程,圖中圓括號內(nèi)數(shù)字表示支持度計(jì)數(shù)。當(dāng)子圖中只有1個(gè)節(jié)點(diǎn)(k=1)時(shí),只需對圖集中每個(gè)頂點(diǎn)計(jì)數(shù),如果候選1-子圖(只有1個(gè)單獨(dú)頂點(diǎn))計(jì)數(shù)大于或等于2時(shí),則滿足支持度條件,樣本圖集中有5個(gè)頂點(diǎn)滿足條件。接著在表1中利用頻繁1-子圖兩兩組合,通過計(jì)數(shù)挖掘出頻繁2-子圖(k=2),每個(gè)子圖中包含2個(gè)頂點(diǎn)和1條邊,共有5個(gè)頻繁2-子圖滿足條件。從挖掘頻繁k-子圖(k>2)開始,基于每兩個(gè)頻繁(k-1)-子圖共享“核”(相同的頻繁(k-2)-子圖,對應(yīng)鄰接矩陣除了最后一行和最后一列完全相同)生成候選k-子圖,然后利用先驗(yàn)原理和支持度計(jì)數(shù)統(tǒng)計(jì)選擇滿足條件的頻繁k-子圖。產(chǎn)生候選k-子圖和頻繁k-子圖的過程有以下幾種不同的情況。圖4子圖模式挖掘過程情況1:不存在新增頂點(diǎn)的對應(yīng)生成邊,即表1中沒有對應(yīng)事務(wù)(圖5中“問號”只能取0),表示涉恐人員之間沒有聯(lián)系。產(chǎn)生候選3-子圖的過程即為合并對應(yīng)的頻繁2-
【參考文獻(xiàn)】:
期刊論文
[1]貝葉斯理論在反恐情報(bào)分類分析中的應(yīng)用研究[J]. 李勇男. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于頻繁序列模式挖掘的反恐情報(bào)關(guān)聯(lián)分析[J]. 李勇男. 情報(bào)理論與實(shí)踐. 2018(10)
[3]時(shí)空軌跡頻繁模式在反恐情報(bào)分析中的應(yīng)用研究[J]. 李勇男. 情報(bào)雜志. 2018(08)
[4]空間模式挖掘在反恐情報(bào)分析中的應(yīng)用研究[J]. 李勇男. 情報(bào)雜志. 2018(04)
[5]反恐背景下的個(gè)人特征數(shù)據(jù)構(gòu)成與涉恐個(gè)體的挖掘分析[J]. 陳鵬,瞿珂,陳剛,汪勇. 情報(bào)雜志. 2018(04)
[6]反恐情報(bào)分析中的數(shù)據(jù)預(yù)處理研究[J]. 李勇男,梅建明,秦廣軍. 情報(bào)科學(xué). 2017(11)
[7]交互式話單數(shù)據(jù)的社會關(guān)系權(quán)值分析[J]. 侯麗波,王冠. 中國刑警學(xué)院學(xué)報(bào). 2017(05)
[8]“9·11”以來全球反恐戰(zhàn)略困境探析[J]. 王震. 社會科學(xué). 2017(09)
[9]基于頻繁模式樹的涉恐情報(bào)關(guān)聯(lián)分析[J]. 李勇男,梅建明. 情報(bào)科學(xué). 2017(09)
[10]基于頻繁子圖挖掘的數(shù)據(jù)服務(wù)Mashup推薦[J]. 張仲妹,王桂玲,張賽,韓燕波. 電子科技大學(xué)學(xué)報(bào). 2016(02)
碩士論文
[1]頻繁子圖挖掘算法的研究[D]. 張偉.燕山大學(xué) 2011
[2]頻繁子圖挖掘算法的研究與應(yīng)用[D]. 劉振.中南大學(xué) 2009
本文編號:3346234
本文鏈接:http://www.sikaile.net/falvlunwen/fanzuizhian/3346234.html
最近更新
教材專著