天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Web和Email的多元社會網(wǎng)絡(luò)抽取與分析關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2018-10-09 08:31
【摘要】:隨著信息技術(shù)和網(wǎng)絡(luò)通信技術(shù)的發(fā)展,利用互聯(lián)網(wǎng)組織的違法行為和活動越來越多。如何從多種網(wǎng)絡(luò)數(shù)據(jù)中準(zhǔn)確抽取人物的屬性和社會關(guān)系等信息,進(jìn)而挖掘潛在的關(guān)鍵人物和社團(tuán)組織等網(wǎng)情信息,已成為一個(gè)備受關(guān)注的問題。目前,基于單一網(wǎng)絡(luò)數(shù)據(jù)的社會網(wǎng)絡(luò)抽取與分析技術(shù)已比較成熟,但相關(guān)技術(shù)還無法解決基于多種網(wǎng)絡(luò)數(shù)據(jù)的社會網(wǎng)絡(luò)抽取與分析問題。本文對基于網(wǎng)絡(luò)數(shù)據(jù)的社會網(wǎng)絡(luò)抽取與分析相關(guān)技術(shù)的應(yīng)用和研究現(xiàn)狀進(jìn)行了分析,在此基礎(chǔ)上,針對Web頁面和Email消息這兩種數(shù)據(jù),圍繞基于多種網(wǎng)絡(luò)數(shù)據(jù)的社會網(wǎng)絡(luò)抽取與分析中的幾個(gè)關(guān)鍵技術(shù),包括社會網(wǎng)絡(luò)模型、人物屬性抽取、社會關(guān)系評估及社團(tuán)發(fā)現(xiàn)等,開展了深入研究。主要工作和研究成果包括以下幾個(gè)方面: (1)社會網(wǎng)絡(luò)模型方面。針對現(xiàn)有社會網(wǎng)絡(luò)模型不能充分描述人物在多種網(wǎng)絡(luò)數(shù)據(jù)中的屬性及社會關(guān)系信息,提出了多元社會網(wǎng)絡(luò)的概念與模型,并給出了基于Web和Email的多元社會網(wǎng)絡(luò)實(shí)例的具體描述方法;該模型為基于多種網(wǎng)絡(luò)數(shù)據(jù)的人物的屬性抽取、社會關(guān)系評估和社團(tuán)發(fā)現(xiàn)等社會網(wǎng)絡(luò)抽取與分析技術(shù)提供了研究基礎(chǔ);诖四P,提出了多元社會網(wǎng)絡(luò)抽取分析技術(shù)框架,并對其中的關(guān)鍵技術(shù)進(jìn)行了分析,該框架對面向多元社會網(wǎng)絡(luò)的相關(guān)研究和系統(tǒng)設(shè)計(jì)具有較好的指導(dǎo)意義。 (2)基于Web頁面的人物屬性抽取方面。針對現(xiàn)有Web人物屬性抽取的概念和方法不能適用于Web頁面中不同類型的人物屬性自動抽取問題,提出了廣義Web人物屬性抽取的概念,并對其進(jìn)行了形式化描述。為解決廣義Web人物屬性抽取問題,提出了基于多特征自動推理的Web人物屬性抽取方法(MFAR)。在MFAR方法的關(guān)聯(lián)規(guī)則定義問題上,提出了多種具有通用性的關(guān)聯(lián)特征,建立了基于單一特征和多特征的屬性關(guān)聯(lián)規(guī)則,對關(guān)聯(lián)特征和關(guān)聯(lián)規(guī)則進(jìn)行了邏輯表示。提出了利用Markov邏輯網(wǎng)來解決MFAR方法中的關(guān)聯(lián)規(guī)則自動訓(xùn)練與推理問題,并給出了基于Markov邏輯網(wǎng)的關(guān)聯(lián)規(guī)則自動訓(xùn)練與推理框架。實(shí)驗(yàn)結(jié)果表明:面對不同類型的Web人物屬性抽取問題,,與現(xiàn)有基于單一規(guī)則的Web人物屬性抽取方法相比,該算法可以更準(zhǔn)確地從Web頁面中自動抽取出人物屬性。 (3)基于Email數(shù)據(jù)的人物屬性抽取方面。提出了基于郵件數(shù)據(jù)的人物屬性抽取框架;針對框架中郵件正文稱呼塊和簽名塊內(nèi)的候選人名屬性抽取問題,提出了基于統(tǒng)計(jì)和規(guī)則的塊定位算法;針對框架中候選人名可信度評估問題,提出了基于聚類和通信重要度的候選人名可信度評估算法,算法通過對候選人名聚類并分析人名在郵件通信中體現(xiàn)的重要度,評估候選人名類的可信度,進(jìn)而抽取出人物的可信人名。在Enron郵件數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明利用提出的塊定位算法可以較為準(zhǔn)確地抽取出郵件正文中的稱呼塊和簽名塊,提出的候選人名可信度評估算法可以準(zhǔn)確地抽取出人物的正式人名及其別名。 (4)基于Web頁面的社會關(guān)系評估方面。針對現(xiàn)有Web社會關(guān)系評估方法的評估結(jié)果準(zhǔn)確度不高、穩(wěn)定性不好等問題,提出了一個(gè)基于搜索引擎和文本分析的Web社會關(guān)系評估模型;在該模型的基礎(chǔ)上,設(shè)計(jì)了兩種關(guān)系評估函數(shù),并構(gòu)建了相應(yīng)的關(guān)系評估方法。實(shí)驗(yàn)結(jié)果表明:與現(xiàn)有基于搜索引擎和基于文本分析的典型方法相比,基于SETARM模型設(shè)計(jì)的兩種關(guān)系評估方法計(jì)算出的關(guān)系權(quán)重更準(zhǔn)確、穩(wěn)定性更好;模型中兩類基本方法以線性方式融合且基于文本分析的方法其貢獻(xiàn)更大時(shí)模型的性能更好。 (5)社團(tuán)發(fā)現(xiàn)算法方面。針對現(xiàn)有社團(tuán)發(fā)現(xiàn)算法不能很好地解決多元社會網(wǎng)絡(luò)中的社團(tuán)發(fā)現(xiàn)問題,提出了多元社會網(wǎng)絡(luò)中社團(tuán)發(fā)現(xiàn)的基本思想。基于該思想,針對多元社會網(wǎng)絡(luò)向有權(quán)網(wǎng)絡(luò)的轉(zhuǎn)換問題,提出了綜合多元信息的關(guān)系緊密度評估方法(MICE);針對有權(quán)網(wǎng)絡(luò)中的社團(tuán)發(fā)現(xiàn)問題,提出了兩階段局部貪婪擴(kuò)展算法(TSLGE),算法在種子的選擇、擴(kuò)展評價(jià)函數(shù)的定義和相似社團(tuán)合并等關(guān)鍵問題的處理上提出了改進(jìn)方法。在基于Enron郵件集構(gòu)建的多元社會網(wǎng)絡(luò)實(shí)例上的實(shí)驗(yàn)結(jié)果,驗(yàn)證了利用MICE方法評估出的節(jié)點(diǎn)之間的關(guān)系緊密度與真實(shí)社會關(guān)系更接近;在仿真網(wǎng)絡(luò)和基于Enron郵件集構(gòu)建的多元社會網(wǎng)絡(luò)實(shí)例上進(jìn)行的社團(tuán)發(fā)現(xiàn)實(shí)驗(yàn)結(jié)果表明,TSLGE算法具有較好的時(shí)間性能,且與現(xiàn)有基于局部擴(kuò)展的典型社團(tuán)發(fā)現(xiàn)算法相比,TSLGE算法在無權(quán)網(wǎng)絡(luò)和有權(quán)網(wǎng)絡(luò)上均可以比較準(zhǔn)確地發(fā)現(xiàn)網(wǎng)絡(luò)中的社團(tuán)。 最后,對全文工作進(jìn)行了總結(jié),并對多元社會網(wǎng)絡(luò)抽取和分析技術(shù)進(jìn)行了展望,提出了下一步的研究方向。
[Abstract]:......
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2012
【分類號】:TP393.09

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李方敏;CGI的安全編程[J];計(jì)算機(jī)工程與應(yīng)用;1999年06期

2 宋如順,姜乃松;基于Web的遠(yuǎn)程考試系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;1999年06期

3 王紅霞,姚家亮;利用ASP構(gòu)建新型信息系統(tǒng)的方法與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;1999年09期

4 鄧勁生,張銀福;面向?qū)ο蟮亩嗝襟w信息WEB發(fā)布[J];計(jì)算機(jī)應(yīng)用研究;1999年09期

5 刁興春,李赤紅;Intranet環(huán)境下事務(wù)處理的理論研究和實(shí)現(xiàn)[J];小型微型計(jì)算機(jī)系統(tǒng);1999年06期

6 高昆;基于ASP的WEB站點(diǎn)開發(fā)技術(shù)分析[J];北華大學(xué)學(xué)報(bào)(社會科學(xué)版);1999年05期

7 王清心,胡建華;經(jīng)貿(mào)數(shù)據(jù)庫的WEB集成發(fā)布[J];昆明理工大學(xué)學(xué)報(bào);1999年02期

8 李晶,朱秋萍;Web頁制作中的動態(tài)表現(xiàn)技術(shù)[J];計(jì)算機(jī)工程;2000年06期

9 劉波,代亞非,杜躍進(jìn);遠(yuǎn)程協(xié)同教學(xué)系統(tǒng)中課程搜索子系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用;2000年06期

10 武莊,劉友丹;基于Web的企業(yè)內(nèi)部質(zhì)量審核系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2000年05期

相關(guān)會議論文 前10條

1 石晶;龔震宇;裘杭萍;;基于Web挖掘的個(gè)性化服務(wù)技術(shù)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2002年

2 李利波;劉明利;;一種改進(jìn)的無回溯反向Web服務(wù)動態(tài)組合方法[A];2011年全國通信安全學(xué)術(shù)會議論文集[C];2011年

3 游爭光;劉建勛;唐明董;;分布式Web服務(wù)測試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];CCF NCSC 2011——第二屆中國計(jì)算機(jī)學(xué)會服務(wù)計(jì)算學(xué)術(shù)會議論文集[C];2011年

4 殷華蓓;李通;唐常杰;張?zhí)鞈c;左志松;;從Web文件中挖掘個(gè)性化導(dǎo)航知識[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2000年

5 ;基于廣義對話的Web用戶的聚類(英文)[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2000年

6 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2001年

7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七屆中國控制會議論文集[C];2008年

8 胡建強(qiáng);周斌;尹剛;鄒鵬;;基于角色的Web服務(wù)訪問控制技術(shù)研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2003年

9 黃建波;丁揚(yáng);方芳;;基于代理服務(wù)器的Web加速的實(shí)現(xiàn)[A];2010通信理論與技術(shù)新發(fā)展——第十五屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2010年

10 陶冶;劉建勛;唐明董;;基于Map/Reduce的分布式Web服務(wù)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];CCF NCSC 2011——第二屆中國計(jì)算機(jī)學(xué)會服務(wù)計(jì)算學(xué)術(shù)會議論文集[C];2011年

相關(guān)重要報(bào)紙文章 前10條

1 ;Web 2.0數(shù)據(jù)分析工具正流行[N];網(wǎng)絡(luò)世界;2008年

2 趙曉濤;Web安全 服務(wù)為王[N];網(wǎng)絡(luò)世界;2008年

3 本報(bào)記者 趙曉濤;Web安全:歷史的命題[N];網(wǎng)絡(luò)世界;2008年

4 彭敏;企業(yè)級Web2.0迎來應(yīng)用高潮[N];電腦商報(bào);2009年

5 本報(bào)記者 毛江華;安啟華聯(lián)手賽門鐵克 掘金Web安全[N];計(jì)算機(jī)世界;2009年

6 閆冰;“推”出Web交付新天地[N];網(wǎng)絡(luò)世界;2009年

7 趙曉濤;中國成全球Web安全新看點(diǎn)[N];網(wǎng)絡(luò)世界;2009年

8 邊歆;動態(tài)阻斷Web2.0威脅[N];網(wǎng)絡(luò)世界;2009年

9 泰樂公司首席技術(shù)官兼執(zhí)行副總裁Vikram Saksena;學(xué)習(xí)Web 3.0 做聰明的“管道工”[N];通信產(chǎn)業(yè)報(bào);2009年

10 ;Web2.0工具使用須謹(jǐn)慎[N];網(wǎng)絡(luò)世界;2009年

相關(guān)博士學(xué)位論文 前10條

1 王洋;社會網(wǎng)絡(luò)視角下的危機(jī)傳播機(jī)理與治理[D];哈爾濱工業(yè)大學(xué);2011年

2 倪順江;基于復(fù)雜網(wǎng)絡(luò)理論的傳染病動力學(xué)建模與研究[D];清華大學(xué);2009年

3 尹美娟;基于Web和Email的多元社會網(wǎng)絡(luò)抽取與分析關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2012年

4 袁曉婷;企業(yè)R&D團(tuán)隊(duì)內(nèi)部社會網(wǎng)絡(luò)與團(tuán)隊(duì)知識創(chuàng)造關(guān)系研究[D];華南理工大學(xué);2010年

5 張淑娟;吳景濂與民國政治:1916~1923[D];復(fù)旦大學(xué);2007年

6 徐峰;互聯(lián)網(wǎng)宏觀拓?fù)浣Y(jié)構(gòu)中社團(tuán)特征演化分析及應(yīng)用[D];東北大學(xué);2009年

7 蘇春艷;社會網(wǎng)絡(luò)與職業(yè)獲得[D];上海大學(xué);2005年

8 王小明;社會資本的經(jīng)濟(jì)分析[D];復(fù)旦大學(xué);2008年

9 鄧學(xué)軍;企業(yè)家社會網(wǎng)絡(luò)對企業(yè)績效的影響研究[D];暨南大學(xué);2009年

10 林琛;WEB環(huán)境下的社會網(wǎng)絡(luò)挖掘研究[D];復(fù)旦大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 龐永杰;基于Web的社會網(wǎng)絡(luò)搜索中人名同一性判斷方法研究[D];華中科技大學(xué);2011年

2 唐黎;Deep Web頁面結(jié)構(gòu)分析與核心內(nèi)容提取研究[D];重慶大學(xué);2011年

3 吳新勇;基于需求群組的Web服務(wù)調(diào)度模型研究[D];上海交通大學(xué);2011年

4 徐衛(wèi);Web新聞熱點(diǎn)發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2011年

5 姜本臣;基于嵌入式Web服務(wù)器應(yīng)用技術(shù)的研究[D];沈陽工業(yè)大學(xué);2012年

6 溫梨梨;基于零拷貝的Web服務(wù)器技術(shù)研究[D];中國海洋大學(xué);2011年

7 焦燕廷;一種基于領(lǐng)域本體的語義Web服務(wù)匹配和組合方法[D];山東科技大學(xué);2011年

8 黃亮;Web漏洞掃描系統(tǒng)中的智能爬蟲技術(shù)研究[D];杭州電子科技大學(xué);2012年

9 趙春娟;Web服務(wù)組合方法的研究與實(shí)現(xiàn)[D];天津理工大學(xué);2011年

10 任強(qiáng);基于謂詞抽象與精化技術(shù)的Web服務(wù)驗(yàn)證研究[D];蘇州大學(xué);2011年



本文編號:2258667

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2258667.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f769***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com