基于半監(jiān)督學習的網絡詐騙案例的實體識別與實體關系抽取研究
發(fā)布時間:2021-12-28 17:24
目前網絡詐騙不僅種類繁多、詐騙手段更新迭代升級速度快,而且詐騙范圍遍及全國各地,造成了巨大的財產損失。為了快速破案,保護人民財產,需從數量龐大的詐騙案例中分析詐騙方式,找出其特點并加以防范。面對數量龐大的數據,僅僅依賴人力手動分析是不夠的,需要借助現有的科技與方法來實現。本文使用半監(jiān)督學習與神經網絡相結合的方法,抽取網絡詐騙案例中的實體與實體關系并分析。本文從以下幾個方面入手:第一,因為目前網絡上沒有標準的、有權威性的、覆蓋范圍廣的網絡詐騙語料庫可供使用。本項目分別從獵聘網與各大新聞報道網站爬取數據,構建data1與data2兩個數據集,采用BIO標注的方式手工標注部分案例,構建本文的語料庫。第二,基于Bi-LSTM+CRF實體識別的模型基礎之上,為了克服語料庫小的問題,引入半監(jiān)督學習的思想構建半監(jiān)督識別模型(Semi-supervised Recognition Model,SRM)。第三,采用聯合標注策略,對半監(jiān)督識別模型(Semi-supervised Recognition Model,SRM)進行改造。通過將softmax層替代原先的CRF層和添加位置標簽構建新的關系抽取模型...
【文章來源】:南昌大學江西省 211工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
014-2018獵聘網詐騙數量舉報圖
014-2018年網絡詐騙人均損失在對獵聘網收到的詐騙舉報案例分析發(fā)現:僅2018年一年,其收到的有效
018年網絡詐騙主要類型以及損失
【參考文獻】:
期刊論文
[1]移動互聯網時代下網絡詐騙犯罪態(tài)勢、特征與防控——基于對866份刑事裁判文書的實證研究[J]. 汪嘉佩. 犯罪研究. 2017(06)
[2]網絡信息安全防范和Web數據挖掘技術的有效整合[J]. 吳雷. 網絡空間安全. 2016(06)
[3]開放式地理實體關系抽取的Bootstrapping方法[J]. 余麗,陸鋒,劉希亮. 測繪學報. 2016(05)
[4]大數據分析的無限深度神經網絡方法[J]. 張蕾,章毅. 計算機研究與發(fā)展. 2016(01)
[5]基于多核融合的中文領域實體關系抽取[J]. 郭劍毅,陳鵬,余正濤,線巖團,毛存禮,趙君. 中文信息學報. 2016(01)
[6]無指導的中文開放式實體關系抽取[J]. 秦兵,劉安安,劉挺. 計算機研究與發(fā)展. 2015(05)
[7]網絡詐騙案件的特點及偵查路徑[J]. 李堯. 江西警察學院學報. 2015(02)
[8]融合領域知識短語樹核函數的中文領域實體關系抽取[J]. 陳鵬,郭劍毅,余正濤,嚴馨,張志坤,高盛祥. 南京大學學報(自然科學). 2015(01)
[9]基于句法語義特征的中文實體關系抽取[J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學報. 2014(06)
[10]網絡詐騙犯罪淺析[J]. 呂巖. 中共樂山市委黨校學報. 2013(01)
博士論文
[1]面向開放領域文本的實體關系抽取[D]. 郭喜躍.華中師范大學 2016
碩士論文
[1]無監(jiān)督中文實體關系抽取研究[D]. 施琦.中國地質大學(北京) 2015
[2]基于多核融合的中文領域實體關系抽取研究[D]. 陳鵬.昆明理工大學 2014
[3]基于多代理策略的中文實體關系抽取[D]. 王敏.大連理工大學 2011
[4]Web環(huán)境下基于語義模式匹配的實體關系提取方法的研究[D]. 周詩詠.東北大學 2009
[5]基于圖的半監(jiān)督學習模型研究與分類器設計[D]. 郝建柏.中國科學技術大學 2009
本文編號:3554440
【文章來源】:南昌大學江西省 211工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
014-2018獵聘網詐騙數量舉報圖
014-2018年網絡詐騙人均損失在對獵聘網收到的詐騙舉報案例分析發(fā)現:僅2018年一年,其收到的有效
018年網絡詐騙主要類型以及損失
【參考文獻】:
期刊論文
[1]移動互聯網時代下網絡詐騙犯罪態(tài)勢、特征與防控——基于對866份刑事裁判文書的實證研究[J]. 汪嘉佩. 犯罪研究. 2017(06)
[2]網絡信息安全防范和Web數據挖掘技術的有效整合[J]. 吳雷. 網絡空間安全. 2016(06)
[3]開放式地理實體關系抽取的Bootstrapping方法[J]. 余麗,陸鋒,劉希亮. 測繪學報. 2016(05)
[4]大數據分析的無限深度神經網絡方法[J]. 張蕾,章毅. 計算機研究與發(fā)展. 2016(01)
[5]基于多核融合的中文領域實體關系抽取[J]. 郭劍毅,陳鵬,余正濤,線巖團,毛存禮,趙君. 中文信息學報. 2016(01)
[6]無指導的中文開放式實體關系抽取[J]. 秦兵,劉安安,劉挺. 計算機研究與發(fā)展. 2015(05)
[7]網絡詐騙案件的特點及偵查路徑[J]. 李堯. 江西警察學院學報. 2015(02)
[8]融合領域知識短語樹核函數的中文領域實體關系抽取[J]. 陳鵬,郭劍毅,余正濤,嚴馨,張志坤,高盛祥. 南京大學學報(自然科學). 2015(01)
[9]基于句法語義特征的中文實體關系抽取[J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學報. 2014(06)
[10]網絡詐騙犯罪淺析[J]. 呂巖. 中共樂山市委黨校學報. 2013(01)
博士論文
[1]面向開放領域文本的實體關系抽取[D]. 郭喜躍.華中師范大學 2016
碩士論文
[1]無監(jiān)督中文實體關系抽取研究[D]. 施琦.中國地質大學(北京) 2015
[2]基于多核融合的中文領域實體關系抽取研究[D]. 陳鵬.昆明理工大學 2014
[3]基于多代理策略的中文實體關系抽取[D]. 王敏.大連理工大學 2011
[4]Web環(huán)境下基于語義模式匹配的實體關系提取方法的研究[D]. 周詩詠.東北大學 2009
[5]基于圖的半監(jiān)督學習模型研究與分類器設計[D]. 郝建柏.中國科學技術大學 2009
本文編號:3554440
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3554440.html