基于增量多模型融合的垃圾短信過(guò)濾算法研究
發(fā)布時(shí)間:2021-12-23 08:26
伴隨著通訊技術(shù)的不斷成熟,與通訊相關(guān)的使用場(chǎng)景也愈加寬泛。一方面,人們享受著科技帶來(lái)的豐碩成果,無(wú)線(xiàn)網(wǎng)絡(luò)技術(shù)得到飛速發(fā)展,但另一方面,制度和監(jiān)管的相對(duì)缺失,使得很多圍繞無(wú)線(xiàn)通訊的“黑色產(chǎn)業(yè)”造成了許多負(fù)面的影響,例如手機(jī)的垃圾短信就始終困擾著人們的生活。為了對(duì)手機(jī)的垃圾短信進(jìn)行檢測(cè)識(shí)別與過(guò)濾,對(duì)當(dāng)前基于文本分類(lèi)技術(shù)的垃圾短信過(guò)濾方法進(jìn)行了研究,詳細(xì)介紹了文本分類(lèi)過(guò)程中的預(yù)處理技術(shù)和特征提取技術(shù),并通過(guò)實(shí)驗(yàn)對(duì)比分析了 K鄰近算法和樸素貝葉斯算法的性能。此外,針對(duì)傳統(tǒng)文本分類(lèi)算法中存在的缺陷,即當(dāng)加入新的樣本后分類(lèi)器會(huì)因?yàn)樽R(shí)別的局限性導(dǎo)致分類(lèi)效果下降,提出了兩點(diǎn)改進(jìn)方法:(1)設(shè)計(jì)并實(shí)現(xiàn)了基于評(píng)分法的增量多模型融合方法。增量多模型融合方法對(duì)新增的樣本依次進(jìn)行訓(xùn)練,每個(gè)樣本數(shù)據(jù)集可得到一個(gè)子分類(lèi)器,不同的訓(xùn)練集構(gòu)成多個(gè)子分類(lèi)器。增量多模型融合方法通過(guò)“少數(shù)服從多數(shù)”的原則對(duì)每一條待分類(lèi)短信進(jìn)行分類(lèi),若多數(shù)子分類(lèi)器輸出的結(jié)果表示正常,則該待分類(lèi)短信為正常短信,反之則為垃圾短信。這樣做的優(yōu)勢(shì)在于避免重新對(duì)分類(lèi)器進(jìn)行訓(xùn)練,減少了文本檢索算法的時(shí)間損失和資源耗費(fèi),提高了文本分類(lèi)的效果;(2)設(shè)計(jì)并實(shí)...
【文章來(lái)源】:長(zhǎng)沙理工大學(xué)湖南省
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖4.2引入學(xué)習(xí)法后的錯(cuò)誤率??圖4.2是在分類(lèi)上使用學(xué)習(xí)法的錯(cuò)誤率曲線(xiàn),橫坐標(biāo)1到10表示使用學(xué)習(xí)法的實(shí)驗(yàn)??
【參考文獻(xiàn)】:
期刊論文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于詞向量和卷積神經(jīng)網(wǎng)絡(luò)的垃圾短信識(shí)別方法[J]. 賴(lài)文輝,喬宇鵬. 計(jì)算機(jī)應(yīng)用. 2018(09)
[3]基于語(yǔ)義理解注意力神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類(lèi)[J]. 謝金寶,侯永進(jìn),康守強(qiáng),李佰蔚,張霄. 電子與信息學(xué)報(bào). 2018(05)
[4]多類(lèi)型分類(lèi)器融合的文本分類(lèi)方法研究[J]. 李惠富,陸光. 計(jì)算機(jī)應(yīng)用研究. 2019(03)
[5]基于類(lèi)別特征改進(jìn)的KNN短文本分類(lèi)算法[J]. 黃賢英,熊李媛,劉英濤,李沁東. 計(jì)算機(jī)工程與科學(xué). 2018(01)
[6]結(jié)合語(yǔ)義擴(kuò)展和卷積神經(jīng)網(wǎng)絡(luò)的中文短文本分類(lèi)方法[J]. 盧玲,楊武,楊有俊,陳夢(mèng)晗. 計(jì)算機(jī)應(yīng)用. 2017(12)
[7]基于特征隸屬度的文本分類(lèi)相似性度量方法[J]. 池云仙,趙書(shū)良,羅燕,趙駿鵬,高琳,李超. 計(jì)算機(jī)科學(xué). 2017(11)
[8]粗糙集近似集的KNN文本分類(lèi)算法研究[J]. 楊帥華,張清華. 小型微型計(jì)算機(jī)系統(tǒng). 2017(10)
[9]基于中心向量的多級(jí)分類(lèi)KNN算法研究[J]. 劉述昌,張忠林. 計(jì)算機(jī)工程與科學(xué). 2017(09)
[10]基于吸引子傳播聚類(lèi)的改進(jìn)雙通道CNN短文本分類(lèi)算法[J]. 王儒,劉培玉,王培培. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
博士論文
[1]垃圾短信過(guò)濾關(guān)鍵技術(shù)研究[D]. 黃文良.浙江大學(xué) 2008
碩士論文
[1]基于深度學(xué)習(xí)多模型融合的中文短文本情感分類(lèi)算法研究與實(shí)現(xiàn)[D]. 何遠(yuǎn)生.華南理工大學(xué) 2018
[2]基于機(jī)器學(xué)習(xí)的文本情感分類(lèi)研究[D]. 信桂龍.杭州電子科技大學(xué) 2017
[3]多模型融合學(xué)習(xí)方法與應(yīng)用[D]. 馬健.南京大學(xué) 2016
[4]垃圾短信過(guò)濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 吳世競(jìng).北京郵電大學(xué) 2012
[5]垃圾短信過(guò)濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 何孝金.電子科技大學(xué) 2009
本文編號(hào):3548142
【文章來(lái)源】:長(zhǎng)沙理工大學(xué)湖南省
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖4.2引入學(xué)習(xí)法后的錯(cuò)誤率??圖4.2是在分類(lèi)上使用學(xué)習(xí)法的錯(cuò)誤率曲線(xiàn),橫坐標(biāo)1到10表示使用學(xué)習(xí)法的實(shí)驗(yàn)??
【參考文獻(xiàn)】:
期刊論文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于詞向量和卷積神經(jīng)網(wǎng)絡(luò)的垃圾短信識(shí)別方法[J]. 賴(lài)文輝,喬宇鵬. 計(jì)算機(jī)應(yīng)用. 2018(09)
[3]基于語(yǔ)義理解注意力神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類(lèi)[J]. 謝金寶,侯永進(jìn),康守強(qiáng),李佰蔚,張霄. 電子與信息學(xué)報(bào). 2018(05)
[4]多類(lèi)型分類(lèi)器融合的文本分類(lèi)方法研究[J]. 李惠富,陸光. 計(jì)算機(jī)應(yīng)用研究. 2019(03)
[5]基于類(lèi)別特征改進(jìn)的KNN短文本分類(lèi)算法[J]. 黃賢英,熊李媛,劉英濤,李沁東. 計(jì)算機(jī)工程與科學(xué). 2018(01)
[6]結(jié)合語(yǔ)義擴(kuò)展和卷積神經(jīng)網(wǎng)絡(luò)的中文短文本分類(lèi)方法[J]. 盧玲,楊武,楊有俊,陳夢(mèng)晗. 計(jì)算機(jī)應(yīng)用. 2017(12)
[7]基于特征隸屬度的文本分類(lèi)相似性度量方法[J]. 池云仙,趙書(shū)良,羅燕,趙駿鵬,高琳,李超. 計(jì)算機(jī)科學(xué). 2017(11)
[8]粗糙集近似集的KNN文本分類(lèi)算法研究[J]. 楊帥華,張清華. 小型微型計(jì)算機(jī)系統(tǒng). 2017(10)
[9]基于中心向量的多級(jí)分類(lèi)KNN算法研究[J]. 劉述昌,張忠林. 計(jì)算機(jī)工程與科學(xué). 2017(09)
[10]基于吸引子傳播聚類(lèi)的改進(jìn)雙通道CNN短文本分類(lèi)算法[J]. 王儒,劉培玉,王培培. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
博士論文
[1]垃圾短信過(guò)濾關(guān)鍵技術(shù)研究[D]. 黃文良.浙江大學(xué) 2008
碩士論文
[1]基于深度學(xué)習(xí)多模型融合的中文短文本情感分類(lèi)算法研究與實(shí)現(xiàn)[D]. 何遠(yuǎn)生.華南理工大學(xué) 2018
[2]基于機(jī)器學(xué)習(xí)的文本情感分類(lèi)研究[D]. 信桂龍.杭州電子科技大學(xué) 2017
[3]多模型融合學(xué)習(xí)方法與應(yīng)用[D]. 馬健.南京大學(xué) 2016
[4]垃圾短信過(guò)濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 吳世競(jìng).北京郵電大學(xué) 2012
[5]垃圾短信過(guò)濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 何孝金.電子科技大學(xué) 2009
本文編號(hào):3548142
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3548142.html
最近更新
教材專(zhuān)著