天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于數(shù)據(jù)挖掘的自適應垃圾短信過濾系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2019-11-10 19:57
【摘要】:隨著科技的進步和人們生活質(zhì)量的提高,手機已經(jīng)成為人們?nèi)粘I畈豢扇鄙俚囊徊糠?手機短信因其方便快捷等優(yōu)點成為了大眾所喜愛的一種通信聯(lián)絡(luò)方式。但短信也會被一些不法分子利用,垃圾短信已經(jīng)影響到一些普通消費者的正常生活,垃圾短信問題日益嚴峻。因此,對垃圾短信過濾系統(tǒng)的研究具有重要的意義。本文針對現(xiàn)有垃圾短信過濾系統(tǒng)的不足之處,設(shè)計了一個實時過濾和非實時過濾相結(jié)合的垃圾短信過濾系統(tǒng)。引入了正則表達式對垃圾短信進行高效匹配,提高了短信過濾的效率。采用實時過濾和非實時過濾相結(jié)合的方式,既保證了對即時消息全面的監(jiān)控,又將過濾系統(tǒng)對時延的影響降到了最低。本文的主要工作如下:首先介紹了垃圾短信的定義,分析了垃圾短信的研究現(xiàn)狀,包括垃圾短信的成因、危害及其主要特征,綜合國內(nèi)外的垃圾短信治理現(xiàn)狀,給出了研究意義和背景。詳細介紹了本文所述系統(tǒng)中需要用到的關(guān)鍵技術(shù),包括垃圾短信過濾相關(guān)技術(shù)及文本分類的相關(guān)技術(shù)。對于文本分類技術(shù),本文詳細闡述了文本預處理,中文分詞,特征表示,特征選取等技術(shù),分析了文本分類技術(shù)在短信中的應用。并對正常短信及垃圾短信的各自特征進行了分析研究。其次對垃圾短信過濾系統(tǒng)進行了需求分析、概要設(shè)計以及詳細設(shè)計與實現(xiàn)。系統(tǒng)包括實時過濾子系統(tǒng)和非實時過濾子系統(tǒng),其中實時過濾子系統(tǒng)包括基于用戶短信長度的過濾模塊、基于關(guān)鍵字/詞的過濾模塊和基于正則表達式策略的過濾模塊。非實時過濾子系統(tǒng)實現(xiàn)了對短信的文本分類。在概要設(shè)計中介紹了系統(tǒng)的各個模塊以及各模塊之間的交互方式;在詳細設(shè)計中對系統(tǒng)各個模塊的實現(xiàn)進行了詳細的說明;最后實現(xiàn)了垃圾短信過濾系統(tǒng)。最后,收集實驗數(shù)據(jù),包括訓練集和測試集在內(nèi)的垃圾短信和正常短信;設(shè)計了垃圾短信過濾的實驗,并對實驗的結(jié)果進行了分析。實驗表明,本文設(shè)計和實現(xiàn)的過濾系統(tǒng)對垃圾短信過濾具有較高的準確性和效率。系統(tǒng)采用模塊化的架構(gòu)設(shè)計,具有高可用性、拓展性等特性,可以高效、準確地對垃圾短信進行過濾。
【圖文】:

短信,垃圾


逡逑圖3-1更清晰的表示出了正常短信和垃圾短信的長度特征:逡逑900逡逑800邐U7.逡逑::700邐^逡逑1邋1邋600邐I逡逑5邋500逡逑400邐’今逡逑300邐I邐^邋^邐廠逡逑200邐I邐I逡逑:mWnW網(wǎng)_二|逡逑0-20字邐20-30字邐30-40字邐40-50字邐50字以上逡逑□垃圾短信□正常短信逡逑圖3-1正常短信和垃圾短信的長度特征逡逑由圖3-1可知在超過30個字的短信的短信中,大部分短信為垃圾短信,,而逡逑22逡逑

短信,垃圾,銀行卡


逡逑圖3-1更清晰的表示出了正常短信和垃圾短信的長度特征:逡逑900逡逑800邐U7.逡逑::700邐^逡逑1邋1邋600邐I逡逑5邋500逡逑400邐’今逡逑300邐I邐^邋^邐廠逡逑200邐I邐I逡逑:mWnW網(wǎng)_二|逡逑0-20字邐20-30字邐30-40字邐40-50字邐50字以上逡逑□垃圾短信□正常短信逡逑圖3-1正常短信和垃圾短信的長度特征逡逑由圖3-1可知在超過30個字的短信的短信中,大部分短信為垃圾短信,而逡逑22逡逑
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP311.13

【參考文獻】

相關(guān)期刊論文 前10條

1 曾琪;劉翔;;貝葉斯分類算法研究[J];生物技術(shù)世界;2015年11期

2 裴向杰;唐紅f;陳鵬;;一種改進的貝葉斯算法在短信過濾中的研究[J];計算機技術(shù)與發(fā)展;2015年09期

3 李綺婷;;關(guān)于垃圾短信文本分類算法的研究[J];黑龍江科技信息;2015年19期

4 杜鴻艦;金曉燕;梁新昀;敖琳;;中文分詞系統(tǒng)的設(shè)計與實現(xiàn)[J];電腦開發(fā)與應用;2014年08期

5 陳凱星;陳建英;;一種改進的基于樸素貝葉斯算法的垃圾短信過濾技術(shù)[J];福建電腦;2014年03期

6 周冰;;垃圾短信過濾技術(shù)與應用[J];中國新通信;2014年06期

7 李曉光;;手機短信的語言特點及社會影響探析[J];赤峰學院學報(漢文哲學社會科學版);2013年10期

8 李敏;卡米力·木依丁;;特征選擇方法與算法的研究[J];計算機技術(shù)與發(fā)展;2013年12期

9 計宏;;改進貝葉斯垃圾郵件過濾技術(shù)的研究[J];計算機測量與控制;2013年08期

10 徐英慧;劉梅彥;;基于內(nèi)容的手機端垃圾短信過濾策略研究[J];北京信息科技大學學報(自然科學版);2013年01期

相關(guān)博士學位論文 前2條

1 蔣良孝;樸素貝葉斯分類器及其改進算法研究[D];中國地質(zhì)大學;2009年

2 黃文良;垃圾短信過濾關(guān)鍵技術(shù)研究[D];浙江大學;2008年

相關(guān)碩士學位論文 前3條

1 張彪;文本分類中特征選擇算法的分析與研究[D];中國科學技術(shù)大學;2010年

2 關(guān)婧;基于內(nèi)容的客戶端垃圾短信過濾系統(tǒng)的研究[D];北京郵電大學;2008年

3 關(guān)娜;基于文本分類算法的垃圾短信過濾技術(shù)研究[D];電子科技大學;2008年



本文編號:2559009

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2559009.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d9131***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com