天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于規(guī)則和相關(guān)度的微博垃圾評(píng)論檢測(cè)系統(tǒng)及實(shí)現(xiàn)

發(fā)布時(shí)間:2018-08-06 22:18
【摘要】:微博的使用在生活中已經(jīng)成為一個(gè)很重要的信息來源或工作或娛樂或推廣或?qū)ひ?隨著微博使用量的擴(kuò)大,微博評(píng)論也變得豐富多彩,甚至有時(shí)回復(fù)成為了亮點(diǎn)。也正因此如此,越來越多的人開始關(guān)注微博評(píng)論,甚至是一些別有用心的垃圾評(píng)論制造者。然而微博垃圾評(píng)論的出現(xiàn),讓評(píng)論的形象大打折扣。因此本文重點(diǎn)是發(fā)現(xiàn)并處理微博中的垃圾評(píng)論,總結(jié)垃圾評(píng)論的規(guī)則和通過相關(guān)度判斷出評(píng)論的發(fā)展趨勢(shì)并利用WEB開發(fā)的B/S結(jié)構(gòu)構(gòu)建微博評(píng)論分類系統(tǒng)。新浪微博是當(dāng)今微博幾大平臺(tái)之一,技術(shù)成熟的API接口為很多第三方開發(fā)用戶提供了方便。本系統(tǒng)從新浪微博數(shù)據(jù)平臺(tái)API接口下載微博評(píng)論,并作為實(shí)驗(yàn)樣本,導(dǎo)入自行開發(fā)的垃圾微博評(píng)論分類系統(tǒng)中,存儲(chǔ)到指定數(shù)據(jù)庫,通過參數(shù)設(shè)定設(shè)定參數(shù)的初期規(guī)則庫。將數(shù)據(jù)到如分類系統(tǒng)經(jīng)過規(guī)則庫過濾形成分類,在此同時(shí)分類的評(píng)論增強(qiáng)了評(píng)論規(guī)則庫的成熟度。在過濾過程中使用到了神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)挖掘理論。利用神經(jīng)網(wǎng)路來聯(lián)系數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,通過長(zhǎng)期總結(jié)的規(guī)則來評(píng)判評(píng)論的分類情況。本系統(tǒng)的特色在系統(tǒng)中的產(chǎn)生垃圾評(píng)論的同時(shí)還會(huì)通過相關(guān)度和數(shù)據(jù)挖掘形成新的信息來強(qiáng)壯本系統(tǒng)的規(guī)則庫。這個(gè)過程產(chǎn)生了評(píng)論規(guī)則庫。當(dāng)規(guī)則庫趨近成熟時(shí)分類結(jié)果更趨于所需分類結(jié)果。在程序中還涉及到可以切換人工手動(dòng)挑選的功能,本文認(rèn)為這是必不可少的,正所謂人工智能與人工密不可分,系統(tǒng)日志功能為系統(tǒng)的正常運(yùn)行保駕護(hù)航。本系統(tǒng)的開發(fā)語言Java,采用JSP技術(shù)實(shí)現(xiàn)網(wǎng)頁界面。Java最大優(yōu)點(diǎn)是跨平臺(tái)能力強(qiáng),系統(tǒng)運(yùn)行穩(wěn)定。在大的數(shù)據(jù)處理的微博評(píng)論分類系統(tǒng)中,一個(gè)穩(wěn)定的代碼平臺(tái)是剛性前提。以JS和CSS完成美化頁面效果o SQL Server 2000為數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫,SQL Server2000數(shù)據(jù)庫技術(shù)成熟,補(bǔ)丁完善。系統(tǒng)采用BS結(jié)構(gòu)原因是在網(wǎng)絡(luò)發(fā)展迅猛的今天通過網(wǎng)絡(luò)瀏覽器就可以使用系統(tǒng)減少了安裝環(huán)境步驟同時(shí)隨時(shí)隨地可以使用。
[Abstract]:The use of Weibo has become a very important source of information or work or entertainment or promotion or search in life. With the expansion of Weibo usage, Weibo reviews become rich and colorful, and sometimes return to become a bright spot. As a result, more and more people are paying attention to Weibo reviews, and even to spammers with ulterior motives. However, the emergence of Weibo spam comments, so that the image of the comments greatly reduced. Therefore, the emphasis of this paper is to find and deal with the garbage comments in Weibo, summarize the rules of garbage comments, judge the development trend of comments by the correlation degree, and use the B / S structure developed by WEB to construct the Weibo comment classification system. Sina Weibo is one of the major platforms of Weibo nowadays. The mature technology of API interface provides convenience for many third party development users. This system downloads the Weibo comments from the API interface of Sina Weibo data platform, and as an experimental sample, imports the garbage Weibo comment classification system developed by itself, stores it into the designated database, and sets the parameters through the initial rule base. The data is filtered into a classification system to form a classification, and comments classified at the same time enhance the maturity of the comment rule base. Neural network and data mining theory are used in filtering process. Neural network is used to relate the relationship between data and data, and the classification of comments is judged by the rule of long-term summary. The feature of this system is that the garbage comments are generated in the system, and new information is formed by correlation and data mining to strengthen the rule base of the system. This process produces a review rule base. When the rule base approach to maturity, the classification results tend to the desired classification results. The function of manual selection is also involved in the program, which is considered essential in this paper. The so-called artificial intelligence and artificial intelligence are inseparable, and the system log function guarantees the normal operation of the system. Java, the development language of this system, has the greatest advantage of using JSP technology to realize the web interface. Java has strong ability of cross-platform and the system runs stably. In the large data processing Weibo comment classification system, a stable code platform is a rigid premise. Using JS and CSS to beautify page effect o SQL Server 2000 as data storage database, SQL Server2000 database technology is mature and patch is perfect. The reason why the system adopts BS structure is that the system can be used through the web browser today with the rapid development of the network. It reduces the steps of installation environment and can be used anywhere.
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092;TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李志宇;;對(duì)付垃圾短信消費(fèi)者動(dòng)力不足[J];通信世界;2008年23期

2 孫升蕓;田萱;;產(chǎn)品垃圾評(píng)論檢測(cè)研究綜述[J];計(jì)算機(jī)科學(xué);2011年S1期

3 周光斌;用法律、經(jīng)濟(jì)和技術(shù)手段圍殲垃圾信息[J];現(xiàn)代電信科技;2004年07期

4 樹子;;把一切垃圾短信拒之門外[J];數(shù)字通信;2007年12期

5 江林芯;蔣艷青;;四川成立12321網(wǎng)絡(luò)不良與垃圾信息舉報(bào)受理中心[J];通信與信息技術(shù);2010年01期

6 楊風(fēng)雷;黎建輝;;用戶生成內(nèi)容中的垃圾意見研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2011年10期

7 程德杰;;互聯(lián)網(wǎng)時(shí)代垃圾信息的預(yù)防和遏制[J];互聯(lián)網(wǎng)天地;2012年05期

8 孫升蕓;田萱;何軍;;基于評(píng)論行為的商品垃圾評(píng)論的識(shí)別研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年11期

9 ;關(guān)于開展垃圾短信息整治專項(xiàng)行動(dòng)工作方案的通知[J];信息安全與通信保密;2008年07期

10 徐玉;;垃圾短信的治理工作任重而道遠(yuǎn)[J];江蘇通信;2009年02期

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 王劉芳 實(shí)習(xí)生 王薇薇;手機(jī)垃圾信息誰打掃[N];北京日?qǐng)?bào);2001年

2 本報(bào)記者 聶曉飛;群發(fā)器成垃圾短信溫床 多部門聯(lián)防或成有效方式[N];通信信息報(bào);2010年

3 ;74.54%的中國手機(jī)用戶收到過欺詐類短信[N];中國計(jì)算機(jī)報(bào);2010年

4 趙缶;學(xué)學(xué)新加坡 立法治理垃圾短信[N];深圳特區(qū)報(bào);2012年

5 ;立法打擊垃圾信息成為共識(shí)[N];網(wǎng)絡(luò)世界;2005年

6 李韜;保衛(wèi)手機(jī)[N];計(jì)算機(jī)世界;2006年

7 程蓉 記者 王春;上海:呼吁立法控制垃圾信息[N];科技日?qǐng)?bào);2006年

8 谷慧;垃圾短信重打不下[N];民營經(jīng)濟(jì)報(bào);2006年

9 通訊員  周 鶯;上海市人大代表呼吁制定反垃圾信息法[N];人民代表報(bào);2006年

10 劉恒 通訊員  田源;重慶聯(lián)通大力整治垃圾短信[N];人民郵電;2006年

相關(guān)博士學(xué)位論文 前1條

1 黃文良;垃圾短信過濾關(guān)鍵技術(shù)研究[D];浙江大學(xué);2008年

相關(guān)碩士學(xué)位論文 前10條

1 黃興鳳;在線社會(huì)網(wǎng)絡(luò)下的垃圾信息過濾技術(shù)的研究[D];上海師范大學(xué);2015年

2 王鳳嬌;垃圾短信判定系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

3 劉晶;融合多特征聚類的垃圾微博檢測(cè)研究[D];重慶大學(xué);2015年

4 劉杰;基于用戶評(píng)價(jià)的垃圾評(píng)論檢測(cè)[D];東南大學(xué);2015年

5 劉曉燕;基于規(guī)則和相關(guān)度的微博垃圾評(píng)論檢測(cè)系統(tǒng)及實(shí)現(xiàn)[D];東北大學(xué);2014年

6 吉超;論垃圾短信的法律規(guī)制[D];內(nèi)蒙古大學(xué);2012年

7 石晶;一種高效垃圾短信過濾系統(tǒng)的實(shí)現(xiàn)[D];電子科技大學(xué);2010年

8 李春野;我國垃圾信息的法律規(guī)制[D];吉林大學(xué);2010年

9 李文龍;論垃圾短信的法律規(guī)制[D];延邊大學(xué);2009年

10 賈曉舟;中國“垃圾短信”法律治理探究[D];吉林大學(xué);2013年



本文編號(hào):2169162

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2169162.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8c14e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com