天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于分類模型監(jiān)測電子商務(wù)違禁信息的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-04-15 07:09

  本文關(guān)鍵詞:基于分類模型監(jiān)測電子商務(wù)違禁信息的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:當(dāng)今,隨著互聯(lián)網(wǎng)的飛速發(fā)展和普及,電子商務(wù)已經(jīng)成為人們生產(chǎn)和生活中的重要媒介。諸如阿里巴巴、淘寶等大型電子商務(wù)平臺每天都有數(shù)十萬的交易發(fā)生,其中難免會產(chǎn)生許多不良和違禁信息。如果不能及時(shí)有效的處理,將嚴(yán)重危害電子商務(wù)的發(fā)展。因此,對于各種良莠不齊的信息,必須采取有效的審核過濾機(jī)制。但是,面對急劇膨脹的信息量,僅靠人工審核將變的越來越困難,迫切需要利用計(jì)算機(jī)自動信息過濾手段來提高違禁信息監(jiān)測的效率。 本文針對電子商務(wù)違禁信息監(jiān)測機(jī)制進(jìn)行深入分析和研究,旨在利用文本分詞、關(guān)鍵詞提取和文本分類等相關(guān)信息檢索技術(shù)來幫助實(shí)現(xiàn)違禁信息的自動識別,從而降低人工進(jìn)行違禁信息審核的負(fù)擔(dān),提高電子商務(wù)信息發(fā)布的效率。本文認(rèn)為,違禁信息的監(jiān)測主要由違禁關(guān)鍵詞監(jiān)測和違禁內(nèi)容監(jiān)測兩部分組成。其中,如何提取違禁關(guān)鍵詞和識別違禁內(nèi)容,將成為解決違禁信息監(jiān)測的關(guān)鍵所在。因此,本文引入違禁類別關(guān)鍵詞選擇技術(shù)和文本分類模型作為違禁信息監(jiān)測的基礎(chǔ)。對于違禁關(guān)鍵詞,本文根據(jù)特征選取和類別區(qū)分度,實(shí)現(xiàn)違禁詞選取;對于違禁內(nèi)容,本文采用基于文檔結(jié)構(gòu)特征的改進(jìn)向量空間模型表示文檔信息,以求達(dá)到更加理想的分類效果,并在支持向量機(jī)分類摸型的基礎(chǔ)上實(shí)現(xiàn)了電子商務(wù)違禁內(nèi)容的監(jiān)測,然后以最大熵算法作為效果對比。 本文采集了大量真實(shí)的電子商務(wù)信息進(jìn)行了違禁信息監(jiān)測實(shí)驗(yàn)。結(jié)果表明,本文提出的以違禁關(guān)鍵詞和違禁內(nèi)容為基礎(chǔ)的電子商務(wù)信息監(jiān)測,對違禁信息的識別具有良好的效果,從而表明通過機(jī)器學(xué)習(xí)進(jìn)行違禁信息自動監(jiān)測具有可行性。
【關(guān)鍵詞】:電子商務(wù) 違禁關(guān)鍵詞 違禁內(nèi)容監(jiān)測 信息檢索 改進(jìn)向量空間模型 文本分類
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP393.09
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 第1章 緒論10-16
  • 1.1 引言10
  • 1.2 互聯(lián)網(wǎng)與電子商務(wù)10-13
  • 1.2.1 互聯(lián)網(wǎng)及其發(fā)展11-12
  • 1.2.2 電子商務(wù)及其發(fā)展12-13
  • 1.3 研究目的和意義13-14
  • 1.4 本文工作和結(jié)構(gòu)14-15
  • 1.4.1 本文工作14
  • 1.4.2 本文結(jié)構(gòu)14-15
  • 1.5 本章小結(jié)15-16
  • 第2章 相關(guān)理論和工作16-29
  • 2.1 信息檢索與Web數(shù)據(jù)挖掘16-23
  • 2.1.1 信息檢索技術(shù)16-18
  • 2.1.2 信息檢索模型18-21
  • 2.1.3 Web數(shù)據(jù)挖掘技術(shù)21-23
  • 2.2 文本處理技術(shù)23-28
  • 2.2.1 中文分詞技術(shù)23-24
  • 2.2.2 文本分類技術(shù)24-28
  • 2.3 本章小結(jié)28-29
  • 第3章 違禁關(guān)鍵字選擇與匹配29-37
  • 3.1 違禁關(guān)鍵詞監(jiān)測總體設(shè)計(jì)30-31
  • 3.2 違禁關(guān)鍵詞選取31-35
  • 3.2.1 關(guān)鍵特征選擇32-33
  • 3.2.2 強(qiáng)類別區(qū)別詞選擇33-35
  • 3.3 違禁關(guān)鍵詞匹配35-36
  • 3.4 本章小結(jié)36-37
  • 第4章 基于分類的違禁內(nèi)容監(jiān)測37-48
  • 4.1 違禁內(nèi)容監(jiān)測總體設(shè)計(jì)37-38
  • 4.2 改進(jìn)向量空間模型38-41
  • 4.2.1 傳統(tǒng)向量空間模型38-40
  • 4.2.2 結(jié)合網(wǎng)頁特征的向量空間模型40-41
  • 4.3 違禁內(nèi)容分類建模41-47
  • 4.3.1 求解最優(yōu)分類超平面41-46
  • 4.3.2 違禁類別判斷46-47
  • 4.4 本章小結(jié)47-48
  • 第5章 系統(tǒng)設(shè)計(jì)與效果評估48-63
  • 5.1 系統(tǒng)總體設(shè)計(jì)框架48-49
  • 5.2 實(shí)驗(yàn)數(shù)據(jù)49-54
  • 5.2.1 數(shù)據(jù)源獲取49-50
  • 5.2.2 數(shù)據(jù)預(yù)處理50-52
  • 5.2.3 分詞停用詞處理52-53
  • 5.2.4 輸入數(shù)據(jù)格式53-54
  • 5.3 系統(tǒng)實(shí)現(xiàn)54-56
  • 5.4 實(shí)驗(yàn)結(jié)果56-62
  • 5.4.1 評價(jià)指標(biāo)56
  • 5.4.2 違禁關(guān)鍵詞監(jiān)測結(jié)果及討論56-59
  • 5.4.3 違禁內(nèi)容監(jiān)測結(jié)果及討論59-62
  • 5.5 本章小結(jié)62-63
  • 第6章 總結(jié)與展望63-65
  • 6.1 工作總結(jié)63-64
  • 6.2 未來展望64-65
  • 參考文獻(xiàn)65-69
  • 攻讀碩士學(xué)位期間主要的研究成果69-70
  • 致謝70

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊緒兵,韓自存;ε不敏感的核Adaline算法及其在圖像去噪中的應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期

2 陶秀鳳,唐詩忠,周鳴爭;基于支持向量機(jī)的軟測量模型及應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期

3 許高程;張文君;王衛(wèi)紅;;支持向量機(jī)技術(shù)在遙感影像滑坡體提取中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2009年06期

4 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機(jī)遙感圖像融合分類方法研究進(jìn)展[J];安徽農(nóng)業(yè)科學(xué);2010年17期

5 馮學(xué)軍;;最小二乘支持向量機(jī)的研究與應(yīng)用[J];安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期

6 鄒心遙;姚若河;;基于LSSVM的威布爾分布形狀參數(shù)估計(jì)(英文)[J];半導(dǎo)體技術(shù);2008年06期

7 鄒心遙;姚若河;;基于LSSVM的小子樣元器件壽命預(yù)測[J];半導(dǎo)體技術(shù);2011年09期

8 李卓遠(yuǎn),吳為民,王e,

本文編號:307882


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/307882.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶acd04***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com