天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

采用URL特征的Hub網頁識別方法研究

發(fā)布時間:2019-11-25 22:11
【摘要】:【目的】通過構建簡單數據樣本,解決傳統(tǒng)網頁類型識別方法效率低的難題!痉椒ā坎捎肬RL特征作為識別依據,抽取URL信息構建訓練集與測試集,使用支持向量機(SVM)建立機器學習模型以提高識別效率!窘Y果】在同樣的數據集上,該方法的準確率為91.2%,優(yōu)于其他識別方法。在效率性能方面,該方法提升近60%!揪窒蕖慨斢龅経RL特征不明顯甚至完全相背的網站時,識別準確率會大幅度降低!窘Y論】該方法在效率方面存在很大優(yōu)勢,應用到采集系統(tǒng)中可提高采集效率。

【參考文獻】

相關碩士學位論文 前1條

1 謝光華;中文網頁自動分類的研究及其應用[D];大連理工大學;2007年

【共引文獻】

相關碩士學位論文 前6條

1 蘇秀芝;網頁去噪與特征提取算法的研究及實現(xiàn)[D];西南交通大學;2010年

2 白凡;改進的K近鄰算法在網頁文本分類中的應用[D];安徽大學;2010年

3 劉艷敏;網頁自動分類和存儲管理系統(tǒng)的設計與實現(xiàn)[D];北京郵電大學;2010年

4 王立建;中文web文本過濾技術研究[D];中北大學;2010年

5 郭媛媛;基于GIS的商場疏散安全評估系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2013年

6 錢強;中文網頁分類算法研究[D];江蘇科技大學;2013年

【二級參考文獻】

相關期刊論文 前9條

1 陳桂林,王永成;Internet網絡信息自動摘要的研究[J];高技術通訊;1999年02期

2 馮是聰,單松巍,龔筆宏,張志剛,李曉明;“天網”目錄導航服務研究[J];計算機研究與發(fā)展;2004年04期

3 王琦,唐世渭,楊冬青,王騰蛟;基于DOM的網頁主題信息自動提取[J];計算機研究與發(fā)展;2004年10期

4 周明建,高濟,李飛;基于本體論的Web信息抽取[J];計算機輔助設計與圖形學學報;2004年04期

5 趙欣欣;索紅光;劉玉樹;;基于標記窗的網頁正文信息提取方法[J];計算機應用研究;2007年03期

6 許勇,荀恩東,賈愛平,宋柔;基于互連網的術語定義獲取系統(tǒng)[J];中文信息學報;2004年04期

7 孫承杰,關毅;基于統(tǒng)計的網頁正文信息抽取方法的研究[J];中文信息學報;2004年05期

8 胡國平;張巍;王仁華;;基于雙層決策的新聞網頁正文精確抽取[J];中文信息學報;2006年06期

9 范焱,鄭誠,王清毅,蔡慶生,劉潔;用Naive Bayes方法協(xié)調分類Web網頁[J];軟件學報;2001年09期

相關碩士學位論文 前1條

1 董靜;中文網頁形式自動分類[D];大連理工大學;2006年

【相似文獻】

相關期刊論文 前10條

1 張東準;網頁減肥工具大觀[J];電腦技術;2001年04期

2 黃家貞;彈指間網頁內碼隨心換[J];電腦知識與技術;2004年22期

3 黃家貞;彈指間網頁內碼隨心換[J];網絡與信息;2004年09期

4 宏偉;巧妙抓取防滾屏網頁[J];電腦愛好者;2005年20期

5 啟動;;淺談網頁文件引用[J];網絡與信息;2006年05期

6 小叢;;教你輕松抓取無法滾屏的網頁[J];計算機與網絡;2006年08期

7 花的神明;;追尋網頁上閃動的音樂[J];電腦迷;2007年12期

8 秋思;;收藏一個網頁只需一個文件[J];電腦愛好者(普及版);2009年05期

9 唐永明;;淺議網頁設計與制作[J];科技信息;2009年20期

10 蔣偉;徐義平;;個性化網頁淺析[J];魅力中國;2009年35期

相關會議論文 前7條

1 張曉明;奈一雄;齊炯明;安媛媛;張建楠;王靜嫻;;基于信息隱藏的網頁入侵檢測技術與實現(xiàn)[A];2009通信理論與技術新發(fā)展——第十四屆全國青年通信學術會議論文集[C];2009年

2 林政;呂雅娟;劉群;馬希榮;;基于雙語混和網頁的平行語料挖掘[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

3 熊德蘭;鄢靖豐;陳靜;;基于論壇主題的網頁褒貶傾向性識別[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

4 隋春明;郭志豐;;網頁防篡改技術在電力信息網中的應用[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年

5 王海源;石睿智;;高校網頁惡意代碼的檢測、清理與預防[A];中國高等教育學會教育信息化分會第十次學術年會論文集[C];2010年

6 戴玉剛;;藏文網頁采集技術研究[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

7 劉世杰;唐世渭;楊冬青;王騰蛟;姚小波;;自動的WEB信息提取和集成[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年

相關重要報紙文章 前10條

1 范德生 鄧亞玲;守住網頁的秘密[N];電腦報;2005年

2 貞;網頁特效與瘦身專家[N];中國電腦教育報;2002年

3 網天;在自己的電腦上發(fā)布網頁[N];大眾科技報;2000年

4 楊興平 六子;我的網頁你別動[N];電腦報;2004年

5 楊耀祥;簡繁網頁批量互轉有妙法[N];中國電腦教育報;2003年

6 河北 李永波;網頁底圖顯個性[N];電腦報;2004年

7 ;讓你的網頁綻放最美麗的特效[N];中國電腦教育報;2004年

8 劉成富;編輯網頁有妙法[N];計算機世界;2004年

9 綿陽南山 iled;讓 Frontpage 2000 給我們“一了百了”[N];電腦報;2001年

10 陳宗偉;妙用查找替換功能編輯網頁[N];電腦報;2004年

相關博士學位論文 前3條

1 計華;Web Spam特征分析及其檢測技術研究[D];山東師范大學;2015年

2 陳定權;自動主題搜索的應用研究[D];中國科學院研究生院(文獻情報中心);2003年

3 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學;2007年

相關碩士學位論文 前10條

1 杜明明;基于關鍵詞的垃圾網頁判別研究[D];哈爾濱工業(yè)大學;2015年

2 劉慕凡;基于主題與語義的作弊網頁檢測方法研究[D];北京化工大學;2015年

3 賀知義;基于關鍵詞的搜索引擎網頁去重算法研究[D];華中師范大學;2015年

4 李小娟;基于分類技術的網頁去噪方法的研究[D];貴州師范大學;2015年

5 龔誠;網頁增量式采集技術研究[D];哈爾濱工業(yè)大學;2007年

6 李雙;基于用戶思維模型分析的網頁可用性設計研究[D];江南大學;2008年

7 劉典型;多頁面特殊網頁文字提取與合并技術研究[D];湖南大學;2010年

8 宋鰲;網頁去噪在交互電視中的應用與研究[D];上海交通大學;2011年

9 柳周頻;基于鏈接上下文的網頁預測[D];吉林大學;2006年

10 姜鑫;基于網頁連通信息的主題爬行技術研究與實現(xiàn)[D];吉林大學;2007年

,

本文編號:2565868

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2565868.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶48f75***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com