基于Web結(jié)構(gòu)挖掘的搜索引擎作弊檢測方法
本文選題:Web結(jié)構(gòu)挖掘 + 搜索引擎作弊。 參考:《計算機應用》2004年10期
【摘要】:搜索引擎作弊行為從搜索引擎優(yōu)化中演變而來,卻對網(wǎng)絡發(fā)展帶來負面影響。通過構(gòu)造站內(nèi)站外精簡模型用于判斷幾類作弊行為,得出PageRank改進算法中懲罰因子的公式和其中三個函數(shù)的特征,展望了搜索引擎作弊檢測方法的發(fā)展前景。
[Abstract]:Search engine cheating evolved from search engine optimization, but it has a negative impact on the development of network. By constructing a simplified model of the station inside and outside the station to judge several kinds of cheating behavior, the formula of penalty factor and the characteristics of three functions in the improved PageRank algorithm are obtained, and the development prospect of the cheating detection method of search engine is prospected.
【作者單位】: 暨南大學計算機科學系 暨南大學網(wǎng)絡中心 暨南大學計算機科學系
【基金】:廣東省科技計劃項目(2003C101037) 廣東省自然科學基金重點項目(010421)
【分類號】:TP393.07
【共引文獻】
相關期刊論文 前10條
1 王一蕾,林世平;基于Web頁面鏈接結(jié)構(gòu)的挖掘算法[J];福州大學學報(自然科學版);2004年04期
2 王艷輝,吳斌,王柏;電信社群網(wǎng)絡靜態(tài)幾何性質(zhì)分析研究[J];復雜系統(tǒng)與復雜性科學;2005年02期
3 邱均平,張洋;網(wǎng)絡信息計量學綜述[J];高校圖書館工作;2005年01期
4 王柏;吳巍;徐超群;吳斌;;復雜網(wǎng)絡可視化研究綜述[J];計算機科學;2007年04期
5 王鳳霞,張景,常曉;電子教務門戶研究與設計[J];計算機工程;2005年08期
6 高琰;谷士文;唐t;;基于鏈接分析的Web社區(qū)發(fā)現(xiàn)技術的研究[J];計算機應用研究;2006年07期
7 李向偉;曹博;;時間參數(shù)在HITS算法中的應用及改進[J];蘭州工業(yè)高等專科學校學報;2006年02期
8 吳春旭,郭磊;Web結(jié)構(gòu)挖掘的PageRank算法改進[J];情報雜志;2005年10期
9 王艷;張帆;楊炳儒;;基于Web挖掘的數(shù)字圖書館個性化技術研究[J];情報雜志;2007年01期
10 劉棟;劉希玉;郝婷婷;;基于PageRank和HITS的Web結(jié)構(gòu)挖掘算法研究[J];山東科學;2006年04期
相關會議論文 前2條
1 楊宇航;趙鐵軍;鄭德權;于浩;;基于鏈接分析的重要Blog信息源發(fā)現(xiàn)[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
2 張冉;卡米力毛依丁;;基于論文參考文獻引用分析的專業(yè)文獻查詢庫[A];第十屆全國少數(shù)民族語言文字信息處理學術研討會論文集[C];2005年
相關博士學位論文 前6條
1 董寶力;Web制造資源的語義發(fā)現(xiàn)關鍵技術研究[D];浙江大學;2007年
2 宗校軍;中文網(wǎng)頁定題采集及分類研究[D];華中科技大學;2006年
3 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關鍵技術研究[D];中南大學;2007年
4 楊傳耀;中文信息檢索索引模型及相關技術研究[D];復旦大學;2007年
5 樂小虬;非結(jié)構(gòu)化網(wǎng)絡空間信息智能搜索與服務研究[D];中國科學院研究生院(遙感應用研究所);2006年
6 鄧波;分布式序敏感查詢處理關鍵技術研究[D];國防科學技術大學;2006年
相關碩士學位論文 前10條
1 佟秀杰;全國信訪信息系統(tǒng)督察督辦及分析預測子系統(tǒng)的設計與實現(xiàn)[D];吉林大學;2007年
2 劉菁菁;基于結(jié)構(gòu)和主題的Web信息檢索研究[D];大連理工大學;2007年
3 周炳;基于K-L變換的權威頁面挖掘的算法[D];華中科技大學;2006年
4 丁妮;Web應用安全研究[D];南京信息工程大學;2007年
5 徐小磊;用戶瀏覽模式與頁面推薦的研究[D];南京理工大學;2007年
6 胡發(fā)連;基于概念短語的科技文獻知識管理系統(tǒng)的研究與設計[D];中南大學;2007年
7 藥成剛;基于鏈接結(jié)構(gòu)的中文網(wǎng)頁排序算法研究[D];哈爾濱工業(yè)大學;2006年
8 張戰(zhàn)勝;復雜網(wǎng)絡特征分析及其在電信客戶流失分析中的應用[D];北京郵電大學;2007年
9 夏斌;Web結(jié)構(gòu)挖掘中HITS算法的優(yōu)化與實現(xiàn)[D];河南大學;2007年
10 王鳳霞;研究生電子教務信息門戶研究與開發(fā)[D];西安理工大學;2004年
【相似文獻】
相關期刊論文 前10條
1 王奇,宋國新,邵志清;信息檢索中基于鏈接的網(wǎng)頁排序算法[J];華東理工大學學報;2000年05期
2 劉山,龔濤;基于Web結(jié)構(gòu)數(shù)據(jù)挖掘技術的數(shù)學方法[J];中國民航學院學報;2001年06期
3 葉允明,于水,馬范援,宋暉,張嶺;分布式Web Crawler的研究:結(jié)構(gòu)、算法和策略[J];電子學報;2002年S1期
4 劉山,劉峨;基于Web結(jié)構(gòu)數(shù)據(jù)挖掘技術的數(shù)學方法[J];計算機工程;2002年07期
5 張海濤,董洲;搜索引擎Google的檢索功能及PageRank技術分析[J];情報科學;2002年08期
6 閻放,張海濤,朱宏誼;GOOGLE搜索引擎PageRank技術的優(yōu)化[J];情報科學;2002年12期
7 宋聚平,王永成,滕偉,許歡慶;搜索引擎中Robot搜索算法的優(yōu)化[J];情報學報;2002年02期
8 曹軍;Google的PageRank技術剖析[J];情報雜志;2002年10期
9 李凱,赫楓齡,左萬利;PageRank-Pro——一種改進的網(wǎng)頁排序算法[J];吉林大學學報(理學版);2003年02期
10 李盛韜,趙章界,余智華;基于主題的Web信息采集系統(tǒng)的設計與實現(xiàn)[J];計算機工程;2003年17期
相關會議論文 前4條
1 陸勇;侯漢清;;基于詞典注釋的漢語同義詞自動識別[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2004年
2 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學生計算語言學研討會論文集[C];2006年
3 馮迪;李晉宏;曹原;;基于網(wǎng)頁的數(shù)據(jù)挖掘研究[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
4 劉強國;左志宏;董祥千;;基于WEB超鏈接分析算法的研究綜述[A];四川省通信學會2006年學術年會論文集(二)[C];2006年
相關重要報紙文章 前7條
1 北京 竇芳芳;給IE加上Google搜索工具條[N];電腦報;2001年
2 清華大學計算機系智能技術與系統(tǒng)國家重點實驗室 張敏 金奕江;實驗與實用系統(tǒng)[N];計算機世界;2003年
3 飄零雪;內(nèi)嵌瀏覽器插件,Google搜索直達[N];中國電腦教育報;2004年
4 本報記者 王翌;Google的左手[N];計算機世界;2004年
5 文/大海;微軟亞研院“微妙轉(zhuǎn)向”[N];計算機世界;2004年
6 本報記者 陳宜飚;Google上市:搜索引擎混戰(zhàn)從線上開始[N];21世紀經(jīng)濟報道;2004年
7 本報記者 馬文方;匠心在胸[N];中國計算機報;2008年
相關碩士學位論文 前10條
1 于愛軍;NERMS中基于Internet的搜索引擎研究與實現(xiàn)[D];吉林大學;2004年
2 吳東華;Web信息獲取技術研究[D];南京理工大學;2004年
3 戚華春;互聯(lián)網(wǎng)絡信息挖掘算法的研究[D];浙江工業(yè)大學;2005年
4 趙立剛;搜索引擎的研究與設計[D];吉林大學;2005年
5 張玲;智能信息采集搜索策略研究[D];湖南大學;2004年
6 李世明;專業(yè)搜索引擎中信息過濾的研究與實現(xiàn)[D];北京化工大學;2005年
7 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學;2005年
8 胡小睿;基于Web挖掘的搜索引擎技術研究[D];武漢大學;2005年
9 王小根;基于移動Agent的網(wǎng)格資源發(fā)現(xiàn)和調(diào)度的研究[D];江南大學;2005年
10 謝超;支持查詢剪裁的搜索引擎數(shù)據(jù)緩沖策略[D];浙江大學;2006年
,本文編號:2002396
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2002396.html