天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

自適應(yīng)最優(yōu)搜索算法的網(wǎng)絡(luò)蜘蛛的設(shè)計與實現(xiàn)

發(fā)布時間:2018-02-10 06:40

  本文關(guān)鍵詞: 個性化網(wǎng)絡(luò)蜘蛛 最優(yōu)搜索算法 在線增量自學(xué)習(xí) 網(wǎng)頁信噪比 網(wǎng)絡(luò)搜索引擎 鏈接 自適應(yīng) 搜索策略 相關(guān)頁面 局部最優(yōu) 出處:《計算機應(yīng)用》2007年11期  論文類型:期刊論文


【摘要】:主題搜索引擎NonHogSearch改進了采用最優(yōu)搜索算法的網(wǎng)絡(luò)蜘蛛的搜索過程,控制了搜索的貪婪程度;并引入網(wǎng)頁信噪比概念,從而判斷網(wǎng)頁是否屬于所要搜索的主題頁面;進一步,NonHogSearch在爬行過程中自動更新鏈接的權(quán)重,當(dāng)?shù)玫街黝}相關(guān)頁面時產(chǎn)生回報,將回報沿鏈接鏈路逆向反饋,更新鏈路上所有鏈接的Q值,這樣避免了網(wǎng)絡(luò)蜘蛛過早陷入Web搜索空間中局部最優(yōu)子空間的陷阱,并通過并行方式實現(xiàn)多條鏈路的同時搜索,改進了搜索引擎的性能。實驗證實了該算法在查全率與查準(zhǔn)率兩方面都有一定的優(yōu)越性。
[Abstract]:The subject search engine NonHogSearch improves the search process of the web spider using the optimal search algorithm, controls the greedy degree of the search, and introduces the concept of signal-to-noise ratio (SNR) of the web page to determine whether the web page belongs to the subject page to be searched. Furthermore, NonHogSearch automatically updates the link weight during crawling, which produces a return when the topic related page is obtained, and updates the Q value of all links along the link by reverse-feedback along the link. In this way, web spiders are not caught in the trap of local optimal subspace in Web search space prematurely, and multiple links can be searched simultaneously by parallel way. The performance of the search engine is improved and the experiment results show that the algorithm has some advantages in both recall and precision.
【作者單位】: 廣東技術(shù)師范學(xué)院電子與信息學(xué)院 廣東技術(shù)師范學(xué)院培訓(xùn)中心
【基金】:廣東省自然科學(xué)基金資助項目(06025383)
【分類號】:TP391.3

【參考文獻】

相關(guān)期刊論文 前2條

1 傅向華,馮博琴,馬兆豐,何明;可在線增量自學(xué)習(xí)的聚焦爬行方法[J];西安交通大學(xué)學(xué)報;2004年06期

2 路曉偉,蔣馥;基于模擬退火的復(fù)合嵌套分割算法[J];系統(tǒng)工程與電子技術(shù);2004年01期

【共引文獻】

相關(guān)期刊論文 前6條

1 劉金紅;陸余良;;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計算機應(yīng)用研究;2007年10期

2 鄭健珍;林坤輝;周昌樂;康愷;;基于本體語義的定題爬蟲[J];山東大學(xué)學(xué)報(理學(xué)版);2006年03期

3 王斌;謝慶生;劉丹;王曉;;Web教學(xué)資源主題檢索系統(tǒng)的設(shè)計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2006年01期

4 路曉偉;蔣馥;侯立文;;基于NP算法的CRM中客戶識別特征的選擇[J];系統(tǒng)工程學(xué)報;2005年06期

5 傅向華;馮博琴;;一種支持復(fù)雜查詢的有組織P2P搜索方法[J];小型微型計算機系統(tǒng);2006年03期

6 傅向華;馮博琴;;主題驅(qū)動的P2P分布式信息搜索機制研究[J];小型微型計算機系統(tǒng);2006年04期

相關(guān)碩士學(xué)位論文 前10條

1 代揚;模擬集成電路自動化設(shè)計方法的研究[D];湖南大學(xué);2004年

2 王斐;基于增量反饋和自適應(yīng)機制的主題爬蟲系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學(xué);2005年

3 姜杰;專業(yè)搜索引擎分布式Robot設(shè)計研究[D];南京師范大學(xué);2005年

4 劉強國;主題搜索引擎設(shè)計與研究[D];電子科技大學(xué);2007年

5 邱正國;主題蜘蛛的研究及實現(xiàn)[D];南京師范大學(xué);2007年

6 李文澤;個性化垂直搜索引擎研究[D];河南大學(xué);2007年

7 王慶濤;基于本體的Web信息采集研究[D];中南大學(xué);2007年

8 魏霞;面向網(wǎng)絡(luò)教育的學(xué)習(xí)評價依據(jù)采集系統(tǒng)的研究與實現(xiàn)[D];浙江工業(yè)大學(xué);2007年

9 謝德輝;面向刑偵網(wǎng)頁的信息抽取與主題爬蟲應(yīng)用研究[D];大連理工大學(xué);2007年

10 常慶;風(fēng)險主題搜索引擎相關(guān)技術(shù)的研究與應(yīng)用[D];西北大學(xué);2008年

【二級參考文獻】

相關(guān)期刊論文 前1條

1 宮秀軍,史忠植;基于Bayes潛在語義模型的半監(jiān)督Web挖掘[J];軟件學(xué)報;2002年08期

【相似文獻】

相關(guān)期刊論文 前5條

1 朱明,王俊普,蔡慶生;一種最優(yōu)特征集的選擇算法[J];計算機研究與發(fā)展;1998年09期

2 米糧川,胡文龍,彭海良;基于最優(yōu)搜索算法的自動航線生成[J];電光與控制;2000年03期

3 譚冠政,肖宏峰,王越超;具有不完全微分的最優(yōu)模糊PID控制器及其在智能人工腿中應(yīng)用的仿真研究(英文)[J];控制理論與應(yīng)用;2002年03期

4 彭鵬遠;基于最優(yōu)搜索算法的自動貨運線路生成[J];電腦與信息技術(shù);2002年03期

5 周穎,王雪松,王國玉,趙鋒,劉忠;相控陣?yán)走_最優(yōu)搜索隨機規(guī)劃研究[J];現(xiàn)代雷達;2005年04期

相關(guān)碩士學(xué)位論文 前1條

1 米糧川;基于最優(yōu)搜索算法的自動航線生成[D];中國科學(xué)院電子學(xué)研究所;2000年

,

本文編號:1499897

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1499897.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d6efa***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com