基于搜索引擎調(diào)用的主題搜索設(shè)計(jì)與實(shí)現(xiàn)
本文選題:主題搜索 + 搜索引擎。 參考:《計(jì)算機(jī)工程與設(shè)計(jì)》2008年21期
【摘要】:網(wǎng)絡(luò)搜索是目前從因特網(wǎng)上獲取信息的主要手段,而網(wǎng)絡(luò)蜘蛛又是大多數(shù)網(wǎng)絡(luò)搜索工具獲取網(wǎng)絡(luò)信息的主要方法,主題搜索策略是專業(yè)搜索引擎的核心技術(shù)。通過研究網(wǎng)絡(luò)蜘蛛的工作原理,分析了網(wǎng)絡(luò)蜘蛛的搜索策略和搜索優(yōu)化措施,設(shè)計(jì)出一種將限制搜索深度、多線程技術(shù)和正則表達(dá)式匹配方法結(jié)合一起的網(wǎng)絡(luò)蜘蛛,實(shí)驗(yàn)結(jié)果表明該方法能夠快速而準(zhǔn)確地搜索所需的相關(guān)主題信息。
[Abstract]:Web search is the main means to obtain information from the Internet at present, and web spider is the main method for most web search tools to obtain network information. Topic search strategy is the core technology of professional search engine. By studying the working principle of web spider, this paper analyzes the search strategy and search optimization measures of web spider, and designs a web spider which combines limited search depth, multithreading technique and regular expression matching method. The experimental results show that the proposed method can quickly and accurately search the relevant subject information.
【作者單位】: 軍械工程學(xué)院計(jì)算機(jī)工程系;軍械工程學(xué)院訓(xùn)練部;
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 唐雅媛;;基于搜索引擎的網(wǎng)絡(luò)蜘蛛實(shí)現(xiàn)原理的研究[J];湖南科技學(xué)院學(xué)報(bào);2006年11期
2 林海霞;原福永;陳金森;劉俊峰;;一種改進(jìn)的主題網(wǎng)絡(luò)蜘蛛搜索算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年10期
3 董瑞洪,張秋余,唐靜兵,張濤;搶先式多線程Spider在智能搜索引擎中的實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2005年18期
4 張穎超;段雪英;;個(gè)性化搜索引擎系統(tǒng)機(jī)制的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年13期
5 藕軍;任明侖;靳鵬;;基于網(wǎng)絡(luò)蜘蛛的搜索引擎自動(dòng)發(fā)現(xiàn)[J];現(xiàn)代電子技術(shù);2007年12期
相關(guān)碩士學(xué)位論文 前2條
1 陳杰;主題搜索引擎中網(wǎng)絡(luò)蜘蛛搜索策略研究[D];浙江大學(xué);2006年
2 薛建春;垂直搜索引擎中網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2007年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 岳劍文;;搜索引擎查詢推薦機(jī)制的研究[J];時(shí)代教育;2012年11期
2 趙洋;滕桂法;張玉新;何冬梅;;基于Internet的農(nóng)業(yè)信息垂直搜索引擎的設(shè)計(jì)[J];河北農(nóng)業(yè)大學(xué)學(xué)報(bào);2009年06期
3 熊馨;康國磊;胡光武;鞏建偉;;基于Web Service的分布式網(wǎng)站內(nèi)容監(jiān)控系統(tǒng)設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2009年18期
4 張麗敏;;垂直搜索引擎的主題爬蟲策略[J];電腦知識(shí)與技術(shù);2010年15期
5 李園偉;;面向高校主題搜索引擎的的爬行器設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2011年16期
6 吳建;;基于Lucene的校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年02期
7 陳志雄;朱向慶;;基于內(nèi)容評(píng)價(jià)與超鏈分析的主題爬蟲策略[J];廣西輕工業(yè);2011年03期
8 林潔;李丹寧;吳曉;;基于用戶的個(gè)性化綜合倒排索引[J];杭州師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
9 張林才;梁正友;;基于ProActive的分布式并行Web Spider設(shè)計(jì)[J];計(jì)算機(jī)工程;2008年19期
10 尹江;尹治本;黃洪;;網(wǎng)絡(luò)爬蟲效率瓶頸的分析與解決方案[J];計(jì)算機(jī)應(yīng)用;2008年05期
相關(guān)會(huì)議論文 前2條
1 馬焱;彭立;;個(gè)性化基礎(chǔ)教育搜索引擎用于個(gè)性化教學(xué)的研究[A];信息技術(shù)環(huán)境構(gòu)建與教學(xué)應(yīng)用[C];2009年
2 鄒永斌;陳興蜀;王文賢;;一個(gè)高性能Web資源收集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
相關(guān)碩士學(xué)位論文 前10條
1 王思麗;藏文網(wǎng)頁自動(dòng)發(fā)現(xiàn)與采集技術(shù)研究[D];西北民族大學(xué);2010年
2 陳志剛;網(wǎng)絡(luò)Flash資源爬行器的設(shè)計(jì)與實(shí)現(xiàn)[D];山東師范大學(xué);2011年
3 趙春輝;基于關(guān)聯(lián)規(guī)則挖掘的查詢擴(kuò)展[D];河南大學(xué);2011年
4 袁黎明;雙邊網(wǎng)絡(luò)視角下搜索引擎平臺(tái)的隔離機(jī)制演進(jìn)[D];北京交通大學(xué);2011年
5 林捷;主題網(wǎng)絡(luò)爬蟲的研究和實(shí)現(xiàn)[D];武漢理工大學(xué);2011年
6 李琚彪;質(zhì)檢輿情監(jiān)控系統(tǒng)中信息檢索的研究[D];北京郵電大學(xué);2011年
7 王旭;互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
8 李彥輝;基于用戶興趣的個(gè)性化搜索引擎研究[D];山西財(cái)經(jīng)大學(xué);2011年
9 連惠杰;基于主題的教育信息定向采集系統(tǒng)[D];南京理工大學(xué);2011年
10 趙思佳;基于規(guī)則引擎的個(gè)性化網(wǎng)頁爬蟲研究[D];中南大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 林亞平,李彥,童調(diào)生,尹鋒;漢語自動(dòng)分詞中的神經(jīng)網(wǎng)絡(luò)技術(shù)研究[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);1997年06期
2 宋擒豹,沈鈞毅;Web日志的高效多能挖掘算法[J];計(jì)算機(jī)研究與發(fā)展;2001年03期
3 孟衛(wèi)一,吳宗寰;集成搜索引擎的文本數(shù)據(jù)庫選擇[J];計(jì)算機(jī)研究與發(fā)展;2001年04期
4 張敏,高劍峰,馬少平;基于鏈接描述文本及其上下文的Web信息檢索[J];計(jì)算機(jī)研究與發(fā)展;2004年01期
5 赫楓齡,左萬利;用有向圖法解決網(wǎng)頁爬行中循環(huán)鏈接問題[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2004年03期
6 宋暉,張嶺,葉允明,馬范援;基于標(biāo)記樹對(duì)象抽取技術(shù)的Hidden Web獲取研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年23期
7 左雄輝,糜麒;個(gè)性化搜索引擎研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年17期
8 羅三定,黃勇;一個(gè)應(yīng)用模糊方法的智能搜索引擎的構(gòu)建[J];計(jì)算機(jī)工程;2000年12期
9 康平波,田永鴻,黃鐵軍;智能化網(wǎng)頁資源收集工具的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2004年04期
10 殷建平;漢語自動(dòng)分詞方法[J];計(jì)算機(jī)工程與科學(xué);1998年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳財(cái)森;王韜;鄭偉;陳建泗;;基于搜索引擎調(diào)用的主題搜索設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年21期
2 李國鋒;李春偉;;網(wǎng)絡(luò)搜索引擎技術(shù)探析[J];廊坊師范學(xué)院學(xué)報(bào);2005年04期
3 云健;王春霞;;搜索引擎技術(shù)綜述[J];河西學(xué)院學(xué)報(bào);2008年02期
4 宋春陽;金可音;;Web搜索引擎技術(shù)綜述[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年05期
5 鄭志材;張晶;;基于JAVA的網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)與實(shí)現(xiàn)[J];硅谷;2009年14期
6 葛宇;梁靜;陳曉敏;;搜索引擎系統(tǒng)中熱點(diǎn)問題的探討[J];成都電子機(jī)械高等專科學(xué)校學(xué)報(bào);2009年04期
7 李勇;韓亮;;主題搜索引擎中網(wǎng)絡(luò)爬蟲的搜索策略研究[J];計(jì)算機(jī)工程與科學(xué);2008年03期
8 雷麗秀;;互聯(lián)網(wǎng)搜索引擎技術(shù)及展望[J];科技信息(學(xué)術(shù)研究);2008年20期
9 武曉娟;;基于網(wǎng)站的搜索引擎研究[J];大連海事大學(xué)學(xué)報(bào);2008年S1期
10 鄭泳;;基于廣度優(yōu)先搜索的網(wǎng)絡(luò)蜘蛛設(shè)計(jì)[J];軟件導(dǎo)刊;2010年07期
相關(guān)會(huì)議論文 前10條
1 李賀華;付鶴崗;;多Agent Web信息檢索應(yīng)用研究[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
2 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
5 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
6 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
8 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
9 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
10 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
10 姜蕊;問天下誰識(shí)搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
2 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
3 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
5 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 王德吉;復(fù)雜環(huán)境下自適應(yīng)智能決策支持系統(tǒng)研究[D];中國科學(xué)技術(shù)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 陳杰;主題搜索引擎中網(wǎng)絡(luò)蜘蛛搜索策略研究[D];浙江大學(xué);2006年
2 薛建春;垂直搜索引擎中網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2007年
3 何世林;基于Java技術(shù)的搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2006年
4 任嚴(yán);基于網(wǎng)絡(luò)視頻業(yè)務(wù)的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2008年
5 胡曉翠;站點(diǎn)搜索引擎的研究與實(shí)現(xiàn)[D];武漢科技大學(xué);2009年
6 張維維;搜索引擎的研究與實(shí)現(xiàn)[D];長春理工大學(xué);2008年
7 葉昭暉;網(wǎng)絡(luò)信息雷達(dá)系統(tǒng)的研究與設(shè)計(jì)[D];國防科學(xué)技術(shù)大學(xué);2005年
8 許彥彬;基于Java技術(shù)的生物資源專業(yè)搜索引擎的研究與開發(fā)[D];昆明理工大學(xué);2004年
9 郭謝;基于Web Community識(shí)別的專業(yè)搜索引擎研究[D];浙江大學(xué);2006年
10 沈堅(jiān);一種專題式搜索引擎Spider的設(shè)計(jì)與實(shí)現(xiàn)[D];北京化工大學(xué);2008年
,本文編號(hào):1869370
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1869370.html