一種使用文檔對象模型的AJAX爬行方案
[Abstract]:Many WEB applications use AJAX technology to enhance the user experience. But some of the features of AJAX make it very difficult for traditional search engines to implement crawling operations. Google's AJAX crawl, for example, requires the site to change its architecture and add additional code, so it is supported only by Google. In order to solve this problem, a AJAX crawling scheme based on document object model and breadth-first crawling algorithm is proposed. It can build the state transition diagram of AJAX WEB application by tracking the changes of DOM tree caused by AJAX events. In turn, the static mirror site of the original AJAX WEB application is generated. Experimental results show that the AJAX crawling scheme can indeed crawl AJAX applications.
【作者單位】: 徐州工業(yè)職業(yè)技術學院;徐州市工業(yè)信息網絡工程技術研究中心;
【基金】:2013年徐州市科技發(fā)展基金計劃(XF13C035) 2012年徐州工業(yè)職業(yè)技術學院科研課題(XGY201213)
【分類號】:TP312.2
【參考文獻】
相關期刊論文 前1條
1 郭浩;陸余良;劉金紅;;一種基于狀態(tài)轉換圖的Ajax爬行算法[J];計算機應用研究;2009年11期
【共引文獻】
相關期刊論文 前4條
1 陸亮;李東;;支持AJAX的網絡爬蟲設計與實現(xiàn)[J];智能計算機與應用;2013年06期
2 楊俊峰;黎建輝;楊風雷;;深層網站Ajax頁面數(shù)據采集研究綜述[J];計算機應用研究;2013年06期
3 陳莉莉;張麗;劉正龍;;搜索引擎中基于狀態(tài)的Ajax動態(tài)網頁提取研究[J];計算機應用與軟件;2013年07期
4 夏天;;Ajax站點數(shù)據采集研究綜述[J];現(xiàn)代圖書情報技術;2010年03期
相關碩士學位論文 前7條
1 高暉;面向Web2.0社區(qū)的爬蟲關鍵技術研究[D];浙江大學;2011年
2 管翠花;支持Ajax技術的Deep Web網絡爬蟲模型研究[D];大連海事大學;2011年
3 劉燁輝;基于知識的應用生命周期管理研究[D];中南大學;2011年
4 陳飛;實時垂直搜索引擎的爬蟲技術研究[D];大連理工大學;2011年
5 許龍龍;基于Ajax技術的J2EE應用框架的研究與實現(xiàn)[D];西北大學;2010年
6 劉凡凡;支持AJAX的定址網絡爬蟲系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2013年
7 鐘少君;面向Ajax的搜索引擎技術研究[D];浙江大學;2012年
【相似文獻】
相關期刊論文 前10條
1 白勇;;基于文檔對象模型和遠程腳本技術的動態(tài)目錄樹設計[J];重慶電力高等?茖W校學報;2003年01期
2 周宇;吳濤;;用C++語言實現(xiàn)XML文件解析的一種方案[J];光通信研究;2008年04期
3 侯錕;劉斌;;Web頁面信息抽取技術的研究[J];荊楚理工學院學報;2009年11期
4 逯鵬;XML文檔解析技術及其應用[J];鄭州大學學報(工學版);2002年04期
5 李世斌,謝慶生;應用集成中BOM及其管理的研究[J];計算機與現(xiàn)代化;2003年07期
6 侯錕;羅海龍;;Web頁面表格信息的自主抽取[J];科技廣場;2006年04期
7 和萬禮;陳應東;崔鐵軍;姚慧敏;;基于SVG的網絡地圖交互研究[J];海洋測繪;2006年05期
8 李偉;;基于XML+DOM4J的數(shù)據庫集成技術研究[J];電腦知識與技術(學術交流);2007年05期
9 郭景錄;朱向東;;XML技術在控制系統(tǒng)圖形組態(tài)數(shù)據存儲和訪問中的應用[J];微計算機信息;2010年28期
10 朱敏;賈長云;;FrontPage網頁制作自動閱卷系統(tǒng)的研究與實現(xiàn)[J];計算機時代;2010年11期
相關會議論文 前3條
1 呂建華;王國仁;于戈;;XML數(shù)據的存儲、索引和查詢優(yōu)化技術及其性能評價[A];第十九屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2002年
2 商超;李建中;何震瀛;;信息集成系統(tǒng)中HTML2XML的研究[A];第二十屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2003年
3 朱利君;張友華;李紹穩(wěn);辜麗川;程波波;;基于茶蟲害本體的智能檢索系統(tǒng)設計[A];紀念中國農業(yè)工程學會成立30周年暨中國農業(yè)工程學會2009年學術年會(CSAE 2009)論文集[C];2009年
相關重要報紙文章 前7條
1 ;W3C大力推進XML測試[N];計算機世界;2002年
2 本報記者 周源;IE 9釋放網絡之美[N];網絡世界;2010年
3 王如;數(shù)據庫與XML[N];網絡世界;2002年
4 秦林;《XML完全探索》[N];中華讀書報;2001年
5 錢小聰;移動電子商務系統(tǒng)架構[N];人民郵電;2002年
6 ;無線互聯(lián)發(fā)展的動力是什么[N];人民郵電;2001年
7 方正技術研究院 XML中國論壇網(www.xml.net.cn) 李超;應用程序接口DOM & SAX[N];網絡世界;2001年
相關博士學位論文 前1條
1 王曄;垂直搜索引擎若干問題研究[D];復旦大學;2011年
相關碩士學位論文 前10條
1 溫琪;基于XML的MIS開發(fā)系統(tǒng)前端應用的研究[D];昆明理工大學;2002年
2 張煒;基于ODM的本體建模方法研究[D];吉林大學;2006年
3 苗穎;Web頁面信息自主抽去技術的研究[D];吉林大學;2006年
4 陳卓;DOM2分析及其在嵌入式系統(tǒng)上的實現(xiàn)[D];電子科技大學;2007年
5 劉磊;基于PC的數(shù)字電視軟件的設計與實現(xiàn)[D];華中科技大學;2007年
6 劉玲;一種通用Web信息抽取系統(tǒng)的研究與實現(xiàn)[D];西南石油大學;2007年
7 楊春濤;基于SMIL與流媒體技術的多媒體網絡教學系統(tǒng)的設計與實現(xiàn)[D];哈爾濱工程大學;2008年
8 劉靖僑;XML文檔對象模型持久化在OSCAR中的實現(xiàn)及查詢轉換[D];浙江大學;2002年
9 唐明;面向移動計算環(huán)境的可擴展標記語言轉換技術研究[D];國防科學技術大學;2004年
10 曲貴川;基于.NET電子商務系統(tǒng)的代碼生成器[D];沈陽理工大學;2009年
,本文編號:2198934
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2198934.html