天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種使用文檔對象模型的AJAX爬行方案

發(fā)布時間:2018-08-23 11:23
【摘要】:許多WEB應用程序采用AJAX技術來增強用戶體驗。但是AJAX的一些特性使它在傳統(tǒng)搜索引擎實施抓取操作時非常困難。如谷歌的AJAX爬行方案需要網站改變架構并添加額外的代碼,因此只被谷歌支持。針對這種情況,提出了一種基于文檔對象模型和廣度優(yōu)先爬行算法的AJAX爬行方案,它可以通過跟蹤由AJAX事件引發(fā)的DOM樹的變化,來建立AJAX WEB應用程序的狀態(tài)轉換圖,進而生成原始AJAX WEB應用程序的靜態(tài)鏡像站點。實驗證明,該AJAX爬行方案確實可以爬行AJAX應用程序。
[Abstract]:Many WEB applications use AJAX technology to enhance the user experience. But some of the features of AJAX make it very difficult for traditional search engines to implement crawling operations. Google's AJAX crawl, for example, requires the site to change its architecture and add additional code, so it is supported only by Google. In order to solve this problem, a AJAX crawling scheme based on document object model and breadth-first crawling algorithm is proposed. It can build the state transition diagram of AJAX WEB application by tracking the changes of DOM tree caused by AJAX events. In turn, the static mirror site of the original AJAX WEB application is generated. Experimental results show that the AJAX crawling scheme can indeed crawl AJAX applications.
【作者單位】: 徐州工業(yè)職業(yè)技術學院;徐州市工業(yè)信息網絡工程技術研究中心;
【基金】:2013年徐州市科技發(fā)展基金計劃(XF13C035) 2012年徐州工業(yè)職業(yè)技術學院科研課題(XGY201213)
【分類號】:TP312.2

【參考文獻】

相關期刊論文 前1條

1 郭浩;陸余良;劉金紅;;一種基于狀態(tài)轉換圖的Ajax爬行算法[J];計算機應用研究;2009年11期

【共引文獻】

相關期刊論文 前4條

1 陸亮;李東;;支持AJAX的網絡爬蟲設計與實現(xiàn)[J];智能計算機與應用;2013年06期

2 楊俊峰;黎建輝;楊風雷;;深層網站Ajax頁面數(shù)據采集研究綜述[J];計算機應用研究;2013年06期

3 陳莉莉;張麗;劉正龍;;搜索引擎中基于狀態(tài)的Ajax動態(tài)網頁提取研究[J];計算機應用與軟件;2013年07期

4 夏天;;Ajax站點數(shù)據采集研究綜述[J];現(xiàn)代圖書情報技術;2010年03期

相關碩士學位論文 前7條

1 高暉;面向Web2.0社區(qū)的爬蟲關鍵技術研究[D];浙江大學;2011年

2 管翠花;支持Ajax技術的Deep Web網絡爬蟲模型研究[D];大連海事大學;2011年

3 劉燁輝;基于知識的應用生命周期管理研究[D];中南大學;2011年

4 陳飛;實時垂直搜索引擎的爬蟲技術研究[D];大連理工大學;2011年

5 許龍龍;基于Ajax技術的J2EE應用框架的研究與實現(xiàn)[D];西北大學;2010年

6 劉凡凡;支持AJAX的定址網絡爬蟲系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2013年

7 鐘少君;面向Ajax的搜索引擎技術研究[D];浙江大學;2012年

【相似文獻】

相關期刊論文 前10條

1 白勇;;基于文檔對象模型和遠程腳本技術的動態(tài)目錄樹設計[J];重慶電力高等?茖W校學報;2003年01期

2 周宇;吳濤;;用C++語言實現(xiàn)XML文件解析的一種方案[J];光通信研究;2008年04期

3 侯錕;劉斌;;Web頁面信息抽取技術的研究[J];荊楚理工學院學報;2009年11期

4 逯鵬;XML文檔解析技術及其應用[J];鄭州大學學報(工學版);2002年04期

5 李世斌,謝慶生;應用集成中BOM及其管理的研究[J];計算機與現(xiàn)代化;2003年07期

6 侯錕;羅海龍;;Web頁面表格信息的自主抽取[J];科技廣場;2006年04期

7 和萬禮;陳應東;崔鐵軍;姚慧敏;;基于SVG的網絡地圖交互研究[J];海洋測繪;2006年05期

8 李偉;;基于XML+DOM4J的數(shù)據庫集成技術研究[J];電腦知識與技術(學術交流);2007年05期

9 郭景錄;朱向東;;XML技術在控制系統(tǒng)圖形組態(tài)數(shù)據存儲和訪問中的應用[J];微計算機信息;2010年28期

10 朱敏;賈長云;;FrontPage網頁制作自動閱卷系統(tǒng)的研究與實現(xiàn)[J];計算機時代;2010年11期

相關會議論文 前3條

1 呂建華;王國仁;于戈;;XML數(shù)據的存儲、索引和查詢優(yōu)化技術及其性能評價[A];第十九屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2002年

2 商超;李建中;何震瀛;;信息集成系統(tǒng)中HTML2XML的研究[A];第二十屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2003年

3 朱利君;張友華;李紹穩(wěn);辜麗川;程波波;;基于茶蟲害本體的智能檢索系統(tǒng)設計[A];紀念中國農業(yè)工程學會成立30周年暨中國農業(yè)工程學會2009年學術年會(CSAE 2009)論文集[C];2009年

相關重要報紙文章 前7條

1 ;W3C大力推進XML測試[N];計算機世界;2002年

2 本報記者 周源;IE 9釋放網絡之美[N];網絡世界;2010年

3 王如;數(shù)據庫與XML[N];網絡世界;2002年

4 秦林;《XML完全探索》[N];中華讀書報;2001年

5 錢小聰;移動電子商務系統(tǒng)架構[N];人民郵電;2002年

6 ;無線互聯(lián)發(fā)展的動力是什么[N];人民郵電;2001年

7 方正技術研究院 XML中國論壇網(www.xml.net.cn) 李超;應用程序接口DOM & SAX[N];網絡世界;2001年

相關博士學位論文 前1條

1 王曄;垂直搜索引擎若干問題研究[D];復旦大學;2011年

相關碩士學位論文 前10條

1 溫琪;基于XML的MIS開發(fā)系統(tǒng)前端應用的研究[D];昆明理工大學;2002年

2 張煒;基于ODM的本體建模方法研究[D];吉林大學;2006年

3 苗穎;Web頁面信息自主抽去技術的研究[D];吉林大學;2006年

4 陳卓;DOM2分析及其在嵌入式系統(tǒng)上的實現(xiàn)[D];電子科技大學;2007年

5 劉磊;基于PC的數(shù)字電視軟件的設計與實現(xiàn)[D];華中科技大學;2007年

6 劉玲;一種通用Web信息抽取系統(tǒng)的研究與實現(xiàn)[D];西南石油大學;2007年

7 楊春濤;基于SMIL與流媒體技術的多媒體網絡教學系統(tǒng)的設計與實現(xiàn)[D];哈爾濱工程大學;2008年

8 劉靖僑;XML文檔對象模型持久化在OSCAR中的實現(xiàn)及查詢轉換[D];浙江大學;2002年

9 唐明;面向移動計算環(huán)境的可擴展標記語言轉換技術研究[D];國防科學技術大學;2004年

10 曲貴川;基于.NET電子商務系統(tǒng)的代碼生成器[D];沈陽理工大學;2009年

,

本文編號:2198934

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2198934.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶b9959***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com