面向動態(tài)Web應用的數據采集與抽取技術研究與實現(xiàn)
【文章頁數】:77 頁
【學位級別】:碩士
【部分圖文】:
圖1-1MVC應用構件模型及運行框架[12]??
?北京郵電大學工學碩士學位論文???(2)視圖(View)定義用戶界面中數據展示及布局信息,并且實現(xiàn)了將界??面上的用戶操作轉化為構件控制器中功能。??(3)控制器(Controller)實現(xiàn)構件的主體業(yè)務邏輯,并對應用如何控制模??型和視圖元素進行定義,在此基礎之上,開發(fā)人員可....
圖2-4CSS文件中偽類的應用
圖2-6頁面彈窗問題展示??從以上幾個方面可以看出目前動態(tài)爬蟲的研宄工作中仍然存在諸多困難與??挑戰(zhàn),本文的Web數據采集研究將針對爬取動態(tài)網站提出一種新的方法,并對己??有的工作和存在的問題進行改良和優(yōu)化,實現(xiàn)基于事件模擬的Web頁面采集框架,??幫助使用者更加高效和穩(wěn)定地完成....
圖2一SJavasctipt中對CSS偽類的引用
圖2-6頁面彈窗問題展示??從以上幾個方面可以看出目前動態(tài)爬蟲的研宄工作中仍然存在諸多困難與??挑戰(zhàn),本文的Web數據采集研究將針對爬取動態(tài)網站提出一種新的方法,并對己??有的工作和存在的問題進行改良和優(yōu)化,實現(xiàn)基于事件模擬的Web頁面采集框架,??幫助使用者更加高效和穩(wěn)定地完成....
圖2-7抽取規(guī)則生成流程圖[31】??該算法在構建PAT樹前需要對網頁中所有標簽和文本進行前綴編碼,由于網??
(2)?IEPAD[31]基于模式發(fā)現(xiàn)的方法從半結構化文檔中抽取結構化數據。算??法利用類似后綴樹的數據結構PAT?(Practical?Algorithm?for?Retrieve?Information??Coded?in?Alphanumeric?Tree)來發(fā)現(xiàn)同構的數據....
本文編號:3944506
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3944506.html