基于URL聚類的快速無障礙檢測抽樣方法(英文)
本文關(guān)鍵詞:基于URL聚類的快速無障礙檢測抽樣方法(英文)
更多相關(guān)文章: 網(wǎng)頁抽樣 URL聚類 無障礙檢測
【摘要】:目的:大多數(shù)殘疾人士上網(wǎng)都會遇到各種障礙。為減少上網(wǎng)障礙,對網(wǎng)站進行無障礙檢測評估是十分必要的。鑒于大部分網(wǎng)站具有海量網(wǎng)頁且某些網(wǎng)頁需涉及人工檢測,通常利用抽樣算法對網(wǎng)站進行無障礙檢測評估。已有的分層抽樣算法I/O開銷和計算代價大。為解決這一問題,本文提出一種基于URL聚類的抽樣算法。僅利用URL信息進行聚類,然后抽樣,最終實現(xiàn)快速的無障礙檢測和評估。創(chuàng)新點:大部分網(wǎng)站的網(wǎng)頁內(nèi)容和URL信息都是由有限數(shù)量的模板生成的。因此這些網(wǎng)站的無障礙問題都可以追溯到模板。鑒于同一模板生成的網(wǎng)頁具有相似結(jié)構(gòu)和URL模式,可基于URL相似性對網(wǎng)頁進行聚類,將同一模板的URL聚到一類中。本文所提抽樣算法僅利用網(wǎng)頁URL模式信息,無需存儲全部網(wǎng)頁內(nèi)容,從而減少I/O開銷和計算代價,實現(xiàn)快速的無障礙檢測和評估。方法:利用模板生成的網(wǎng)頁具有相似URL模式,將URL進行聚類以實現(xiàn)同一模板生成的網(wǎng)頁聚在一類中。具體過程:首先,解析爬取到的URL以獲取候選URL分詞和模板URL分詞;然后利用最小長度描述原則進行URL聚類(算法1);最后在每類中按照抽樣比例進行抽樣。結(jié)論:不同于現(xiàn)有的分層抽樣算法,本文提出的抽樣算法僅利用URL模式信息將網(wǎng)頁進行聚類,可減少大量I/O開銷和計算代價。
【作者單位】: College
【關(guān)鍵詞】: 網(wǎng)頁抽樣 URL聚類 無障礙檢測
【基金】:Project supported by the National Natural Science Foundation of China(Nos.61173185 and 61173186) the Natural Science Foundation of Zhejiang Province,China(No.LZ13F020001)
【分類號】:TP393.092
【正文快照】: 1 IntroductionWebsite accessibility aims to help people withdisabilities to perceive,understand,navigate,andinteract with the web pages(Abou-Zahra,2008).Theimportance of accessibility is highlighted in theguidelines published by W3C:WCAG 1.0 in 1991and W
【共引文獻】
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 張志超;基于Hadoop的雙語語料采集系統(tǒng)[D];哈爾濱工業(yè)大學;2013年
2 羅鵬;小概率抽樣網(wǎng)絡(luò)穩(wěn)定性研究[D];哈爾濱工業(yè)大學;2014年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁明躍,彭嘉雄,萬發(fā)貫;多級假設(shè)檢驗的兩級圖象匹配方法[J];電子學報;1989年02期
2 鄭小平;丁信偉;馮恩民;唐碧玉;;一種基于基因置換技術(shù)的優(yōu)化算法及其收斂性[J];廣西大學學報(自然科學版);2011年06期
3 張衛(wèi)華;范植華;;基于代價的主動式防御分析[J];通信學報;2007年05期
4 鐘武;胡守仁;;OQL邏輯優(yōu)化準則[J];計算機科學;1998年02期
5 鄧宏平;李斌;姚鵬;張文聰;莊鎮(zhèn)泉;;一種魯棒的人眼光斑定位算法[J];中國科學技術(shù)大學學報;2011年04期
6 呂洪;王瓊;;CG動畫探析[J];現(xiàn)代裝飾(理論);2013年04期
7 郭慶;;實現(xiàn)實體化視圖重計算代價最小化的研究[J];中山大學學報論叢;2007年08期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 賀文武;高效預(yù)測的核學習方法[D];中南大學;2008年
,本文編號:679530
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/679530.html