基于決策樹(shù)和鏈接相似的Deep Web查詢(xún)接口判定
[Abstract]:In view of the shortcomings of the existing Deep Web query interface judgment methods which can not effectively distinguish the search engine interface, a Deep Web query interface decision method based on decision tree and link similarity is proposed. The method uses the information gain rate to select the important attributes, and constructs a decision tree to pre-judge the interface form to identify the interface with obvious features. Then we use the method based on link similarity to determine the unrecognized interface accurately identify the real query interface and exclude the search engine interface. The results show that this method can effectively distinguish search engine interface and improve the accuracy and recall of classification.
【作者單位】: 江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院;
【基金】:江蘇省高校自然科學(xué)重大基金資助項(xiàng)目(08KJA520001) 國(guó)家自然科學(xué)基金資助項(xiàng)目(70971067)
【分類(lèi)號(hào)】:TP391.3;TP18
【共引文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 吳兵華;基于深度網(wǎng)絡(luò)的信息檢索模型研究[D];武漢理工大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計(jì)算機(jī)研究與發(fā)展;2002年10期
2 丁建立,陳增強(qiáng),袁著祉;遺傳算法與螞蟻算法的融合[J];計(jì)算機(jī)研究與發(fā)展;2003年09期
3 唐煥玲,孫建濤,陸玉昌;文本分類(lèi)中結(jié)合評(píng)估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期
4 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā);使用最大熵模型進(jìn)行中文文本分類(lèi)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期
5 陳文亮;朱靖波;朱慕華;姚天順;;基于領(lǐng)域詞典的文本特征表示[J];計(jì)算機(jī)研究與發(fā)展;2005年12期
6 姜遠(yuǎn);周志華;;基于詞頻分類(lèi)器集成的文本分類(lèi)方法[J];計(jì)算機(jī)研究與發(fā)展;2006年10期
7 尚文倩;黃厚寬;劉玉玲;林永民;瞿有利;董紅斌;;文本分類(lèi)中基于基尼指數(shù)的特征選擇算法研究[J];計(jì)算機(jī)研究與發(fā)展;2006年10期
8 王煜,王正歐;基于模糊決策樹(shù)的文本分類(lèi)規(guī)則抽取[J];計(jì)算機(jī)應(yīng)用;2005年07期
9 魯明羽,李凡,龐淑英,陸玉昌,周立柱;基于權(quán)值調(diào)整的文本分類(lèi)改進(jìn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期
10 蘇金樹(shù);張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類(lèi)技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期
相關(guān)博士學(xué)位論文 前1條
1 宋楓溪;自動(dòng)文本分類(lèi)若干基本問(wèn)題研究[D];南京理工大學(xué);2004年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李明;李秀蘭;;基于結(jié)果模式的Deep Web數(shù)據(jù)標(biāo)注方法[J];計(jì)算機(jī)應(yīng)用;2011年07期
2 楊舟;岳亮;卓林;趙朋朋;崔志明;;一種基于領(lǐng)域本體的Deep Web數(shù)據(jù)自動(dòng)標(biāo)注方法[J];蘇州大學(xué)學(xué)報(bào)(工科版);2011年04期
3 卓林;楊舟;岳亮;趙朋朋;崔志明;;Deep Web爬蟲(chóng)的一種增量式更新策略[J];蘇州大學(xué)學(xué)報(bào)(工科版);2011年04期
4 邵秀麗;孫杰;侯樂(lè)彩;;基于整體模式匹配的深度網(wǎng)集成系統(tǒng)的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年08期
5 顧晟;袁紅娟;;基于WEB技術(shù)的圖像索引體系的建構(gòu)[J];南京工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年01期
6 余肖生;司新霞;;基于聚類(lèi)分析的元搜索引擎模型[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2011年06期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會(huì)議論文 前10條
1 陶然;江錦華;吳羽;陳剛;;基于樹(shù)合并的Deep Web查詢(xún)接口集成[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
2 梁浩;左萬(wàn)利;任斐;赫楓齡;;基于啟發(fā)式信息的Deep Web查詢(xún)接口屬性抽取[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
3 王鐸;李文輝;公正;江琦;;深層網(wǎng)查詢(xún)接口的自動(dòng)集成[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
4 余偉;李石君;洪輝;田建偉;;基于覆蓋關(guān)系的Deep Web數(shù)據(jù)源排名[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
5 王英;左萬(wàn)利;王鑫;彭濤;;Deep Web查詢(xún)轉(zhuǎn)換研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
6 方巍;胡鵬昱;趙朋朋;崔志明;;基于語(yǔ)義的Deep Web數(shù)據(jù)源自動(dòng)發(fā)現(xiàn)技術(shù)[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
7 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
8 閆中敏;李慶忠;彭朝暉;董永權(quán);丁艷輝;張永新;徐秀星;;DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
9 趙朋朋;高嶺;崔志明;;基于查詢(xún)接口特征的Deep Web數(shù)據(jù)源自動(dòng)分類(lèi)[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(二)[C];2006年
10 李昭原;劉瑞;陳微;;開(kāi)放—分布—異構(gòu)多數(shù)據(jù)庫(kù)互連查詢(xún)接口的基本框架[A];數(shù)據(jù)庫(kù)研究與進(jìn)展95——第十三屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1995年
相關(guān)重要報(bào)紙文章 前1條
1 上海交通大學(xué)APEX數(shù)據(jù)和知識(shí)管理實(shí)驗(yàn)室 王昊奮邋俞勇;語(yǔ)義Web推動(dòng)下一代搜索[N];計(jì)算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前10條
1 王英;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2010年
2 梁浩;Deep Web信息集成架構(gòu)及相關(guān)問(wèn)題研究[D];吉林大學(xué);2010年
3 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年
4 田建偉;面向領(lǐng)域的高質(zhì)量Deep Web數(shù)據(jù)集成技術(shù)研究[D];武漢大學(xué);2010年
5 潘鵬;Deep Web查詢(xún)中的不確定性問(wèn)題研究[D];山東大學(xué);2010年
6 董永權(quán);Deep Web數(shù)據(jù)集成關(guān)鍵問(wèn)題研究[D];山東大學(xué);2010年
7 陳珂銳;基于本體演化的Deep Web數(shù)據(jù)抽取與注釋[D];吉林大學(xué);2011年
8 黃健斌;基于條件概率圖模型的Deep Web數(shù)據(jù)抽取與集成研究[D];西安電子科技大學(xué);2007年
9 趙朋朋;Deep Web信息集成若干關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2008年
10 寇月;Deep Web實(shí)體搜索的關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 陳雅冰;基于領(lǐng)域的Deep Web查詢(xún)接口抽取[D];華南理工大學(xué);2011年
2 賀迅;Deep Web查詢(xún)接口發(fā)現(xiàn)與特征提取技術(shù)研究[D];重慶大學(xué);2012年
3 楊柳;Deep Web查詢(xún)接口識(shí)別與抽取技術(shù)研究[D];西安電子科技大學(xué);2011年
4 朱會(huì)峰;Deep Web查詢(xún)接口模式抽取研究[D];吉林大學(xué);2011年
5 龔桂芬;基于查詢(xún)接口的Deep Web模式匹配方法研究[D];蘇州大學(xué);2011年
6 羅斐;基于本體的Deep Web數(shù)據(jù)源分類(lèi)和查詢(xún)接口模式抽取[D];南京航空航天大學(xué);2010年
7 杜鑫;Deep Web數(shù)據(jù)源發(fā)現(xiàn)與采樣研究[D];山東大學(xué);2011年
8 高川;Deep Web數(shù)據(jù)源的發(fā)現(xiàn)與聚類(lèi)研究[D];北京化工大學(xué);2010年
9 劉凱;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];長(zhǎng)春工業(yè)大學(xué);2012年
10 陳文;Deep Web入口識(shí)別和個(gè)性化搜索研究與設(shè)計(jì)[D];江蘇大學(xué);2010年
,本文編號(hào):2359917
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2359917.html