Web信息檢索中主題精選算法的研究與改進(jìn)
[Abstract]:Search engine is the most important Web information retrieval tool, but its effect is not satisfactory. The link analysis iteration of the topic selection algorithm based on Web link structure often converges to the closely interlaced region (TKC), which is not related to the query subject in the link graph which leads to the topic offset. The author's analysis of the classical theme selection algorithm (HITS) shows that the algorithm also provides unequal influence weights for different Web sites and fails to meet the multi-granularity information requirements of users. In this paper, based on the analysis of the topic selection algorithm, an improved algorithm g-HITScis is proposed, which is proved to be reasonable and effective.
【作者單位】: 河海大學(xué)計(jì)算機(jī)及信息工程學(xué)院 東南大學(xué)計(jì)算機(jī)科學(xué)與工程系 東南大學(xué)計(jì)算機(jī)科學(xué)與工程系
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào):60173036) 江蘇省“十五”高科技項(xiàng)目(編號(hào):BG2001013)資助
【分類號(hào)】:TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張彬;蔣濤;徐雨明;;Web Spam技術(shù)研究綜述(英文)[J];衡陽(yáng)師范學(xué)院學(xué)報(bào);2008年06期
2 何曉陽(yáng),吳強(qiáng),吳治蓉;HITS算法與PageRank算法比較分析[J];情報(bào)雜志;2004年02期
3 鄭煜;錢榕;;一個(gè)基于鏈接分析的相關(guān)度排序算法及其在專題搜索引擎中應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2007年07期
4 蔣衛(wèi)星;金甌;張彬;;Web搜索算法研究綜述[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年04期
5 陳學(xué)進(jìn);;網(wǎng)絡(luò)結(jié)構(gòu)挖掘算法研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年05期
6 許卓明,曹瀟,韓亞洪,董逸生;主題精選算法中Web鄰域圖的構(gòu)造[J];計(jì)算機(jī)應(yīng)用研究;2004年01期
7 陳定權(quán);Web信息檢索技術(shù)最新進(jìn)展[J];現(xiàn)代圖書情報(bào)技術(shù);2002年02期
8 陳太洋;;我國(guó)大學(xué)圖書館網(wǎng)站鏈接的實(shí)證分析——以中國(guó)“211工程”高校為例[J];圖書館雜志;2007年03期
9 周濤;陳向東;;基于鏈接分析的網(wǎng)站評(píng)價(jià)[J];廣西教育學(xué)院學(xué)報(bào);2008年04期
10 劉彥祖;;Web of Science數(shù)據(jù)庫(kù)中網(wǎng)絡(luò)鏈接分析研究論文的定量分析[J];情報(bào)探索;2010年02期
相關(guān)會(huì)議論文 前10條
1 劉兵;胡學(xué)鋼;;基于多鏈接分析的主題爬蟲設(shè)計(jì)實(shí)現(xiàn)[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
2 宋丹;林鴻飛;楊志豪;;一種利用鏈接分析的Web話題跟蹤方法[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
3 鄒綱;孟遙;于浩;西野文人;;一種基于網(wǎng)站主頁(yè)信息建立公司名稱知識(shí)庫(kù)的方法[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
4 劉悅;張剛;王斌;許洪波;;查詢相關(guān)鏈接分析算法優(yōu)化策略研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
5 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁(yè)排序研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
6 吳煒;梁昆;李瑞軒;辜希武;盧正鼎;;一種基于主題相關(guān)度的網(wǎng)頁(yè)排序算法[A];2008年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年
7 馮迪;李晉宏;曹原;;基于網(wǎng)頁(yè)的數(shù)據(jù)挖掘研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
8 楊宇航;趙鐵軍;鄭德權(quán);于浩;;基于鏈接分析的重要Blog信息源發(fā)現(xiàn)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
9 劉強(qiáng)國(guó);左志宏;董祥千;;基于WEB超鏈接分析算法的研究綜述[A];四川省通信學(xué)會(huì)2006年學(xué)術(shù)年會(huì)論文集(二)[C];2006年
10 葛先軍;李志勇;宋巍巍;;基于網(wǎng)頁(yè)惡意腳本鏈接分析的木馬檢測(cè)技術(shù)[A];第五屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2008年
相關(guān)重要報(bào)紙文章 前10條
1 上海證券研究發(fā)展中心 張瑾;嘉實(shí)主題精選 股票調(diào)整積極[N];中國(guó)證券報(bào);2007年
2 本報(bào)記者 馬薪婷;明年一季度布局“先手”:跨年度投資主題[N];證券日?qǐng)?bào);2010年
3 本報(bào)記者 賈寶麗;搭乘國(guó)航 嘉實(shí)精選“喜從天降”[N];上海證券報(bào);2006年
4 任瞳;嘉實(shí)主題精選VS南方穩(wěn)健成長(zhǎng)2號(hào)[N];中國(guó)證券報(bào);2007年
5 旺贏;利用主題投資 分享A股盛宴[N];市場(chǎng)報(bào);2006年
6 劉偉;嘉實(shí)主題精選基金獲批發(fā)行[N];深圳商報(bào);2006年
7 王影;嘉實(shí)主題精選基金獲批發(fā)行[N];中國(guó)經(jīng)濟(jì)導(dǎo)報(bào);2006年
8 證券時(shí)報(bào)記者 徐幸福;市場(chǎng)風(fēng)向漸變 二線基金發(fā)威[N];證券時(shí)報(bào);2006年
9 吳汀煌;利用主題投資分享A股“盛宴”[N];廈門日?qǐng)?bào);2006年
10 吳慧邋謝潞錦;竇玉明卸任嘉實(shí)主題精選基金經(jīng)理引猜想[N];第一財(cái)經(jīng)日?qǐng)?bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 毛照f ;面向客戶價(jià)值和精/敏戰(zhàn)略的制造供應(yīng)網(wǎng)絡(luò)績(jī)效評(píng)價(jià)研究[D];天津大學(xué);2006年
2 段宇鋒;網(wǎng)絡(luò)鏈接分析與網(wǎng)站評(píng)價(jià)研究[D];武漢大學(xué);2004年
3 褚武英;三種石首魚緊密連鎖的α-和β-珠蛋白基因的克隆及其順式調(diào)控元件的分析[D];浙江大學(xué);2006年
4 劉洪波;INTERNET中的信息網(wǎng)絡(luò)提取分析及Rank相關(guān)研究[D];清華大學(xué);2007年
5 江開忠;上下文感知的Web搜索關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2008年
6 田俊華;基于本體知識(shí)庫(kù)的教學(xué)資源自動(dòng)采集技術(shù)研究[D];南京師范大學(xué);2011年
7 張長(zhǎng)利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
8 吳剛;RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D];清華大學(xué);2008年
9 徐秀娟;商務(wù)智能中的利潤(rùn)挖掘研究[D];吉林大學(xué);2008年
10 張乃洲;實(shí)體搜索爬蟲和信息抽取研究[D];武漢大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 韓亞洪;結(jié)合內(nèi)容與鏈接分析搜索特定主題的權(quán)威Web信息源[D];河海大學(xué);2003年
2 夏斌;Web結(jié)構(gòu)挖掘中HITS算法的優(yōu)化與實(shí)現(xiàn)[D];河南大學(xué);2007年
3 郭坤銀;基于頁(yè)面分塊和鏈接分析的Web圖片檢索研究[D];重慶大學(xué);2009年
4 高文梁;改進(jìn)的基于歷史信息分析的網(wǎng)頁(yè)排序算法[D];大連理工大學(xué);2009年
5 陳翰生;基于改進(jìn)HITS算法及位置信息的關(guān)鍵網(wǎng)頁(yè)信息抽取方法[D];復(fù)旦大學(xué);2009年
6 楊鑫;基于鏈接分析的電信呼叫數(shù)據(jù)研究與應(yīng)用[D];北京郵電大學(xué);2009年
7 朱自強(qiáng);網(wǎng)絡(luò)信息計(jì)量學(xué)理論與方法:大學(xué)網(wǎng)站網(wǎng)絡(luò)流量及頁(yè)面鏈接分析研究[D];南京理工大學(xué);2005年
8 付克志;基于Web的文本信息檢索算法的研究[D];大連理工大學(xué);2006年
9 岳增慧;高校圖書館網(wǎng)絡(luò)空間鏈接特征研究[D];曲阜師范大學(xué);2011年
10 沈勇明;復(fù)雜網(wǎng)絡(luò)中的鏈接預(yù)測(cè)[D];華南理工大學(xué);2011年
,本文編號(hào):2234668
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2234668.html