基于N層向量空間模型的信息檢索算法
本文選題:搜索引擎 切入點(diǎn):向量空間模型 出處:《計(jì)算機(jī)研究與發(fā)展》2002年10期
【摘要】:N層向量空間模型是在傳統(tǒng)向量空間模型的基礎(chǔ)上提出的一種新的信息檢索算法模型 ,這種模型將一篇文檔從邏輯上劃分為 N個(gè)相對獨(dú)立的文本段 ,然后按照文本段的內(nèi)容建立文本特征向量以及文本權(quán)值向量 .在此模型的基礎(chǔ)上 ,更為精確地定義了特征值向量和相似度的計(jì)算方法 ,使之能比較好地適應(yīng)文檔集合的動(dòng)態(tài)擴(kuò)充 .理論分析和實(shí)驗(yàn)結(jié)果表明 ,基于此模型實(shí)現(xiàn)的信息檢索算法具有較快的查找速度和較高的查準(zhǔn)率
[Abstract]:The N-layer vector space model is a new information retrieval algorithm model based on the traditional vector space model. This model logically divides a document into N relatively independent text segments. Then the text feature vector and the text weight vector are established according to the content of the text segment. On the basis of this model, the method of calculating the eigenvalue vector and the similarity degree is defined more accurately. The theoretical analysis and experimental results show that the information retrieval algorithm based on this model has faster searching speed and higher precision.
【作者單位】: 湖南大學(xué)計(jì)算機(jī)科學(xué)系 湖南大學(xué)計(jì)算機(jī)科學(xué)系 湖南大學(xué)計(jì)算機(jī)科學(xué)系
【基金】:湖南省自然科學(xué)基金資助 ( 0 1 JJY1 0 0 7)
【分類號】:TP391.1
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 戴先宇,王明文,吳水秀,張石林;帶參數(shù)的搜索引擎[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年04期
2 王穎楠,滕飛,解莉,孫俏;Web挖掘技術(shù)[J];吉林工學(xué)院學(xué)報(bào)(自然科學(xué)版);2002年01期
3 胥桂仙,蘇筱蔚,陳淑艷;中文文本挖掘中的無詞典分詞的算法及其應(yīng)用[J];吉林工學(xué)院學(xué)報(bào)(自然科學(xué)版);2002年01期
4 胥桂仙,許建潮,連遠(yuǎn)鋒,李昱翠;文本挖掘中的特征表示及聚類方法[J];吉林工學(xué)院學(xué)報(bào)(自然科學(xué)版);2002年03期
5 許建潮,王穎楠,胥桂仙;Web文本信息抽取與挖掘方法[J];長春工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年S1期
6 陳紅英,李衛(wèi)華;智能信息Agent的研究和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2002年12期
7 劉斌;陳樺;;向量空間模型信息檢索技術(shù)討論[J];情報(bào)雜志;2006年07期
8 石冰,曹慧,盧軍;一種HTML文檔的樸素貝葉斯分類算法[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2003年03期
9 莊兵 ,曾子維 ,李國瑞;信息挖掘技術(shù)在信息搜索中的應(yīng)用[J];微型機(jī)與應(yīng)用;2003年09期
10 劉志為,何丕廉,孫越恒,鄭小慎;N層向量空間模型在Web信息檢索中的應(yīng)用[J];微型機(jī)與應(yīng)用;2004年12期
相關(guān)博士學(xué)位論文 前1條
1 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 劉卓;基于KNN算法的中文文本自動(dòng)分類[D];吉林大學(xué);2004年
2 鐘敏娟;基于Web的文本信息檢索算法研究[D];湖南大學(xué);2004年
3 尤眾喜;無邊界學(xué)習(xí)及其支持和引導(dǎo)研究[D];華東師范大學(xué);2005年
4 程傳鵬;基于分類的智能信息檢索研究與實(shí)現(xiàn)[D];云南師范大學(xué);2005年
5 熊德蘭;中文網(wǎng)頁褒貶傾向性分類研究[D];鄭州大學(xué);2006年
6 劉瑜;一種用于站內(nèi)搜索的層次鏈接分析算法[D];大連理工大學(xué);2006年
7 張瑩;基于自主學(xué)習(xí)的中文文本分類算法研究[D];哈爾濱工業(yè)大學(xué);2006年
8 謝江標(biāo);最優(yōu)搜索理論在元搜索引擎中的應(yīng)用研究[D];電子科技大學(xué);2007年
9 杜超華;基于本體的省情網(wǎng)垂直搜索引擎研究[D];華中師范大學(xué);2007年
10 吳虎子;中文網(wǎng)頁獲取及自動(dòng)分類技術(shù)研究[D];武漢理工大學(xué);2007年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李虎;鄒鵬;賈焰;周斌;;一種基于MapReduce的分布式文本數(shù)據(jù)過濾模型研究[J];信息網(wǎng)絡(luò)安全;2011年09期
2 申瑩;徐東平;龐俊;;基于概念的中文博客情感極性聚類分析[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年08期
3 潘正高;侯傳宇;談成訪;;基于命名實(shí)體的Web新聞文本分類方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年08期
4 孫桂煌;;一種基于n-gram短語的文本聚類方法研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2011年14期
5 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻(xiàn)度的特征選擇方法在文本分類中應(yīng)用[J];大連理工大學(xué)學(xué)報(bào);2011年04期
6 李志明;李善平;楊朝暉;林欣;;基于本體分割的本體映射算法[J];模式識別與人工智能;2011年02期
7 許志凱;徐志明;李棟;李生;;面向互聯(lián)網(wǎng)新聞的話題檢測與追蹤[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期
8 李e,
本文編號:1663539
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1663539.html