基于概念空間的文本語義索引
[Abstract]:According to statistics, more than 80% of the online storage information exists in the form of text. The diversification and complexity of information makes automatic indexing of information an urgent problem. The content of this paper is to build a semantic index of text based on concept space. At present, all text indexes are built on the text space or keyword space, but the index based on the concept space has many advantages, such as clear structure, friendly man-machine interface, consistent with the common retrieval habits and so on. This is also the direction of text semantic index. In addition. In the process of establishing text index, most of the methods of Hopfield neural network association are used at home and abroad. In this paper, the direct clustering method is used to replace the Hopfield neural network association function for the first time, which makes the index have good expansibility. Text indexing based on semantic correlation can be widely used in many fields, such as Internet search engine, digital library, electronic commerce and so on. The process of establishing text index includes the following parts: 1) classifying documents, establishing concept space of documents, organizing documents at the level of concept space and determining the keywords appearing in documents.
【作者單位】: 中國科技大學研究生院計算機學部 中科院計算技術研究所智能信息處理開放實驗室 中科院計算技術研究所智能信息處理開放實驗室 中科院計算技術研究所智能信息處理開放實驗室
【基金】:國家自然科學基金(課題號60073019、69803010)
【分類號】:TP391.1
【相似文獻】
相關期刊論文 前10條
1 李源,何清,史忠植;基于概念語義空間的聯(lián)想檢索[J];北京科技大學學報;2001年06期
2 郭俊榮;楊捧;王紫薇;;一種基于信息粒度的信息檢索優(yōu)化方法[J];計算機仿真;2010年08期
3 黃海英;林士敏;嚴小衛(wèi);;基于概念空間的文本分類研究[J];計算機科學;2003年03期
4 黨齊民,呂冬煜;基于詞關聯(lián)語義的文本分類研究[J];計算機應用;2004年04期
5 羅三定,陸文彥,王浩,賈維嘉;基于概念的文本類別特征提取與文本模糊匹配[J];計算機工程與應用;2002年16期
6 史田華;;語義檢索技術研究[J];圖書館雜志;2001年11期
7 丁露;崔平;;SOM聚類算法在文本分類上的應用[J];現(xiàn)代情報;2007年09期
8 陳燕;龍建勛;;基于明確語義分析的自動文摘算法[J];計算機工程;2011年03期
9 張學福;;基于詞共現(xiàn)的可視化概念空間研究[J];情報學報;2008年02期
10 張明寶;馬靜;施秀麗;;領域本體在信息檢索中的應用研究[J];情報學報;2010年02期
相關會議論文 前10條
1 李素建;李蕓;紀鷺寧;徐睿峰;;詞典匹配和串頻統(tǒng)計相結合在自動主題分析中的應用[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
2 趙恩彪;隋金君;王自亮;李智;;電荷法測量粉塵濃度技術研究[A];第八屆全國采礦學術會議論文集[C];2009年
3 李曉棟;胡清華;;汽輪機故障診斷文本支持系統(tǒng)的研究與建立[A];2004電站自動化信息化學術技術交流會議論文集[C];2004年
4 張靖;趙明清;;粗糙集理論在建立線性計量經(jīng)濟模型中的應用[A];中國企業(yè)運籌學學術交流大會論文集[C];2005年
5 肖詩斌;孫麗華;王弘尉;施水才;;指標信息抽取技術的研究[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年
6 丁春;;論自由詞向關鍵詞轉換的意義[A];學報編輯論叢(第十二集)[C];2004年
7 齊敏霞;左廷榮;于曉明;;壽光商務小區(qū)暖通空調(diào)節(jié)能設計[A];全國暖通空調(diào)制冷2008年學術年會資料集[C];2008年
8 趙[,
本文編號:2332872
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2332872.html