搜索引擎設計分析與結果聚類改進.pdf 免費在線閱讀前50頁
本文關鍵詞:搜索引擎設計分析與結果聚類改進,由筆耕文化傳播整理發(fā)布。
文檔介紹:
分類號uDc注!密級學位論文搜索引擎設計分析與結果聚類改進(題名和副題名)董祥千(作者姓名)指導教師姓名左志宏苗啦數(shù)授電壬科撞太堂送鰲(職務、職稱、學位、單位名稱及地址)申請專業(yè)學位級別碩士專業(yè)名稱計算機軟件與理論論文提交日期 2006.12 論文答辯日期 2007.1學位授予單位和日期電壬抖技太堂答辯委員會主席要壅絲.評閱人碑熬 i尊芝品2006年,乒月驢日注1:注明《國際十進分類法uDC》的類號。摘要摘要搜索引擎是獲取信息的有效工具,設計與實現(xiàn)搜索引擎是一項龐大的工程,要運用較多專業(yè)技術知識。本文力圖通過實例分析,介紹搜索引擎的設計、實現(xiàn)、搜索結果聚類及其它與搜索引擎緊密相關的知識。文中指出了搜索引擎在提取摘要信息上存在的不足:僅選取關鍵詞臨近區(qū)域的語詞并不具語義特征,為此提出了以文本的語義特征詞來替換摘要信息。文中同時對語義特征詞的提取進行了理論分析,并實現(xiàn)了部分功能。本文利用后綴數(shù)組來提取文檔的語義特征詞,因此對后綴數(shù)組的結構作了詳細的闡述,提出以完全子串來表示文檔的語義特征。文中實現(xiàn)了后綴數(shù)組的構造,左、右完全子串及完全子串的提取。本文還對搜索引擎的聚類過程、以及常用的聚類算法進行了比較,并對基于奇異值分解的文本聚類算法一L...
內(nèi)容來自轉載請標明出處.
本文關鍵詞:搜索引擎設計分析與結果聚類改進,,由筆耕文化傳播整理發(fā)布。
本文編號:116334
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/116334.html