基于Lucene的云平臺搜索技術研究與實現(xiàn)
發(fā)布時間:2017-08-06 11:18
本文關鍵詞:基于Lucene的云平臺搜索技術研究與實現(xiàn)
更多相關文章: Lucene Hadoop 以圖搜圖 以圖搜視頻
【摘要】:隨著互聯(lián)網(wǎng)對工作、學習、生活的滲透程度的日益加深,各種云應用極大地豐富、大數(shù)據(jù)時代信息量的呈爆炸式增長,互聯(lián)網(wǎng)正在從過去傳統(tǒng)意義上的通信基礎平臺向泛在、智能的計算平臺轉化。然而,如果沒有搜索服務,在茫茫資源海洋里,用戶要找到想要的資源,無異于大海撈針。搜索,就是在多且雜亂的資源庫、信息庫里,為用戶提供一條快速、有效地找到其想要資源的關鍵途徑。本課題旨在對生活中常見的搜索應用的種類:文件搜索、圖片搜索和視頻搜索,通過橫向融合于一體,研究和實現(xiàn)一套簡單、有效、可用的解決方案。在自定義算法實現(xiàn)云平臺的HDFS文件系統(tǒng)文件搜索的基礎上,結合開源的全文搜索引擎開發(fā)包Lucene,著重研究和實現(xiàn)了:在云存儲平臺上,如何快速、有效地找到文件,并摒棄無意義的搜索;在購物平臺上,如何根據(jù)樣圖快速找到相似商品從而方便進行比價;在視頻監(jiān)控平臺上,如何根據(jù)一張異常視頻畫面,快速、準確地找到該畫面所在的視頻及定位該畫面時間點。通過使用Load Runner測試工具對實驗環(huán)境進行測試,結果表明,在性能上基本達到了預期目標,搜索速度快、結果較準確,實現(xiàn)效果較好,對云存儲平臺、購物平臺、視頻監(jiān)控平臺實現(xiàn)搜索功能都有積極的參考意義。
【關鍵詞】:Lucene Hadoop 以圖搜圖 以圖搜視頻
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.09
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 第一章 緒論9-15
- 1.1 研究背景9-10
- 1.2 研究目標10
- 1.3 國內外研究進展10-13
- 1.3.1 國外研究現(xiàn)狀10-11
- 1.3.2 國內研究現(xiàn)狀11-13
- 1.4 本文主要工作13-14
- 1.5 論文組織結構14
- 1.6 本章小結14-15
- 第二章HDFS文件系統(tǒng)搜索技術研究與應用15-33
- 2.1 Hadoop分布式存儲系統(tǒng)15-17
- 2.2 自定義IsFind算法實現(xiàn)文件搜索17-21
- 2.2.1 自定義Is Find算法技術研究17-18
- 2.2.2 IsFind實現(xiàn)文件搜索18-19
- 2.2.3 實現(xiàn)效果小結19-21
- 2.3 Lucene搜索開發(fā)包21-32
- 2.3.1 Lucene相關技術研究21-26
- 2.3.2 Lucene+IKAnalyzer實現(xiàn)文件搜索26-31
- 2.3.3 實現(xiàn)效果小結31-32
- 2.4 本章小結32-33
- 第三章 以圖搜圖的搜索技術研究與應用33-44
- 3.1 以圖搜圖的相關技術研究33-35
- 3.2 a Hash實現(xiàn)以圖搜圖35-43
- 3.2.1 aHash算法35-39
- 3.2.2 aHash實現(xiàn)以圖搜圖39-41
- 3.2.3 實現(xiàn)效果小結41-43
- 3.3 本章小結43-44
- 第四章 以圖搜視頻的搜索技術研究與應用44-55
- 4.1 以圖搜視頻的相關技術研究44-47
- 4.2 FFmpeg+aHash實現(xiàn)以圖搜視頻47-54
- 4.2.1 FFmpeg技術研究47-50
- 4.2.2 FFmpeg+a Hash實現(xiàn)以圖搜視頻50-53
- 4.2.3 實現(xiàn)效果小結53-54
- 4.3 本章小結54-55
- 第五章 搜索性能測試55-64
- 5.1 實驗環(huán)境55-57
- 5.2 測試工具57-60
- 5.3 測試結果60-63
- 5.4 本章小結63-64
- 第六章 總結與展望64-65
- 參考文獻65-68
- 攻讀碩士學位期間取得的研究成果68-69
- 致謝69-70
- 附件70
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 王晟;趙壁芳;;基于內容的圖片搜索引擎研究[J];長沙大學學報;2012年02期
2 牛夏牧;焦玉華;;感知哈希綜述[J];電子學報;2008年07期
3 談圳;;云計算虛擬化技術研究[J];信息技術與信息化;2012年01期
4 劉亞秋;景維鵬;井云凌;;高可靠云計算平臺及其在智慧林業(yè)中的應用[J];世界林業(yè)研究;2011年05期
5 王博;陳莉君;;Hadoop遠程過程調用機制的分析和應用[J];西安郵電學院學報;2012年06期
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 蔡蕊;一種新的搜索引擎分詞詞典的研究[D];山東大學;2010年
2 黃翼彪;開源中文分詞器的比較研究[D];鄭州大學;2013年
3 易理林;HDFS文件系統(tǒng)中元數(shù)據(jù)的高可用性管理方法研究[D];華南理工大學;2013年
4 鄒敏昊;基于Lucene的HBase全文檢索功能的設計與實現(xiàn)[D];南京大學;2013年
,本文編號:629628
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/629628.html
最近更新
教材專著