天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

大規(guī)模圖像檢索中高維索引技術(shù)研究

發(fā)布時(shí)間:2017-03-26 23:02

  本文關(guān)鍵詞:大規(guī)模圖像檢索中高維索引技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:大規(guī)模圖像檢索(Large-scale Image Retrieval)旨在從大規(guī)模圖像庫(kù)中快速、準(zhǔn)確地查找與查詢(xún)圖像內(nèi)容相似的圖像,已在多媒體檢索、版權(quán)保護(hù)和網(wǎng)絡(luò)信息監(jiān)控等領(lǐng)域得到廣泛的應(yīng)用和飛速的發(fā)展。大規(guī)模圖像檢索系統(tǒng)一般采用特征提取技術(shù)將圖像的視覺(jué)內(nèi)容描述為高維特征數(shù)據(jù),從而將圖像檢索問(wèn)題轉(zhuǎn)化為高維數(shù)據(jù)的相似性度量問(wèn)題。在網(wǎng)絡(luò)大規(guī)模圖像檢索背景下,特征數(shù)據(jù)動(dòng)輒上百維且特征規(guī)模在千萬(wàn)級(jí)以上,因此高維索引技術(shù)是影響大規(guī)模圖像檢索性能的關(guān)鍵!熬S數(shù)災(zāi)難”問(wèn)題導(dǎo)致傳統(tǒng)的樹(shù)型索引性能急劇下降,且大規(guī)模數(shù)據(jù)環(huán)境下內(nèi)存資源也成為影響系統(tǒng)性能的瓶頸。如何對(duì)大規(guī)模高維特征數(shù)據(jù)建立有效的索引,以滿(mǎn)足檢索性能和內(nèi)存資源的要求,是一個(gè)極具挑戰(zhàn)的研究熱點(diǎn)與難點(diǎn)問(wèn)題。為實(shí)現(xiàn)大規(guī)模數(shù)據(jù)環(huán)境下高效率、高精度和低內(nèi)存消耗的高維索引,本文圍繞分布式局部敏感哈希索引、數(shù)據(jù)依賴(lài)的多索引哈希算法和二進(jìn)制層次索引技術(shù)等關(guān)鍵問(wèn)題進(jìn)行了較為深入的研究,取得了如下成果:(1)分布式局部敏感哈希索引局部敏感哈希索引是目前比較通用的近似最近鄰查詢(xún)算法。由于該算法在建立哈希表時(shí)對(duì)數(shù)據(jù)空間進(jìn)行均勻劃分,而真實(shí)數(shù)據(jù)并不呈均勻分布,因此其不能有效處理數(shù)據(jù)非均勻分布問(wèn)題,進(jìn)而影響其查詢(xún)性能。本文首先提出數(shù)據(jù)依賴(lài)的局部敏感哈希索引算法,該算法具有兩層結(jié)構(gòu)。在第一層,通過(guò)訓(xùn)練數(shù)據(jù)集得到一系列聚類(lèi)中心,然后根據(jù)聚類(lèi)中心把待索引的數(shù)據(jù)集劃分成一個(gè)個(gè)類(lèi),從而使得每類(lèi)中的數(shù)據(jù)呈近似均勻分布。在第二層,對(duì)每一類(lèi)中的數(shù)據(jù)建立哈希表。對(duì)于查詢(xún)數(shù)據(jù),首先把它映射到相似的類(lèi)中心,然后在每一類(lèi)的哈希表中進(jìn)行近似最近鄰查詢(xún)。為了進(jìn)一步提升索引的性能,提出優(yōu)化的分布式局部敏感哈希算法。在國(guó)際基準(zhǔn)測(cè)試數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與通用的E2LSH算法相比,數(shù)據(jù)依賴(lài)的局部敏感哈希索引算法在保持高查詢(xún)精度的同時(shí)可以使查詢(xún)速度提升48倍,并且分布式實(shí)現(xiàn)可以使查詢(xún)速度得到進(jìn)一步提升。(2)數(shù)據(jù)依賴(lài)的多索引哈希算法多索引哈希是目前使用廣泛的針對(duì)二進(jìn)制碼的精確查詢(xún)索引算法。由于多索引哈;跀(shù)據(jù)集中的二進(jìn)制碼呈均勻分布這一假設(shè),不能有效處理非均勻分布的數(shù)據(jù)集;且在計(jì)算海明距離時(shí)為二進(jìn)制碼的每一位賦予相同的權(quán)重導(dǎo)致距離度量模糊。針對(duì)這一問(wèn)題,本文提出數(shù)據(jù)依賴(lài)的多索引哈希算法。首先把二進(jìn)制碼劃分為多個(gè)連續(xù)不重合的子串,并通過(guò)協(xié)方差矩陣計(jì)算二進(jìn)制碼每位之間的相關(guān)性,為每一個(gè)子串學(xué)習(xí)得到自適應(yīng)投影向量。在為每個(gè)子串建立哈希表時(shí),使用投影向量對(duì)子串進(jìn)行投影從而得到哈希表中的下標(biāo)。采用自適應(yīng)投影的方法可以使得哈希表中的元素接近于均勻分布,進(jìn)而提升查詢(xún)速度。本文進(jìn)一步利用協(xié)方差矩陣提出查詢(xún)結(jié)果重排序算法,通過(guò)為二進(jìn)制碼的每一位賦予不同的權(quán)重對(duì)查詢(xún)結(jié)果進(jìn)行重排序。在大規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)表明,與多索引哈希算法相比數(shù)據(jù)依賴(lài)的多索引哈希算法可以使查詢(xún)速度提升36.9%-87.4%,查詢(xún)精度提升22.2%。(3)二進(jìn)制層次索引技術(shù)為了進(jìn)一步提高索引的查詢(xún)速度,研究者提出二進(jìn)制碼近似查詢(xún)算法,其中層次聚類(lèi)樹(shù)得到廣泛應(yīng)用。但是該算法隨機(jī)選取類(lèi)中心并且使用整個(gè)二進(jìn)制碼建立索引,影響查詢(xún)性能。針對(duì)這一問(wèn)題,本文提出二進(jìn)制層次索引技術(shù)。首先提出一種新的聚類(lèi)方法,通過(guò)二進(jìn)制碼的相對(duì)距離選取類(lèi)中心實(shí)現(xiàn)對(duì)數(shù)據(jù)集的均勻劃分。然后提出二進(jìn)制碼壓縮技術(shù),利用均方差的特性衡量二進(jìn)制碼每位的區(qū)分性,生成短小且區(qū)分性高的二進(jìn)制碼,并根據(jù)壓縮二進(jìn)制碼建立層次聚類(lèi)樹(shù)。最后采用粗篩選與精確過(guò)濾相結(jié)合的方式,進(jìn)行索引查詢(xún)。在十億級(jí)數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文算法在保證精度的前提下明顯提高了查詢(xún)速度,并且大幅度降低內(nèi)存消耗。本文的研究工作在分析現(xiàn)有高維索引技術(shù)不足的基礎(chǔ)上,通過(guò)對(duì)上述關(guān)鍵問(wèn)題的深入研究,提高了高維索引在應(yīng)對(duì)大規(guī)模高維數(shù)據(jù)的性能,從而為大規(guī)模圖像檢索提供良好的技術(shù)基礎(chǔ),具有廣闊的應(yīng)用前景。
【關(guān)鍵詞】:高維索引 分布式局部敏感哈希 數(shù)據(jù)依賴(lài)的多索引哈希 二進(jìn)制層次索引
【學(xué)位授予單位】:中國(guó)海洋大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.41
【目錄】:
  • 摘要5-7
  • ABSTRACT7-13
  • 1 引言13-20
  • 1.1 研究背景與意義13-15
  • 1.2 研究現(xiàn)狀與存在的問(wèn)題15-17
  • 1.3 研究?jī)?nèi)容17-18
  • 1.4 本文的組織結(jié)構(gòu)18-20
  • 2 大規(guī)模圖像檢索中的高維索引技術(shù)綜述20-55
  • 2.1 引言20-21
  • 2.2 大規(guī)模圖像檢索21-22
  • 2.3 圖像特征提取22-38
  • 2.3.1 全局特征23-26
  • 2.3.2 局部特征26-34
  • 2.3.3 二進(jìn)制特征34-38
  • 2.4 高維索引38-53
  • 2.4.1 距離度量與相似性查詢(xún)39-43
  • 2.4.2 樹(shù)型結(jié)構(gòu)的多維索引43-47
  • 2.4.3 近似最近鄰索引47-51
  • 2.4.4 二進(jìn)制索引51-53
  • 2.5 高維索引評(píng)測(cè)準(zhǔn)則53-54
  • 2.6 小結(jié)54-55
  • 3 分布式數(shù)據(jù)依賴(lài)的局部敏感哈希索引55-68
  • 3.1 概述55-57
  • 3.2 數(shù)據(jù)依賴(lài)的局部敏感哈希索引57-60
  • 3.2.1 問(wèn)題提出57-58
  • 3.2.2 數(shù)據(jù)依賴(lài)的局部敏感哈希索引58-60
  • 3.3 分布式實(shí)現(xiàn)60-62
  • 3.3.1 問(wèn)題提出60-61
  • 3.3.2 數(shù)據(jù)集均衡分配61-62
  • 3.4 實(shí)驗(yàn)結(jié)果62-67
  • 3.4.1 實(shí)驗(yàn)設(shè)置62-63
  • 3.4.2 參數(shù)選取63-64
  • 3.4.3 數(shù)據(jù)依賴(lài)的局部敏感哈希索引有效性驗(yàn)證64-66
  • 3.4.4 分布式實(shí)現(xiàn)有效性驗(yàn)證66-67
  • 3.5 小結(jié)67-68
  • 4 數(shù)據(jù)依賴(lài)的多索引哈希算法68-84
  • 4.1 概述68-70
  • 4.2 數(shù)據(jù)依賴(lài)的多索引哈希算法70-75
  • 4.2.1 多索引哈希算法70-71
  • 4.2.2 問(wèn)題提出71-72
  • 4.2.3 數(shù)據(jù)依賴(lài)的多索引哈希算法72-75
  • 4.2.4 哈希表數(shù)據(jù)分布評(píng)估75
  • 4.3 查詢(xún)結(jié)果重排序75-76
  • 4.3.1 問(wèn)題提出75
  • 4.3.2 位權(quán)重計(jì)算75-76
  • 4.4 實(shí)驗(yàn)結(jié)果76-83
  • 4.4.1 實(shí)驗(yàn)設(shè)置76-77
  • 4.4.2 訓(xùn)練數(shù)據(jù)對(duì)算法性能的影響77-78
  • 4.4.3 算法有效性和可擴(kuò)展性驗(yàn)證78-80
  • 4.4.4 重排序性能驗(yàn)證80-81
  • 4.4.5 在圖像檢索上的應(yīng)用81-83
  • 4.5 小結(jié)83-84
  • 5 二進(jìn)制層次索引84-100
  • 5.1 概述84-86
  • 5.2 二進(jìn)制層次索引86-91
  • 5.2.1 問(wèn)題提出86
  • 5.2.2 構(gòu)建二進(jìn)制層次聚類(lèi)樹(shù)86-88
  • 5.2.3 二進(jìn)制碼壓縮88-90
  • 5.2.4 二進(jìn)制層次索引90-91
  • 5.3 實(shí)驗(yàn)結(jié)果91-98
  • 5.3.1 實(shí)驗(yàn)設(shè)置91-92
  • 5.3.2 參數(shù)選取92-95
  • 5.3.3 算法有效性驗(yàn)證95-97
  • 5.3.4 算法可擴(kuò)展性驗(yàn)證97
  • 5.3.5 在圖像檢索上的應(yīng)用97-98
  • 5.4 小結(jié)98-100
  • 6 總結(jié)與展望100-103
  • 6.1 總結(jié)100-101
  • 6.2 本課題研究展望101-103
  • 參考文獻(xiàn)103-110
  • 致謝110-112
  • 個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果112-113

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條

1 馬艷萍;姬光榮;鄒海林;謝洪濤;;數(shù)據(jù)依賴(lài)的多索引哈希算法[J];西安電子科技大學(xué)學(xué)報(bào);2015年04期

2 ;多媒體技術(shù)研究:2012——多媒體數(shù)據(jù)索引與檢索技術(shù)研究進(jìn)展[J];中國(guó)圖象圖形學(xué)報(bào);2013年11期

3 袁培森;沙朝鋒;王曉玲;周傲英;;一種基于學(xué)習(xí)的高維數(shù)據(jù)c-近似最近鄰查詢(xún)算法[J];軟件學(xué)報(bào);2012年08期

4 張明波,陸鋒,申排偉,程昌秀;R樹(shù)家族的演變和發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2005年03期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 梁俊杰;大規(guī)模圖像庫(kù)的高維索引技術(shù)研究[D];華中科技大學(xué);2007年


  本文關(guān)鍵詞:大規(guī)模圖像檢索中高維索引技術(shù)研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):269477

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/269477.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)9d023***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com