基于深度學(xué)習(xí)的服裝圖像檢索算法研究
發(fā)布時間:2022-01-06 04:52
最近幾年,服裝領(lǐng)域電子商務(wù)蓬勃發(fā)展,互聯(lián)網(wǎng)上的服裝圖像數(shù)據(jù)量與日俱增。為了處理海量的服裝圖像數(shù)據(jù),有效的基于內(nèi)容的服裝圖像檢索變得異常重要。散列方法,即以二進(jìn)制碼表示圖像,并使用漢明距離來判斷相似性,因其在存儲和搜索速度方面的優(yōu)勢而被廣泛接受。受卷積神經(jīng)網(wǎng)絡(luò)(CNN)最新進(jìn)展的鼓舞,本文提出了一種有效的深度學(xué)習(xí)框架,快速生成用于服裝圖像檢索的二進(jìn)制哈希碼。本文提出了一種新的監(jiān)督深度哈希方法,用于學(xué)習(xí)緊湊哈希碼以執(zhí)行基于內(nèi)容的圖像檢索,該目標(biāo)哈希碼用于描述不同圖像內(nèi)容之間的關(guān)系。然后,目標(biāo)哈希碼被饋送到深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練。針對大規(guī)模的服裝圖像數(shù)據(jù)庫,提出了基于深度網(wǎng)絡(luò)的服裝檢索模型。經(jīng)過訓(xùn)練,我們的深度網(wǎng)絡(luò)可以為不同內(nèi)容的圖像生成具有較大漢明距離的哈希碼。在本文服裝圖像數(shù)據(jù)庫上進(jìn)行的實(shí)驗(yàn)表明,我們的方法優(yōu)于其他最新方法,包括無監(jiān)督,有監(jiān)督和深度哈希方法。本文主要完成了以下工作:首先是構(gòu)建了一套服裝數(shù)據(jù)集。該服裝數(shù)據(jù)集共有102000張服裝圖像,其中該數(shù)據(jù)集要包含服裝的類別信息,服裝邊界框位置信息和服裝掩膜信息,其中實(shí)驗(yàn)結(jié)果顯示位置關(guān)鍵點(diǎn)信息可以克服服裝光照,變形,有遮擋造成的影響,掩膜信息...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
劃分區(qū)域
第二章相關(guān)理論研究11圖2-1劃分區(qū)域圖2-2統(tǒng)計(jì)區(qū)域內(nèi)直方圖4)生成HOG特征圖像梯度強(qiáng)度的會受到圖像部分區(qū)域的光照的影響而變化,也會受到目標(biāo)區(qū)域的前景-背景對比度的影響而變化,所以梯度強(qiáng)度極不穩(wěn)定。為了解決這個不穩(wěn)定的問題,有必要對梯度強(qiáng)度進(jìn)行歸一化操作。規(guī)范化進(jìn)一步壓縮了照明,陰影和邊緣。將每個單元劃分為大的,空間連接的塊。以此方式,塊中所有單元的特征向量被串聯(lián)連接以獲得塊的HOG特征。假設(shè)輸入圖片為128×128,則該單元將具有16×16=256,并且該塊將具有(16-2+1)×(16-2+1)=225,并且每個塊具有36維矢量,總共225×36=8100維向量,該向量是與該圖片相對應(yīng)的HOG特征向量。然后,利用SVM將提取的特征向量作為人體的紋理特征輸入到其中,并且進(jìn)行分類和訓(xùn)練,最后利用訓(xùn)練好的模型,可以檢測出圖像中的人體位置區(qū)域。2.2.2Sift特征Sift特征是圖像的局部特征,具有旋轉(zhuǎn)不變性,尺度不變性和亮度不變性。它對于視角,光線反射和噪聲的變化也具有一定的穩(wěn)定性。SIFT算法的本質(zhì)是在不同比例空間上找到特征點(diǎn)并計(jì)算特征點(diǎn)的方向。這些特征點(diǎn)非常突出,不會受到諸
電子科技大學(xué)碩士學(xué)位論文14圖2-3高斯圖像金字塔和高斯差分圖像金字塔圖2-4不同高斯核處理后的圖像(2)特征點(diǎn)定位與過濾由于離散空間不是連續(xù)的,兩個離散點(diǎn)之間會有一定的距離,導(dǎo)致真正的極值點(diǎn)往往不在離散的點(diǎn)上,下圖2-5顯示了二維函數(shù)離散空間得到的極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別。將已知的離散空間點(diǎn)進(jìn)行某種插值計(jì)算,然后得到的連續(xù)空間極值點(diǎn)的方法叫做子像素插值法。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Local Jet 結(jié)構(gòu)的全局圖像特征構(gòu)造方法(英文)[J]. 謝錦,蔡自興. 自動化學(xué)報. 2014(06)
[2]全局圖像特征分析與實(shí)時層次化消失點(diǎn)檢測[J]. 孫愿,盧鴻波,張志敏. 中國圖象圖形學(xué)報. 2013(07)
[3]基于局部和全局特征融合的圖像檢索[J]. 汪華章,何小海,宰文姣. 光學(xué)精密工程. 2008(06)
本文編號:3571771
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
劃分區(qū)域
第二章相關(guān)理論研究11圖2-1劃分區(qū)域圖2-2統(tǒng)計(jì)區(qū)域內(nèi)直方圖4)生成HOG特征圖像梯度強(qiáng)度的會受到圖像部分區(qū)域的光照的影響而變化,也會受到目標(biāo)區(qū)域的前景-背景對比度的影響而變化,所以梯度強(qiáng)度極不穩(wěn)定。為了解決這個不穩(wěn)定的問題,有必要對梯度強(qiáng)度進(jìn)行歸一化操作。規(guī)范化進(jìn)一步壓縮了照明,陰影和邊緣。將每個單元劃分為大的,空間連接的塊。以此方式,塊中所有單元的特征向量被串聯(lián)連接以獲得塊的HOG特征。假設(shè)輸入圖片為128×128,則該單元將具有16×16=256,并且該塊將具有(16-2+1)×(16-2+1)=225,并且每個塊具有36維矢量,總共225×36=8100維向量,該向量是與該圖片相對應(yīng)的HOG特征向量。然后,利用SVM將提取的特征向量作為人體的紋理特征輸入到其中,并且進(jìn)行分類和訓(xùn)練,最后利用訓(xùn)練好的模型,可以檢測出圖像中的人體位置區(qū)域。2.2.2Sift特征Sift特征是圖像的局部特征,具有旋轉(zhuǎn)不變性,尺度不變性和亮度不變性。它對于視角,光線反射和噪聲的變化也具有一定的穩(wěn)定性。SIFT算法的本質(zhì)是在不同比例空間上找到特征點(diǎn)并計(jì)算特征點(diǎn)的方向。這些特征點(diǎn)非常突出,不會受到諸
電子科技大學(xué)碩士學(xué)位論文14圖2-3高斯圖像金字塔和高斯差分圖像金字塔圖2-4不同高斯核處理后的圖像(2)特征點(diǎn)定位與過濾由于離散空間不是連續(xù)的,兩個離散點(diǎn)之間會有一定的距離,導(dǎo)致真正的極值點(diǎn)往往不在離散的點(diǎn)上,下圖2-5顯示了二維函數(shù)離散空間得到的極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別。將已知的離散空間點(diǎn)進(jìn)行某種插值計(jì)算,然后得到的連續(xù)空間極值點(diǎn)的方法叫做子像素插值法。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Local Jet 結(jié)構(gòu)的全局圖像特征構(gòu)造方法(英文)[J]. 謝錦,蔡自興. 自動化學(xué)報. 2014(06)
[2]全局圖像特征分析與實(shí)時層次化消失點(diǎn)檢測[J]. 孫愿,盧鴻波,張志敏. 中國圖象圖形學(xué)報. 2013(07)
[3]基于局部和全局特征融合的圖像檢索[J]. 汪華章,何小海,宰文姣. 光學(xué)精密工程. 2008(06)
本文編號:3571771
本文鏈接:http://www.sikaile.net/projectlw/qgylw/3571771.html
最近更新
教材專著