基于殘差網(wǎng)絡(luò)的多標簽圖像檢索方法研究
發(fā)布時間:2021-06-28 11:07
隨著人工智能,物聯(lián)網(wǎng)以及多媒體等技術(shù)的快速發(fā)展,圖像量級呈爆發(fā)式增長,如何高效準確地檢索出用戶所需圖片是多標簽圖像檢索領(lǐng)域面臨的關(guān)鍵問題。為了提高多標簽圖像檢索的準確率和效率,目前主流的解決方案為采用深度哈希的方法。盡管基于深度哈希的方法在多標簽圖像檢索領(lǐng)域取得了一定的成果,然而在多標簽圖像檢索時仍然存在檢索準確率不高這一突出問題。本文圍繞相關(guān)問題展開研究,提出了基于殘差網(wǎng)絡(luò)的多標簽圖像檢索方法的解決方法,主要內(nèi)容包含以下三個方面的工作:(1)在現(xiàn)有的深度網(wǎng)絡(luò)模型中,提取的底層特征不能有效地將多標簽圖像的多層次語義信息和相似度排序信息集成到一個深度哈希模型中。因此,本文構(gòu)建了基于改進殘差網(wǎng)絡(luò)的深度哈希模型。該模型采用成對多標簽圖像標簽向量的余弦距離來量化多標簽圖像中存在的多層次相似性信息。同時,引入殘差網(wǎng)絡(luò)提高模型的學(xué)習(xí)能力。實驗表明,與對比方法中最佳的基準模型相比,改進后的模型在兩個多標簽數(shù)據(jù)集上平均檢索精度分別提高了4.09%和8.47%。(2)在現(xiàn)有的深度哈希模型中,提取的特征向量通常包含多標簽圖像的全局信息,其中包括多標簽圖像的目標信息和雜亂的背景信息。因此,本文構(gòu)建了融合注意...
【文章來源】:桂林電子科技大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
人腦視覺機制示意圖
基于殘差網(wǎng)絡(luò)的多標簽圖像檢索方法研究(2) 人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANN)是由動物大腦的生物神經(jīng)網(wǎng)形成的計算系統(tǒng)[33]。大量的人工神經(jīng)元構(gòu)成神經(jīng)網(wǎng)絡(luò),在大多數(shù)情況下,網(wǎng)絡(luò)能在外界輸入信號刺激下改變其網(wǎng)絡(luò)參數(shù),主動學(xué)習(xí)適應(yīng)外界的變化為構(gòu)成人工神經(jīng)網(wǎng)絡(luò)的基本單位[34]。如圖 2-2 所示,人工神經(jīng)元由四部分為輸入刺激信號、求和計算單元、閾值和對求和結(jié)果進行激活的激活函數(shù)
第二章 研究相關(guān)的理論和技術(shù)1( )0f 和型:該激活函數(shù)是一種偽線性激活函數(shù),其,當輸出增加到某個值之后就會達到飽和狀態(tài)圖 2-4 所示;詈瘮(shù):該函數(shù)作用也為將非線性元素添加到該神經(jīng)元被激活產(chǎn)生一個響應(yīng);在某個輸入范形圖如圖 2-5 所示,公式為 2-3 所示:
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[2]目標提取與哈希機制的多標簽圖像檢索[J]. 陳飛,呂紹和,李軍,王曉東,竇勇. 中國圖象圖形學(xué)報. 2017 (02)
[3]深度文本匹配綜述[J]. 龐亮,蘭艷艷,徐君,郭嘉豐,萬圣賢,程學(xué)旗. 計算機學(xué)報. 2017(04)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的自然場景中數(shù)字的識別[D]. 周成偉.南京郵電大學(xué) 2017
[2]基于圖像自編碼的神經(jīng)網(wǎng)絡(luò)特征學(xué)習(xí)研究及應(yīng)用[D]. 恩擎.北京工業(yè)大學(xué) 2017
[3]深度人臉特征提取及識別的應(yīng)用研究[D]. 陳冠豪.重慶大學(xué) 2017
[4]基于相關(guān)性分析的跨媒體檢索[D]. 王述.中國科學(xué)院大學(xué)(中國科學(xué)院工程管理與信息技術(shù)學(xué)院) 2017
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的手勢識別[D]. 蔡娟.福建師范大學(xué) 2015
[6]圖像哈希編碼方法研究與應(yīng)用[D]. 居振飛.南京大學(xué) 2015
本文編號:3254207
【文章來源】:桂林電子科技大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
人腦視覺機制示意圖
基于殘差網(wǎng)絡(luò)的多標簽圖像檢索方法研究(2) 人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANN)是由動物大腦的生物神經(jīng)網(wǎng)形成的計算系統(tǒng)[33]。大量的人工神經(jīng)元構(gòu)成神經(jīng)網(wǎng)絡(luò),在大多數(shù)情況下,網(wǎng)絡(luò)能在外界輸入信號刺激下改變其網(wǎng)絡(luò)參數(shù),主動學(xué)習(xí)適應(yīng)外界的變化為構(gòu)成人工神經(jīng)網(wǎng)絡(luò)的基本單位[34]。如圖 2-2 所示,人工神經(jīng)元由四部分為輸入刺激信號、求和計算單元、閾值和對求和結(jié)果進行激活的激活函數(shù)
第二章 研究相關(guān)的理論和技術(shù)1( )0f 和型:該激活函數(shù)是一種偽線性激活函數(shù),其,當輸出增加到某個值之后就會達到飽和狀態(tài)圖 2-4 所示;詈瘮(shù):該函數(shù)作用也為將非線性元素添加到該神經(jīng)元被激活產(chǎn)生一個響應(yīng);在某個輸入范形圖如圖 2-5 所示,公式為 2-3 所示:
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[2]目標提取與哈希機制的多標簽圖像檢索[J]. 陳飛,呂紹和,李軍,王曉東,竇勇. 中國圖象圖形學(xué)報. 2017 (02)
[3]深度文本匹配綜述[J]. 龐亮,蘭艷艷,徐君,郭嘉豐,萬圣賢,程學(xué)旗. 計算機學(xué)報. 2017(04)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的自然場景中數(shù)字的識別[D]. 周成偉.南京郵電大學(xué) 2017
[2]基于圖像自編碼的神經(jīng)網(wǎng)絡(luò)特征學(xué)習(xí)研究及應(yīng)用[D]. 恩擎.北京工業(yè)大學(xué) 2017
[3]深度人臉特征提取及識別的應(yīng)用研究[D]. 陳冠豪.重慶大學(xué) 2017
[4]基于相關(guān)性分析的跨媒體檢索[D]. 王述.中國科學(xué)院大學(xué)(中國科學(xué)院工程管理與信息技術(shù)學(xué)院) 2017
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的手勢識別[D]. 蔡娟.福建師范大學(xué) 2015
[6]圖像哈希編碼方法研究與應(yīng)用[D]. 居振飛.南京大學(xué) 2015
本文編號:3254207
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3254207.html
最近更新
教材專著