天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于深度學(xué)習(xí)機(jī)制的人與物體交互活動(dòng)識(shí)別技術(shù)

發(fā)布時(shí)間:2017-03-23 18:16

  本文關(guān)鍵詞:基于深度學(xué)習(xí)機(jī)制的人與物體交互活動(dòng)識(shí)別技術(shù),由筆耕文化傳播整理發(fā)布。


【摘要】:人與物體交互活動(dòng)識(shí)別研究是圖像理解研究的核心研究?jī)?nèi)容之一,它對(duì)提高圖像理解的智能水平具有重要的理論意義。同時(shí),它在信息檢索、圖像自動(dòng)收集、人機(jī)交互、以及安保自動(dòng)化等諸多研究領(lǐng)域具有廣泛的應(yīng)用價(jià)值。本文通過分析大腦皮層的深度層次結(jié)構(gòu)以及其中蘊(yùn)含的深度學(xué)習(xí)機(jī)制,歸納總結(jié)出了大腦皮層理解人與物體交互活動(dòng)的基本流程和關(guān)鍵處理階段,并以此作為研究指導(dǎo)理念,研究了基于靜態(tài)圖像的人與物體交互活動(dòng)識(shí)別技術(shù)。本文的主要研究?jī)?nèi)容和創(chuàng)新成果包括:(1)本文以大腦皮層的深度層次結(jié)構(gòu)和深度學(xué)習(xí)機(jī)制為依據(jù),設(shè)計(jì)了一種新的人與物體交互活動(dòng)識(shí)別框架。框架通過模擬大腦皮層逐層、逐區(qū)域地識(shí)別人與物體交互活動(dòng)的過程,針對(duì)其中的四個(gè)關(guān)鍵子任務(wù),設(shè)計(jì)了四個(gè)核心模型,即:圖像物體3D空間分布重塑、圖像視覺結(jié)構(gòu)探測(cè)、人與物體交互活動(dòng)識(shí)別、和圖像主題內(nèi)容描述模型,共同完成人與物體交互活動(dòng)識(shí)別任務(wù)。(2)分析3D空間信息在二維平面上的成像規(guī)律,提出了一種針對(duì)單目單圖物體3D空間分布重塑的模型。模型使用離散抽象分析方法,重構(gòu)圖像中深度變化連續(xù)、變化率一致的區(qū)域的深度信息,進(jìn)而重塑圖像物體的3D空間分布信息。該模型提高了物體絕對(duì)深度、相對(duì)深度、以及物體真實(shí)尺寸預(yù)測(cè)的準(zhǔn)確率。(3)在分析圖像中人與物體的3D空間相對(duì)位置關(guān)系的基礎(chǔ)上,提出了一種圖像視覺結(jié)構(gòu)探測(cè)模型。模型通過估計(jì)人與物體聯(lián)合出現(xiàn)的概率強(qiáng)度,預(yù)測(cè)圖像所蘊(yùn)含的視覺結(jié)構(gòu)。本文的模型在視覺結(jié)構(gòu)所蘊(yùn)含的人與物體空間相對(duì)位置關(guān)系統(tǒng)計(jì)分析,以及視覺結(jié)構(gòu)探測(cè)準(zhǔn)確率方面均優(yōu)于目前具有代表性的Visual Phrase模型、Mutual Model模型和Group of Objects模型。(4)以大腦皮層PC區(qū)識(shí)別人與物體交互活動(dòng)的方式和過程為參照,提出了一種人與物體交互活動(dòng)識(shí)別模型。模型以大腦皮層的深度層次結(jié)構(gòu)為基礎(chǔ),設(shè)計(jì)了一種基于Factors的條件融合知識(shí)推理機(jī),將人與物體的3D空間相對(duì)位置作為先驗(yàn)條件,輔助模型提取交互活動(dòng)的高級(jí)不變性特征;并采用深度學(xué)習(xí)機(jī)制,逐層高效地訓(xùn)練模型的參數(shù),最終實(shí)現(xiàn)人與物體交互活動(dòng)識(shí)別。本文的模型提高了人與物體交互活動(dòng)識(shí)別的準(zhǔn)確率。(5)本文提出了一種圖像主題自動(dòng)生成模型。模型包含兩個(gè)子模型:圖像主要語義關(guān)系預(yù)測(cè)和圖像主題描述語句自動(dòng)生成。圖像主要語義關(guān)系預(yù)測(cè)模型以分析交互活動(dòng)與場(chǎng)景物體之間的空間聯(lián)合發(fā)生概率為基礎(chǔ),預(yù)測(cè)與交互活動(dòng)最匹配的場(chǎng)景物體之間的語義關(guān)系。圖像主題描述語句自動(dòng)生成模型以交互活動(dòng)與場(chǎng)景物體之間的語義關(guān)系為核心,設(shè)計(jì)了一種基于Lexicalization PCFG的圖像主題生成算法,自動(dòng)生成符合英語語法和語義規(guī)范的圖像主題描述語句。本文的模型不僅能正確描述圖像中人與物體的交互活動(dòng),而且生成的語句表現(xiàn)出了較好的語法規(guī)范性和認(rèn)知合理性。
【關(guān)鍵詞】:人與物體交互活動(dòng) 深度學(xué)習(xí)機(jī)制 大腦皮層深度層次結(jié)構(gòu) 圖像視覺結(jié)構(gòu) 人與物體3D空間分布
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
  • 摘要5-7
  • Abstract7-12
  • 第1章 緒論12-32
  • 1.1 研究目的和意義12-14
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)14-29
  • 1.2.1 深度學(xué)習(xí)機(jī)制與深度學(xué)習(xí)模型14-20
  • 1.2.2 人與物體交互活動(dòng)識(shí)別研究20-29
  • 1.3 論文研究?jī)?nèi)容29-31
  • 1.4 論文結(jié)構(gòu)安排31-32
  • 第2章 基于深度學(xué)習(xí)機(jī)制的人與物體交互活動(dòng)識(shí)別框架32-48
  • 2.1 大腦皮層深度層次感知系統(tǒng)32-35
  • 2.2 深度學(xué)習(xí)機(jī)制35-39
  • 2.3 人與物體交互活動(dòng)識(shí)別框架39-45
  • 2.3.1 圖像分割與物體識(shí)別40-41
  • 2.3.2 圖像物體 3D空間分布重塑41-42
  • 2.3.3 圖像視覺結(jié)構(gòu)探測(cè)42-43
  • 2.3.4 人與物體交互活動(dòng)識(shí)別43-44
  • 2.3.5 圖像主題自動(dòng)生成44-45
  • 2.4 本章小結(jié)45-48
  • 第3章 單目單圖物體 3D空間分布重塑48-68
  • 3.1 引言48-50
  • 3.2 靜態(tài)圖像光學(xué)成像原理分析50-52
  • 3.3 圖像深度參考系模型52-55
  • 3.4 圖像物體 3D空間分布重塑算法55-58
  • 3.5 實(shí)驗(yàn)與算法分析58-66
  • 3.5.1.實(shí)驗(yàn)數(shù)據(jù)與對(duì)比模型59-60
  • 3.5.2.圖像深度信息重構(gòu)評(píng)測(cè)60-64
  • 3.5.3.圖像物體 3D空間分布重塑評(píng)測(cè)64-66
  • 3.6 本章小結(jié)66-68
  • 第4章 圖像視覺結(jié)構(gòu)探測(cè)68-90
  • 4.1 引言68-69
  • 4.2 圖像 3D空間結(jié)構(gòu)模式分析69-70
  • 4.3 基于圖像 3D空間結(jié)構(gòu)分析的視覺結(jié)構(gòu)探測(cè)模型70-80
  • 4.3.1 視覺結(jié)構(gòu)探測(cè)模型表示70-73
  • 4.3.2 視覺結(jié)構(gòu)探測(cè)模型推理73-74
  • 4.3.3 視覺結(jié)構(gòu)探測(cè)模型學(xué)習(xí)74-80
  • 4.4 實(shí)驗(yàn)與算法分析80-88
  • 4.4.1.實(shí)驗(yàn)數(shù)據(jù)與對(duì)比模型80-82
  • 4.4.2.人與物體空間相對(duì)位置關(guān)系分析評(píng)測(cè)82-85
  • 4.4.3.視覺結(jié)構(gòu)探測(cè)準(zhǔn)確性評(píng)測(cè)85-88
  • 4.5 本章小結(jié)88-90
  • 第5章 圖像主要人與物體交互活動(dòng)識(shí)別90-116
  • 5.1 引言90-91
  • 5.2 人與物體交互活動(dòng)識(shí)別分析91-92
  • 5.3 基于FTWIM的人與物體交互活動(dòng)識(shí)別模型92-105
  • 5.3.1 基于FTWIM的人與物體交互活動(dòng)識(shí)別模型表示92-95
  • 5.3.2 FTWFLM模型推理95-97
  • 5.3.3 FTWFLM模型學(xué)習(xí)97-102
  • 5.3.4 Softmax分類器推理102-103
  • 5.3.5 Softmax分類器學(xué)習(xí)103-105
  • 5.3.6 FTWIM模型整體參數(shù)微調(diào)105
  • 5.4 實(shí)驗(yàn)與算法分析105-113
  • 5.4.1 實(shí)驗(yàn)數(shù)據(jù)與對(duì)比模型105-107
  • 5.4.2 人與物體交互活動(dòng)識(shí)別準(zhǔn)確率與召回率評(píng)測(cè)107-112
  • 5.4.3 人與物體交互活動(dòng)識(shí)別錯(cuò)誤分析112-113
  • 5.5 本章小結(jié)113-116
  • 第6章 圖像主題自動(dòng)生成116-134
  • 6.1 引言116-118
  • 6.2 圖像主要語義關(guān)系預(yù)測(cè)模型118-122
  • 6.2.1 圖像主要語義關(guān)系預(yù)測(cè)模型表示118-120
  • 6.2.2 圖像主要語義關(guān)系預(yù)測(cè)模型推理120-121
  • 6.2.3 圖像主要語義關(guān)系預(yù)測(cè)模型學(xué)習(xí)121-122
  • 6.3 圖像主題描述語句自動(dòng)生成模型122-125
  • 6.4 實(shí)驗(yàn)與算法分析125-131
  • 6.4.1 實(shí)驗(yàn)數(shù)據(jù)與對(duì)比模型126-127
  • 6.4.2 圖像主題理解自動(dòng)評(píng)測(cè)127-129
  • 6.4.3 圖像主題理解人工評(píng)測(cè)129-131
  • 6.5 本章小結(jié)131-134
  • 結(jié)論134-136
  • 參考文獻(xiàn)136-146
  • 攻讀學(xué)位期間發(fā)表論文與研究成果清單146-148
  • 致謝148-150
  • 作者簡(jiǎn)介150

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條

1 畢泰勇;尚哲;;高級(jí)視皮層可塑性:物體和面孔知覺學(xué)習(xí)綜述[J];中國(guó)科學(xué):生命科學(xué);2015年01期

2 王萍;吳利安;彭靜;杜秀梅;;感知覺訓(xùn)練對(duì)斜視術(shù)后三級(jí)功能恢復(fù)臨床觀察[J];陜西醫(yī)學(xué)雜志;2015年11期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條

1 牟海燕;發(fā)育期大鼠高級(jí)視皮層活動(dòng)對(duì)初級(jí)視皮層突觸可塑性影響的研究[D];天津醫(yī)科大學(xué);2010年

2 王巖;基于認(rèn)知控制和沖突監(jiān)控[D];華東師范大學(xué);2014年

3 劉玉燕;暗飼養(yǎng)對(duì)大鼠初級(jí)視皮層Ⅱ/Ⅲ層錐體神經(jīng)元突觸傳遞特征的影響[D];天津醫(yī)科大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條

1 宋峰偉;視知覺學(xué)習(xí)與全遮蓋治療對(duì)于超敏感期弱視患者的功能重建研究[D];浙江大學(xué);2013年

2 蔡永華;運(yùn)用pRF技術(shù)對(duì)漢語母語者早期視皮層的研究[D];華東師范大學(xué);2014年

3 黃莉雯;雙眼視注意力轉(zhuǎn)移訓(xùn)練治療視覺敏感期后弱視的研究[D];復(fù)旦大學(xué);2013年


  本文關(guān)鍵詞:基于深度學(xué)習(xí)機(jī)制的人與物體交互活動(dòng)識(shí)別技術(shù),由筆耕文化傳播整理發(fā)布。



本文編號(hào):264301

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/264301.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2128b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com