基于深度學(xué)習(xí)的視頻內(nèi)容描述研究
【文章頁(yè)數(shù)】:57 頁(yè)
【部分圖文】:
圖2智慧教室中的教學(xué)交互策略設(shè)計(jì)與實(shí)施評(píng)價(jià)反思協(xié)同知識(shí)構(gòu)建思維導(dǎo)圖支持的情境創(chuàng)設(shè)共享論證協(xié)商創(chuàng)作反思提升師生交互設(shè)計(jì)
電化教育研究圖2智慧教室中的教學(xué)交互策略設(shè)計(jì)與實(shí)施策略基本流程評(píng)價(jià)和反思教學(xué)交互策略問(wèn)卷星支持的即時(shí)測(cè)評(píng)與反饋評(píng)價(jià)反思彈幕技術(shù)支持的評(píng)論與反思“云課堂”支持的協(xié)作問(wèn)題解決協(xié)同知識(shí)構(gòu)建思維導(dǎo)圖支持的問(wèn)卷星/云課堂支持的基于量規(guī)的同伴評(píng)價(jià)問(wèn)題設(shè)計(jì)問(wèn)題實(shí)現(xiàn)問(wèn)題作答問(wèn)題反饋量規(guī)研發(fā)展示分....
圖2.1視頻理解的幾個(gè)層次??“”
區(qū)別于視頻分類(lèi)、物體檢測(cè)等標(biāo)簽式的粗粒度視覺(jué)理解任務(wù),其旨在識(shí)別視??頻中的物體以及何種動(dòng)作。視頻內(nèi)容描述研宄往前更進(jìn)一步,基于識(shí)別檢測(cè)的結(jié)??果生成一個(gè)連貫的句子。如果要理解一段視頻,可以分為多個(gè)層次,如圖2.1所??示:1.第一步確定每個(gè)像素屬于什么類(lèi);2.第二步是區(qū)域識(shí)別,....
圖2.2空間注意力機(jī)制的圖像描述生成模型??
點(diǎn)在于:在解碼器階段不是每個(gè)單詞的生成都需要利用全部的圖像編碼信息,而??是利用注意力機(jī)制選擇特定的與之相關(guān)聯(lián)的圖像區(qū)域的特征信息進(jìn)行語(yǔ)言解碼。??空間注意力機(jī)制模型結(jié)構(gòu)[331如圖2.2所示。??14x14?Feature?Map?IR9H?A???J._?A?flying??....
圖2.3時(shí)間注憊力機(jī)制的視頻描述生成模型
?第2章視頻內(nèi)容描述技術(shù)理論基礎(chǔ)2.時(shí)間注意力機(jī)制??和空間注意力機(jī)制非常相似,時(shí)間注意力機(jī)制更多的是用在以時(shí)序序列輸入的領(lǐng)域中,比如語(yǔ)音和視頻領(lǐng)域。時(shí)間注意力機(jī)制來(lái)源于人們?cè)谟^察視頻序列輸入信息的時(shí)候,并不是一次就把整段視頻的每個(gè)幀畫(huà)面都看過(guò),而是根需求將注意力集中到視頻段中的....
本文編號(hào):3916766
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3916766.html