當(dāng)前位置：主頁(yè) > 科技論文 > 計(jì)算機(jī)應(yīng)用論文 >

基于多頭注意力的視頻標(biāo)注方法研究

發(fā)布時(shí)間：2024-01-27 06:54

　　視頻標(biāo)注涉及到計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理兩個(gè)領(lǐng)域,是一個(gè)非常有挑戰(zhàn)性的任務(wù)。同時(shí),視頻標(biāo)注也有非常廣泛的實(shí)際應(yīng)用前景。現(xiàn)階段,完全用人工的方式進(jìn)行視頻標(biāo)注無(wú)疑可以獲得非常精確的結(jié)果,但是隨著人力成本的迅速增長(zhǎng),社會(huì)對(duì)自動(dòng)視頻標(biāo)注方法的需求正變得越來(lái)越緊迫。在近年來(lái)出現(xiàn)的視頻標(biāo)注模型中,許多都采用了自然語(yǔ)言處理領(lǐng)域廣泛使用的編解碼框架,編碼端使用視頻特征序列生成視頻中間向量表示,然后在解碼端解碼中間向量生成文字序列描述,以序列到序列的方式處理輸入輸出。編解碼框架的使用在很大程度上促進(jìn)了視頻標(biāo)注研究的發(fā)展,但是現(xiàn)行的視頻標(biāo)注模型仍然有一些不足的地方:首先,許多標(biāo)注模型缺乏聚焦關(guān)鍵信息的能力;其次,標(biāo)注模型訓(xùn)練階段和測(cè)試階段輸入數(shù)據(jù)不同,導(dǎo)致模型存在解碼誤差傳遞問(wèn)題;最后,標(biāo)注模型在訓(xùn)練過(guò)程中優(yōu)化指標(biāo)是單詞級(jí)別的交叉熵?fù)p失,和元組級(jí)別的測(cè)試指標(biāo)不一致。為了解決上述問(wèn)題,本文提出了一個(gè)基于多頭注意力的視頻標(biāo)注模型。標(biāo)注模型在傳統(tǒng)的編解碼網(wǎng)絡(luò)上引入多頭注意力機(jī)制,并改進(jìn)模型訓(xùn)練方法與模型優(yōu)化指標(biāo),主要研究工作如下:1.引入多頭注意力機(jī)制使視頻標(biāo)注模型獲得焦距關(guān)鍵信息的能力。多頭注意力機(jī)制可以使得模...

【文章頁(yè)數(shù)】：65 頁(yè)

【學(xué)位級(jí)別】：碩士

圖2-3視頻標(biāo)注模型總體結(jié)構(gòu)

圖3-1視頻標(biāo)注總體框架

圖3-2算法標(biāo)注效果

圖4-1增強(qiáng)學(xué)習(xí)框架

本文編號(hào)：3886514

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/shengwushengchang/3886514.html

上一篇：初等數(shù)學(xué)問(wèn)題中實(shí)體關(guān)系自動(dòng)抽取算法研究及應(yīng)用
下一篇：動(dòng)態(tài)場(chǎng)景下自適應(yīng)補(bǔ)償?shù)囊曈X(jué)里程計(jì)關(guān)鍵技術(shù)研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多頭注意力的視頻標(biāo)注方法研究