基于目標(biāo)跟蹤和語(yǔ)音交互的增強(qiáng)現(xiàn)實(shí)系統(tǒng)設(shè)計(jì)
發(fā)布時(shí)間:2021-01-08 01:13
隨著計(jì)算機(jī)技術(shù)發(fā)展,增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,簡(jiǎn)稱AR)迎來新的機(jī)遇,但目前的增強(qiáng)現(xiàn)實(shí)應(yīng)用大都是將虛擬的模型簡(jiǎn)單地疊加到現(xiàn)實(shí)場(chǎng)景視頻畫面之上,虛擬模型在大小和形狀上與現(xiàn)實(shí)場(chǎng)景中的物體保持一致,不能感知到真實(shí)場(chǎng)景中的對(duì)象。本文研究采用目標(biāo)檢測(cè)技術(shù)和雙目視覺技術(shù),將現(xiàn)實(shí)場(chǎng)景中特定對(duì)象的位置信息及時(shí)采集到應(yīng)用中,讓虛擬對(duì)象跟隨特定對(duì)象運(yùn)動(dòng),增加了應(yīng)用的真實(shí)性趣味性。為了加強(qiáng)增強(qiáng)現(xiàn)實(shí)應(yīng)用的人機(jī)交互能力,本文借助遠(yuǎn)程語(yǔ)音識(shí)別引擎,將本地語(yǔ)音命令錄入并通過網(wǎng)絡(luò)上傳至服務(wù)器,并進(jìn)行語(yǔ)音識(shí)別,將語(yǔ)音識(shí)別技術(shù)集成到增強(qiáng)現(xiàn)實(shí)應(yīng)用中,使得人機(jī)交互便捷高效。針對(duì)目標(biāo)檢測(cè)技術(shù),研究基于可變部件模型(DPM)的目標(biāo)檢測(cè)算法。該算法使用的基本特征為改進(jìn)的HOG特征,融合了符號(hào)梯度和無符號(hào)梯度的信息,進(jìn)行了適當(dāng)簡(jiǎn)化,保留了有用信息,又簡(jiǎn)化了計(jì)算。特征金字塔實(shí)現(xiàn)了對(duì)目標(biāo)的多尺度檢測(cè)。采用根模型和部件模型的組合檢測(cè)方式,允許目標(biāo)有適當(dāng)?shù)淖冃。針?duì)目標(biāo)位置測(cè)量,研究采用雙目測(cè)距技術(shù),經(jīng)過相機(jī)成像、鏡頭畸變、參數(shù)標(biāo)定和視差匹配等流程,提出基于邊緣特征的改進(jìn)SGBM算法,求得目標(biāo)的三維坐標(biāo),構(gòu)建軟件平臺(tái)...
【文章來源】:西南交通大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
谷歌眼鏡
西南交通大學(xué)碩士研究生學(xué)位論文第2頁(yè)1.2國(guó)內(nèi)外研究現(xiàn)狀增強(qiáng)現(xiàn)實(shí)設(shè)備具有高效、豐富和便捷等特點(diǎn),被認(rèn)為會(huì)取代智能手機(jī),成為下一代交互平臺(tái),將世界聯(lián)系的更加緊密[10],成為未來萬物互聯(lián)的物聯(lián)網(wǎng)世界中重要的一環(huán)。1.2.1國(guó)外研究現(xiàn)狀增強(qiáng)現(xiàn)實(shí)技術(shù)源于國(guó)外,發(fā)展程度快得多。2012年4月,Google的秘密實(shí)驗(yàn)室小組開發(fā)了一款頭戴式設(shè)備,采用特殊設(shè)計(jì),將投影出來的場(chǎng)景反射到視網(wǎng)膜,實(shí)現(xiàn)虛實(shí)結(jié)合[11]。圖1-1谷歌眼鏡該設(shè)備功能十分豐富,日常的溝通交流、文件處理和游戲娛樂都可以實(shí)現(xiàn)。具體的結(jié)構(gòu)包括攝像頭、一個(gè)光線調(diào)節(jié)多邊形棱柱和搭載這些部件的鏡框,如圖1-1所示。工作時(shí),虛擬數(shù)字內(nèi)容從一個(gè)極小的發(fā)射裝置發(fā)出,經(jīng)過平面反射和透鏡折射到穿戴者的視網(wǎng)膜上,形成一塊虛擬屏幕,將虛擬內(nèi)容展現(xiàn)到他的身前。圖1-2波音線束組裝
西南交通大學(xué)碩士研究生學(xué)位論文第3頁(yè)增強(qiáng)現(xiàn)實(shí)設(shè)備這種實(shí)時(shí)高效的顯示功能具有極大的應(yīng)用潛力。如圖1-2所示,在飛機(jī)的線束安裝插接過程中,它可以通過實(shí)時(shí)地渲染出某處線路的分布情況和連接順序,指導(dǎo)工人快速地完成工作,省去大量指導(dǎo)文件的查閱[12],降低了操作難度。據(jù)統(tǒng)計(jì),波音公司利用該技術(shù)成功縮短操作周期0.25,降低失誤率0.5,取得了很好的效果。主要的頭戴式增強(qiáng)現(xiàn)實(shí)設(shè)備還有Meta和微軟的HoloLens,圖1-3為來自加州圣馬特奧的Meta公司發(fā)布的最新產(chǎn)品。Meta可以實(shí)現(xiàn)徒手的簡(jiǎn)單交互,雖然成像質(zhì)量一般,但可以提供90°的可視角度(FOV)[13]。Meta的宗旨是為現(xiàn)實(shí)世界披上一層數(shù)字外衣。他們希望讓自己的產(chǎn)品接替2D現(xiàn)實(shí)器,引領(lǐng)一種全新的3D顯示方式。圖1-3Meta2眼鏡微軟作為計(jì)算機(jī)技術(shù)的領(lǐng)導(dǎo)者,對(duì)這種擁有巨大潛力的技術(shù)自然不會(huì)錯(cuò)過,發(fā)布了HoloLens系列產(chǎn)品。2017年開始登陸中國(guó)市場(chǎng)并開售,它發(fā)展的不快,卻是目前性能最高的混合現(xiàn)實(shí)設(shè)備,已經(jīng)涉及到了工程、設(shè)計(jì)、醫(yī)藥和建筑等方面的應(yīng)用[14]。圖1-4MicrosoftHoloLens
本文編號(hào):2963611
【文章來源】:西南交通大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
谷歌眼鏡
西南交通大學(xué)碩士研究生學(xué)位論文第2頁(yè)1.2國(guó)內(nèi)外研究現(xiàn)狀增強(qiáng)現(xiàn)實(shí)設(shè)備具有高效、豐富和便捷等特點(diǎn),被認(rèn)為會(huì)取代智能手機(jī),成為下一代交互平臺(tái),將世界聯(lián)系的更加緊密[10],成為未來萬物互聯(lián)的物聯(lián)網(wǎng)世界中重要的一環(huán)。1.2.1國(guó)外研究現(xiàn)狀增強(qiáng)現(xiàn)實(shí)技術(shù)源于國(guó)外,發(fā)展程度快得多。2012年4月,Google的秘密實(shí)驗(yàn)室小組開發(fā)了一款頭戴式設(shè)備,采用特殊設(shè)計(jì),將投影出來的場(chǎng)景反射到視網(wǎng)膜,實(shí)現(xiàn)虛實(shí)結(jié)合[11]。圖1-1谷歌眼鏡該設(shè)備功能十分豐富,日常的溝通交流、文件處理和游戲娛樂都可以實(shí)現(xiàn)。具體的結(jié)構(gòu)包括攝像頭、一個(gè)光線調(diào)節(jié)多邊形棱柱和搭載這些部件的鏡框,如圖1-1所示。工作時(shí),虛擬數(shù)字內(nèi)容從一個(gè)極小的發(fā)射裝置發(fā)出,經(jīng)過平面反射和透鏡折射到穿戴者的視網(wǎng)膜上,形成一塊虛擬屏幕,將虛擬內(nèi)容展現(xiàn)到他的身前。圖1-2波音線束組裝
西南交通大學(xué)碩士研究生學(xué)位論文第3頁(yè)增強(qiáng)現(xiàn)實(shí)設(shè)備這種實(shí)時(shí)高效的顯示功能具有極大的應(yīng)用潛力。如圖1-2所示,在飛機(jī)的線束安裝插接過程中,它可以通過實(shí)時(shí)地渲染出某處線路的分布情況和連接順序,指導(dǎo)工人快速地完成工作,省去大量指導(dǎo)文件的查閱[12],降低了操作難度。據(jù)統(tǒng)計(jì),波音公司利用該技術(shù)成功縮短操作周期0.25,降低失誤率0.5,取得了很好的效果。主要的頭戴式增強(qiáng)現(xiàn)實(shí)設(shè)備還有Meta和微軟的HoloLens,圖1-3為來自加州圣馬特奧的Meta公司發(fā)布的最新產(chǎn)品。Meta可以實(shí)現(xiàn)徒手的簡(jiǎn)單交互,雖然成像質(zhì)量一般,但可以提供90°的可視角度(FOV)[13]。Meta的宗旨是為現(xiàn)實(shí)世界披上一層數(shù)字外衣。他們希望讓自己的產(chǎn)品接替2D現(xiàn)實(shí)器,引領(lǐng)一種全新的3D顯示方式。圖1-3Meta2眼鏡微軟作為計(jì)算機(jī)技術(shù)的領(lǐng)導(dǎo)者,對(duì)這種擁有巨大潛力的技術(shù)自然不會(huì)錯(cuò)過,發(fā)布了HoloLens系列產(chǎn)品。2017年開始登陸中國(guó)市場(chǎng)并開售,它發(fā)展的不快,卻是目前性能最高的混合現(xiàn)實(shí)設(shè)備,已經(jīng)涉及到了工程、設(shè)計(jì)、醫(yī)藥和建筑等方面的應(yīng)用[14]。圖1-4MicrosoftHoloLens
本文編號(hào):2963611
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2963611.html
最近更新
教材專著