基于激光點(diǎn)云的復(fù)雜三維場(chǎng)景多態(tài)目標(biāo)語義分割技術(shù)研究
發(fā)布時(shí)間:2020-12-06 06:32
三維激光掃描系統(tǒng)以其穩(wěn)定的環(huán)境感知能力已成為獲取三維空間信息的一種重要手段,它能夠快速獲取大規(guī)模自然場(chǎng)景的三維點(diǎn)云數(shù)據(jù)。激光點(diǎn)云含有被測(cè)場(chǎng)景物體表面豐富的語義信息,具有海量、高密度以及高精度等特性,已成為用來理解、分析和語義解譯三維自然場(chǎng)景的一種主要數(shù)據(jù)類型,被廣泛應(yīng)用于城市規(guī)劃、無人駕駛、全球制圖、智慧交通、文物保護(hù)、虛擬現(xiàn)實(shí)以及基礎(chǔ)測(cè)繪等領(lǐng)域。近年來,基于三維點(diǎn)云數(shù)據(jù)的復(fù)雜場(chǎng)景多態(tài)目標(biāo)語義分割技術(shù)的研究也已取得長(zhǎng)足的發(fā)展;然而,現(xiàn)有算法還存在如下幾個(gè)方面的問題:(1)過度依賴于人工定義的特征,提取語義類別單一;(2)數(shù)據(jù)預(yù)處理復(fù)雜,計(jì)算量大,算法復(fù)雜度高,自動(dòng)化、智能化程度較低;(3)跨平臺(tái)性差,公開基準(zhǔn)數(shù)據(jù)集短缺;(4)激光點(diǎn)云通常只包括三維坐標(biāo)和反射強(qiáng)度信息,缺少豐富的光譜信息以及點(diǎn)與點(diǎn)之間的空間拓?fù)潢P(guān)系。另外,由于真實(shí)自然場(chǎng)景復(fù)雜,三維目標(biāo)之間存在不同程度的重疊、遮擋等現(xiàn)象,研究自動(dòng)化、智能化、魯棒的復(fù)雜三維場(chǎng)景多態(tài)目標(biāo)語義分割技術(shù)及其在各個(gè)領(lǐng)域的應(yīng)用具有重要的理論價(jià)值和現(xiàn)實(shí)意義。本文針對(duì)復(fù)雜場(chǎng)景多態(tài)目標(biāo)的快速、高精度、自動(dòng)語義分割技術(shù)展開研究,主要包括以下四個(gè)方面的內(nèi)容:1...
【文章來源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁數(shù)】:149 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
HuangJ-3DCNN卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
LiDAR 點(diǎn)云數(shù)據(jù)集(包括一個(gè)機(jī)載掃描數(shù)據(jù)和四個(gè)車載掃描數(shù)據(jù))均沒有公開,后續(xù)研究者無法對(duì)文中呈現(xiàn)的各位目標(biāo)的精度進(jìn)行驗(yàn)證。因此,不同的研究人員都致力于創(chuàng)建能夠直接使用非結(jié)構(gòu)化 3D 點(diǎn)云或網(wǎng)格的深層體系結(jié)構(gòu)。比如下面要介紹的 PointNet 和PointNet++。(2)PointNetPointnet 由斯坦福大學(xué)的 Charles 等人于 2017 年 4 月提出,屬于深度學(xué)習(xí)成功應(yīng)用于三維點(diǎn)云的一項(xiàng)開創(chuàng)性的工作,以原始點(diǎn)云為深度神經(jīng)網(wǎng)絡(luò)的輸入,為分類(classification)、構(gòu)件分割(part segmentation)和場(chǎng)景語義分割(semantic segmentation)提供了統(tǒng)一的體系結(jié)構(gòu)。圖 1.2 顯示了其網(wǎng)絡(luò)結(jié)構(gòu),包含分類和分割兩個(gè)子結(jié)構(gòu)。網(wǎng)絡(luò)輸入 n*3 的數(shù)據(jù),n就是采樣點(diǎn)的個(gè)數(shù),3 表示三維坐標(biāo)。經(jīng)過幾步多層感知器(Multi Layer Perceptrons, MLP)獲得 n*1024 維的采樣點(diǎn)特征,然后使用 max pooling 進(jìn)行對(duì)稱操作得到 1024 維的整體特征(global feature)。其中在分類模型(Classification)中直接經(jīng)過幾層降維輸出 softmax 分類概率,而分割模型(Segmentation)中要將整體特征串接到采樣點(diǎn)特征之后再進(jìn)行多層網(wǎng)絡(luò)輸出。
PointNet++是一種分層神經(jīng)網(wǎng)絡(luò),先對(duì)點(diǎn)云進(jìn)行采樣(sampling)和區(qū)域劃分(grouping)然后在各個(gè)小區(qū)域內(nèi)遞歸地采用 PointNet 網(wǎng)絡(luò)進(jìn)行特征提取,最后對(duì)點(diǎn)云的全局和局部特征進(jìn)行融合(把全局特征矩陣與局部特征矩陣?yán)奂樱S捎邳c(diǎn)云通常是在不同密度下采樣的,從而導(dǎo)致在均勻密度上訓(xùn)練的網(wǎng)絡(luò)的性能大大降低,為了解決非均勻點(diǎn)采樣問題,PointNet++提出了兩個(gè)新的集合抽象層,根據(jù)局部點(diǎn)密度智能地學(xué)習(xí)多尺度的特征,模型結(jié)構(gòu)如圖 1.3 所示。其重點(diǎn)就在于區(qū)域的劃分,即確定每個(gè)區(qū)域的中心位置和區(qū)域的半徑關(guān)于區(qū)域中心位置的選擇,采用了一種名為 farthest point sampling (FPS) algorithm 的采樣方法。而關(guān)于區(qū)域的半徑,提出了多尺度劃分(Multi-scale grouping, MSG)和多分辨率劃分(Multi-resolution grouping, MRG)兩種方法。前者計(jì)算量極大,因?yàn)辄c(diǎn)云數(shù)據(jù)本身屬于海量數(shù)據(jù),若一直變尺度地提取特征,特別是尺度較小時(shí),時(shí)間成本會(huì)過高。而后者將從較低層提取的特征與通過 PointNet 處理局部區(qū)域中的原始點(diǎn)獲得的特征進(jìn)行融合,這樣不但可以避免這種昂貴的計(jì)算,同時(shí)還保留了根據(jù)點(diǎn)的分布特性自適應(yīng)地聚合信息的能力。PointNet++在 ScanNet 數(shù)據(jù)集上取得了 73.9%的準(zhǔn)確率,但 ScanNet 為大規(guī)模 3D 室內(nèi)場(chǎng)景RGB-D 數(shù)據(jù)集,而非點(diǎn)云數(shù)據(jù)集,該模型沒有提供在 Stanford 2D-3D-S 上的分割結(jié)果。
本文編號(hào):2900900
【文章來源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁數(shù)】:149 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
HuangJ-3DCNN卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
LiDAR 點(diǎn)云數(shù)據(jù)集(包括一個(gè)機(jī)載掃描數(shù)據(jù)和四個(gè)車載掃描數(shù)據(jù))均沒有公開,后續(xù)研究者無法對(duì)文中呈現(xiàn)的各位目標(biāo)的精度進(jìn)行驗(yàn)證。因此,不同的研究人員都致力于創(chuàng)建能夠直接使用非結(jié)構(gòu)化 3D 點(diǎn)云或網(wǎng)格的深層體系結(jié)構(gòu)。比如下面要介紹的 PointNet 和PointNet++。(2)PointNetPointnet 由斯坦福大學(xué)的 Charles 等人于 2017 年 4 月提出,屬于深度學(xué)習(xí)成功應(yīng)用于三維點(diǎn)云的一項(xiàng)開創(chuàng)性的工作,以原始點(diǎn)云為深度神經(jīng)網(wǎng)絡(luò)的輸入,為分類(classification)、構(gòu)件分割(part segmentation)和場(chǎng)景語義分割(semantic segmentation)提供了統(tǒng)一的體系結(jié)構(gòu)。圖 1.2 顯示了其網(wǎng)絡(luò)結(jié)構(gòu),包含分類和分割兩個(gè)子結(jié)構(gòu)。網(wǎng)絡(luò)輸入 n*3 的數(shù)據(jù),n就是采樣點(diǎn)的個(gè)數(shù),3 表示三維坐標(biāo)。經(jīng)過幾步多層感知器(Multi Layer Perceptrons, MLP)獲得 n*1024 維的采樣點(diǎn)特征,然后使用 max pooling 進(jìn)行對(duì)稱操作得到 1024 維的整體特征(global feature)。其中在分類模型(Classification)中直接經(jīng)過幾層降維輸出 softmax 分類概率,而分割模型(Segmentation)中要將整體特征串接到采樣點(diǎn)特征之后再進(jìn)行多層網(wǎng)絡(luò)輸出。
PointNet++是一種分層神經(jīng)網(wǎng)絡(luò),先對(duì)點(diǎn)云進(jìn)行采樣(sampling)和區(qū)域劃分(grouping)然后在各個(gè)小區(qū)域內(nèi)遞歸地采用 PointNet 網(wǎng)絡(luò)進(jìn)行特征提取,最后對(duì)點(diǎn)云的全局和局部特征進(jìn)行融合(把全局特征矩陣與局部特征矩陣?yán)奂樱S捎邳c(diǎn)云通常是在不同密度下采樣的,從而導(dǎo)致在均勻密度上訓(xùn)練的網(wǎng)絡(luò)的性能大大降低,為了解決非均勻點(diǎn)采樣問題,PointNet++提出了兩個(gè)新的集合抽象層,根據(jù)局部點(diǎn)密度智能地學(xué)習(xí)多尺度的特征,模型結(jié)構(gòu)如圖 1.3 所示。其重點(diǎn)就在于區(qū)域的劃分,即確定每個(gè)區(qū)域的中心位置和區(qū)域的半徑關(guān)于區(qū)域中心位置的選擇,采用了一種名為 farthest point sampling (FPS) algorithm 的采樣方法。而關(guān)于區(qū)域的半徑,提出了多尺度劃分(Multi-scale grouping, MSG)和多分辨率劃分(Multi-resolution grouping, MRG)兩種方法。前者計(jì)算量極大,因?yàn)辄c(diǎn)云數(shù)據(jù)本身屬于海量數(shù)據(jù),若一直變尺度地提取特征,特別是尺度較小時(shí),時(shí)間成本會(huì)過高。而后者將從較低層提取的特征與通過 PointNet 處理局部區(qū)域中的原始點(diǎn)獲得的特征進(jìn)行融合,這樣不但可以避免這種昂貴的計(jì)算,同時(shí)還保留了根據(jù)點(diǎn)的分布特性自適應(yīng)地聚合信息的能力。PointNet++在 ScanNet 數(shù)據(jù)集上取得了 73.9%的準(zhǔn)確率,但 ScanNet 為大規(guī)模 3D 室內(nèi)場(chǎng)景RGB-D 數(shù)據(jù)集,而非點(diǎn)云數(shù)據(jù)集,該模型沒有提供在 Stanford 2D-3D-S 上的分割結(jié)果。
本文編號(hào):2900900
本文鏈接:http://www.sikaile.net/kejilunwen/dianzigongchenglunwen/2900900.html
最近更新
教材專著