基于黎曼流形優(yōu)化的數(shù)據(jù)降維表達及應用
發(fā)布時間:2021-11-16 01:08
大數(shù)據(jù)時代,計算機和多媒體技術迅速發(fā)展,每時每刻都在生成大量的圖像和視頻數(shù)據(jù)。面對如此海量的數(shù)據(jù),不僅有效識別它們已經(jīng)成為一項巨大挑戰(zhàn),甚至簡單的存儲和讀取都會存在困難。數(shù)據(jù)降維表達是解決數(shù)據(jù)存儲、讀取及識別等問題的一種重要手段。因此數(shù)據(jù)降維表達已成為人們廣泛關注的課題,并取得了豐碩成果。傳統(tǒng)的數(shù)據(jù)降維表達方法主要是基于歐氏空間進行建模和優(yōu)化。在歐氏空間中處理一些具有約束的問題常常使用拉格朗日法或貪婪算法,而這些方法往往會導致次優(yōu)解的生成。為了在數(shù)值計算中獲得更精確的數(shù)值解,黎曼流形優(yōu)化開辟了一個新的方向。采用黎曼流形優(yōu)化有兩個顯著的優(yōu)勢:第一,對于許多具有黎曼幾何結(jié)構(gòu)約束的優(yōu)化問題,通過黎曼流形上的優(yōu)化可以更好地利用約束空間的幾何結(jié)構(gòu),轉(zhuǎn)化為黎曼流形上的無約束優(yōu)化問題,從而獲得更精確的數(shù)值解。第二,通過引入適當?shù)亩攘?可以將某些歐氏空間中的非凸問題轉(zhuǎn)化為黎曼流形上的凸問題,進而改善數(shù)值計算方法,獲得全局最優(yōu)解。鑒于黎曼流形優(yōu)化的優(yōu)勢,本文研究黎曼流形上數(shù)據(jù)降維模型的建立和優(yōu)化問題。論文的主要創(chuàng)新性工作包括以下幾個方面:第一,針對黎曼流形優(yōu)化算法使用函數(shù)一階信息收斂速度慢的問題,本文提...
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:109 頁
【學位級別】:博士
【部分圖文】:
黎曼流形上的最速下降法Figure1-1ThesteepestdescentmethodonRiemannianmanifolds
圖 1-2 二維主成分分析結(jié)構(gòu)示意圖Figure 1-2 The framework of 2DPCA1.2.2.1 基于主成分分析的降維表達真實數(shù)據(jù)常常具有高維度和信息冗余的特征。主成分分析(PrincipComponent Analysis,PCA)[19][20]是從具有噪聲數(shù)據(jù)中提取低維特征的一種有效工具。主成分分析認為高維數(shù)據(jù)的本征信息蘊含在一個低維空間中,表現(xiàn)為低維特征,這個低維特征決定了高維數(shù)據(jù)的變化。主成分分析通過投影矩陣,把高維數(shù)據(jù)線性的映射到低維空間中,尋找低維本征信息。主成分分析一般基于最小重構(gòu)誤差和最大可分性建模,其出發(fā)點分別是低維數(shù)據(jù)保留最大量的高維數(shù)據(jù)的信息和低維數(shù)據(jù)具有最大的可分性。主成分分析廣泛應用于圖像分析[21][22]、模式識別[23][24]和機器學習領域[25]中。傳統(tǒng)的主成分分析方法,主要針對向量化的數(shù)據(jù)。向量化雖然可以簡化計算,但該過程可能導致數(shù)據(jù)的維度災難,而且也必然破壞二維數(shù)據(jù)的結(jié)構(gòu),丟失二維數(shù)據(jù)中的結(jié)構(gòu)信息。為了保持二維數(shù)據(jù)的結(jié)構(gòu)信息,文獻[26][27]中,作者提出了二維主成分分
8(c)圖 1-3 關于 (a)多線性回歸,(b)主成分回歸,和(c)偏最小二乘回歸的示意圖Figure 1-3 The graphical representation of (a) Multiple linear regression, (b) Principlcomponent regression, and (c) Partial least square regression為了避免過擬合問題,稀疏偏最小二乘回歸[78][79]關鍵的步驟是提取主成選取適當?shù)膮?shù)對投影矩陣進行約束,使投影矩陣具有稀疏性,從而潛在分數(shù)據(jù)之間稀疏的線性組合。稀疏偏最小二乘回歸對生物組學數(shù)據(jù),光譜波長及定量分析中取得較好的效果。當數(shù)據(jù) 和 在歐氏空間中具有復雜的非線性回歸關系時,偏最小二乘回
本文編號:3497877
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:109 頁
【學位級別】:博士
【部分圖文】:
黎曼流形上的最速下降法Figure1-1ThesteepestdescentmethodonRiemannianmanifolds
圖 1-2 二維主成分分析結(jié)構(gòu)示意圖Figure 1-2 The framework of 2DPCA1.2.2.1 基于主成分分析的降維表達真實數(shù)據(jù)常常具有高維度和信息冗余的特征。主成分分析(PrincipComponent Analysis,PCA)[19][20]是從具有噪聲數(shù)據(jù)中提取低維特征的一種有效工具。主成分分析認為高維數(shù)據(jù)的本征信息蘊含在一個低維空間中,表現(xiàn)為低維特征,這個低維特征決定了高維數(shù)據(jù)的變化。主成分分析通過投影矩陣,把高維數(shù)據(jù)線性的映射到低維空間中,尋找低維本征信息。主成分分析一般基于最小重構(gòu)誤差和最大可分性建模,其出發(fā)點分別是低維數(shù)據(jù)保留最大量的高維數(shù)據(jù)的信息和低維數(shù)據(jù)具有最大的可分性。主成分分析廣泛應用于圖像分析[21][22]、模式識別[23][24]和機器學習領域[25]中。傳統(tǒng)的主成分分析方法,主要針對向量化的數(shù)據(jù)。向量化雖然可以簡化計算,但該過程可能導致數(shù)據(jù)的維度災難,而且也必然破壞二維數(shù)據(jù)的結(jié)構(gòu),丟失二維數(shù)據(jù)中的結(jié)構(gòu)信息。為了保持二維數(shù)據(jù)的結(jié)構(gòu)信息,文獻[26][27]中,作者提出了二維主成分分
8(c)圖 1-3 關于 (a)多線性回歸,(b)主成分回歸,和(c)偏最小二乘回歸的示意圖Figure 1-3 The graphical representation of (a) Multiple linear regression, (b) Principlcomponent regression, and (c) Partial least square regression為了避免過擬合問題,稀疏偏最小二乘回歸[78][79]關鍵的步驟是提取主成選取適當?shù)膮?shù)對投影矩陣進行約束,使投影矩陣具有稀疏性,從而潛在分數(shù)據(jù)之間稀疏的線性組合。稀疏偏最小二乘回歸對生物組學數(shù)據(jù),光譜波長及定量分析中取得較好的效果。當數(shù)據(jù) 和 在歐氏空間中具有復雜的非線性回歸關系時,偏最小二乘回
本文編號:3497877
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3497877.html
最近更新
教材專著