高維復雜數(shù)據(jù)網(wǎng)絡與節(jié)點屬性的統(tǒng)計推斷
本文選題:矩陣奇異值分解 切入點:Wilks 出處:《青島大學》2017年碩士論文 論文類型:學位論文
【摘要】:本文首先研究兩個相關關系矩陣(對稱矩陣或非對稱矩陣)之間的相關關系,給出預測并解決如下問題:網(wǎng)絡間相關性檢驗以及高維網(wǎng)絡中包含不可觀測的潛變量結(jié)構(gòu)問題。對網(wǎng)絡(相關系數(shù)矩陣)進行矩陣奇異值分解(SVD)獲取低秩因子(潛變量),對低秩因子構(gòu)建Wilks’Lambda統(tǒng)計量以檢驗網(wǎng)絡間的相關性。若檢驗顯示存在顯著線性關系,則對低秩因子構(gòu)建線性回歸模型。若檢驗結(jié)果顯示非線性關系,采用非線性模型,并使用極大似然估計法對模型參數(shù)進行估計。獲取待估低秩因子(潛變量)后,可使用矩陣奇異值分解等方法對低秩因子進行還原,進而可以對網(wǎng)絡中缺失地相關關系進行填補,對潛在相關關系進行預測。其次,受正態(tài)分布下的精度矩陣相關性質(zhì)對缺失值識別的啟發(fā),對一般連續(xù)型分布的樣本通過高斯Copula模型轉(zhuǎn)換至正態(tài)分布中以識別該分布下缺失值。通過該步預測,為之后的缺失值填補提供合理有效的判斷和解釋。并針對高維復雜數(shù)據(jù)的稀疏性、混合數(shù)據(jù)等特性分別引入逆回歸模型,混合數(shù)據(jù)的潛變量高斯Copula模型等方法以解決相應的問題,為模型推廣至高維復雜數(shù)據(jù)中提供理論支持。最后,通過數(shù)值模擬小樣本下模型結(jié)構(gòu),通過對對稱網(wǎng)絡回歸系數(shù)、缺失值填補、未知節(jié)點關系、以及非對稱網(wǎng)絡缺失值填補預測等四個實驗模擬,發(fā)現(xiàn)各評價指標顯示相較于對比方法,模型效果較好,且隨著數(shù)據(jù)維度增加,模型效果更佳。在實證分析章節(jié),對四個包括藥物結(jié)構(gòu)相似性、靶點蛋白序列相似性和藥物與靶點相互作用的數(shù)據(jù)集進行分析,一致發(fā)現(xiàn)在相似性檢驗以及模型預測過程中均優(yōu)于對比方法,尤其在降維過程中,降維效果顯著。
[Abstract]:In this paper, we first study the correlation between two correlation matrices (symmetric matrix or asymmetric matrix). The following problems are given to predict and solve the following problems: the correlation test between networks and the structure of non-observable latent variables in high-dimensional networks. The low rank factors are obtained by matrix singular value decomposition (SVD) for the network (correlation coefficient matrix). For low rank factors, Wilks'Lambda statistics are constructed to test the correlation between networks. If the test shows a significant linear relationship, Then a linear regression model is constructed for low rank factors. If the test results show a nonlinear relationship, the nonlinear model is used and the parameters of the model are estimated by using the maximum likelihood estimation method. After obtaining the low rank factors (latent variables) to be estimated, The method of matrix singular value decomposition can be used to restore the low rank factor, and then the missing correlation can be filled, and the potential correlation can be predicted. Inspired by the correlation property of precision matrix under normal distribution, the samples of general continuous distribution are transformed to normal distribution by Gao Si Copula model to recognize the missing value under this distribution. It provides reasonable and effective judgment and explanation for filling the missing value, and introduces inverse regression model for the characteristics of high dimensional complex data such as sparsity, mixed data and so on. Gao Si Copula model of mixed data is used to solve the corresponding problems, which provides theoretical support for extending the model to high dimensional complex data. Finally, through numerical simulation of the model structure under small samples, the regression coefficient of symmetric network is obtained. Four experimental simulations, including missing value filling, unknown node relationship and asymmetric network missing value filling prediction, show that each evaluation index shows a better effect than the contrast method, and with the increase of data dimension, the model has a better effect. The model works better. In the empirical analysis chapter, four data sets including drug structural similarity, target protein sequence similarity and drug / target interaction are analyzed. It is found that the method is better than the contrast method in the process of similarity test and model prediction, especially in the process of dimensionality reduction.
【學位授予單位】:青島大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:O212.1
【相似文獻】
相關期刊論文 前10條
1 李平,王椿鏞,許厚澤,熊熊;地球物理反演中奇異值分解應用的若干問題探討[J];自然科學進展;2001年08期
2 夏江海;;奇異值分解在位場資料處理中的應用[J];物探化探計算技術;1989年02期
3 王懋基,宋正范;奇異值分解在二維半多邊形體ΔT異常最優(yōu)化反演中的應用[J];物探與化探;1991年01期
4 張友民,李慶國,戴冠中,,張洪才;基于奇異值分解的遞推辨識方法[J];控制理論與應用;1995年02期
5 羅鐵堅;程福興;周佳;;融合奇異值分解和動態(tài)轉(zhuǎn)移鏈的學術資源推薦模型(英文)[J];中國科學院大學學報;2014年02期
6 聶守平,魏曉燕;數(shù)字圖像的奇異值分解[J];南京師大學報(自然科學版);2001年01期
7 王瀟,柏森,趙波;基于奇異值分解與融合的音頻盲認證算法[J];中山大學學報(自然科學版);2004年S2期
8 張煥萍;尹佟明;鄭建冬;;基于奇異值分解的致病基因挖掘算法[J];南京航空航天大學學報;2013年02期
9 常麗萍;沈衛(wèi)星;林尊琪;;基于奇異值分解的數(shù)字波前擬合算法[J];光學學報;2006年11期
10 彭培英;申永軍;李黎陽;;基于奇異值分解技術的離心機故障診斷[J];動力學與控制學報;2008年02期
相關會議論文 前10條
1 張友民;陳洪亮;戴冠中;;基于奇異值分解的固定區(qū)間平滑新方法[A];1995年中國控制會議論文集(上)[C];1995年
2 何田;王立清;劉獻棟;朱永波;;基于奇異值分解的信號處理機理及其應用[A];2008年航空試驗測試技術峰會論文集[C];2008年
3 張霄;林鴻飛;楊志豪;;基于奇異值分解的蛋白質(zhì)關系抽取[A];第五屆全國信息檢索學術會議論文集[C];2009年
4 曹云麗;郭勤濤;徐堯;周瑾;;基于奇異值分解響應面方法的磁軸承轉(zhuǎn)子參數(shù)識別[A];第11屆全國轉(zhuǎn)子動力學學術討論會(ROTDYN2014)論文集(上冊)[C];2014年
5 吳曉穎;吳俊;董濱江;;TK方法在γ譜分析中的應用[A];第7屆全國核電子學與核探測技術學術年會論文集(三)[C];1994年
6 林原;林鴻飛;蘇綏;;一種應用奇異值分解的RankBoost排序?qū)W習方法[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
7 金宋友;趙志文;;一種基于奇異值分解盲水印算法[A];圖像圖形技術與應用進展——第三屆圖像圖形技術與應用學術會議論文集[C];2008年
8 趙衛(wèi)國;翟自勇;王子君;;基于奇異值分解和神經(jīng)網(wǎng)絡的數(shù)字圖像水印算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
9 岳紅;蔣慰孫;;基于奇異值分解的改進Bayes集員辨識遞推算法[A];1995中國控制與決策學術年會論文集[C];1995年
10 王麗娟;谷根代;;對稱矩陣非齊次特征值的敏感性分析[A];邏輯學及其應用研究——第四屆全國邏輯系統(tǒng)、智能科學與信息科學學術會議論文集[C];2008年
相關博士學位論文 前5條
1 劉正才;測繪工作中甚大規(guī)模對稱矩陣管理的理論和方法研究[D];中南大學;2008年
2 牟谷芳;矩陣完備化和圖的最小秩問題[D];電子科技大學;2015年
3 盧越;矩陣優(yōu)化問題的數(shù)值算法[D];大連理工大學;2015年
4 劉鑫吉;基于糾錯碼的確定性測量矩陣分析與構(gòu)造[D];清華大學;2016年
5 周富照;幾類約束矩陣方程及其最佳逼近[D];湖南大學;2003年
相關碩士學位論文 前10條
1 廖希洋;高維復雜數(shù)據(jù)網(wǎng)絡與節(jié)點屬性的統(tǒng)計推斷[D];青島大學;2017年
2 相桂芳;MFA與SVD模糊融合的人臉識別研究[D];合肥工業(yè)大學;2015年
3 聶振國;基于奇異值分解的信號處理關鍵技術研究[D];華南理工大學;2016年
4 夏玉丹;基于S變換和奇異值分解的自動癲癇檢測算法[D];山東大學;2016年
5 武慧娟;基于HHT特征提取的雷聲信號模式識別[D];陜西師范大學;2016年
6 鄒申申;基于手指心電信號時頻域分析的身份識別算法研究[D];杭州電子科技大學;2016年
7 曾莼;奇異值分解熵對股票指數(shù)的預測力研究[D];南京財經(jīng)大學;2016年
8 馬亞峰;基于FPGA的矩陣奇異值分解加速方案的設計與實現(xiàn)[D];北京交通大學;2017年
9 馬斌斌;基于多重奇異值分解熵的屬性約簡方法研究及應用[D];安徽大學;2017年
10 邢琮琮;重磁數(shù)據(jù)處理在青海恰卜恰地區(qū)的應用研究[D];吉林大學;2017年
本文編號:1573677
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/1573677.html