海量天文光譜數(shù)據(jù)中白矮主序雙星的發(fā)現(xiàn)研究
發(fā)布時間:2017-04-13 05:01
本文關(guān)鍵詞:海量天文光譜數(shù)據(jù)中白矮主序雙星的發(fā)現(xiàn)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著世界各國的各大天文臺的落成與不斷地運行,天文數(shù)據(jù)也在以驚人的速度飛速地增長,對海量天文數(shù)據(jù)的處理也成為了目前天文領(lǐng)域迫切需要解決的問題。這些海量的數(shù)據(jù)包含了測光數(shù)據(jù),光譜數(shù)據(jù)和天文圖像數(shù)據(jù)等多種數(shù)據(jù),本文主要針對天體光譜數(shù)據(jù)的預(yù)處理和自動分類進(jìn)行研究,因為海量的光譜數(shù)據(jù)中隱含著很多時變天體、稀少天體,甚至還有一些未知天體,而特殊天體的發(fā)現(xiàn)對天文領(lǐng)域的一些宇宙演變規(guī)律以及研究生命的起源等都有著特殊的意義。雖然有了這些天體的光譜數(shù)據(jù),但是仍然無法確定他們的類型,僅僅靠天文觀測來發(fā)現(xiàn)新天體是非常困難的,工作量也很龐大,所以很多計算機領(lǐng)域研究者著重于研究光譜的自動分類的方法,也有很多研究者研究挖掘特殊天體的方法。研究發(fā)現(xiàn)很多研究人員在使用計算機的自動分類技術(shù)來完成恒星光譜的自動分類工作,而特殊天體的發(fā)現(xiàn)是其中一個非常重要的研究領(lǐng)域。本文主要針對斯隆數(shù)字巡天發(fā)布的相關(guān)的海量光譜數(shù)據(jù)進(jìn)行分析,重點研究了特殊天體的光譜數(shù)據(jù)特征,分析光譜數(shù)據(jù)的高維特征,找出適合高維光譜數(shù)據(jù)的降維算法,確定其最佳維數(shù)特征;并通過算法的比較和優(yōu)化構(gòu)造不同的分類模型,最終通過實驗對比確定最終的高準(zhǔn)確率的分類模型。目的是發(fā)現(xiàn)新的特殊天體WDMS (WhiteDwarf+M Sequence Binaries,白矮主序雙星),從而對前人已發(fā)現(xiàn)的結(jié)果進(jìn)行補充,為天體演化、密度分布、結(jié)構(gòu)等問題提供了更好的條件,同時也為進(jìn)一步探究銀河系的形成與演化起到了不可或缺的作用。本文研究了高維的天體光譜數(shù)據(jù)的有效的特征提取方法并確定WDMS的最佳降維維數(shù)。分別研究了線性特征提取方法和非線性特征提取方法對高維的光譜數(shù)據(jù)進(jìn)行降維。針對線性特征提取方法主要使用了PCA(主變量分析)的方法提取光譜的主要特征值構(gòu)造光譜特征矩陣,通過主成分分析,能夠從樣本集中找到一組變換基P。針對非線性性的方法主要使用了流形學(xué)習(xí)算法:等距特征映射(Isometric Feature Mapping, ISOMAP);和深度學(xué)習(xí)的棧式自編碼(SAE)。ISOMAP采用了微分幾何中的測地線距離,而非歐式距離;棧式自編碼器能夠?qū)π螺斎氲墓庾V數(shù)據(jù)進(jìn)行特征提取,利用訓(xùn)練得到的權(quán)值和光譜進(jìn)行線性組合即可得到特征光譜數(shù)據(jù)。最后對線性與非線性的特征提取方法進(jìn)行對比,從時間效率和準(zhǔn)確度上確定更適合高維光譜數(shù)據(jù)的特征提取方法,并最終與分類算法結(jié)合確定WDMS的最佳維數(shù)特征。本文的主要創(chuàng)新點有:1.使用深度學(xué)習(xí)實現(xiàn)對低信噪比的光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)降維。因為對于高信噪比的光譜數(shù)據(jù)使用線性的特征提取方法能夠得到較高的分類準(zhǔn)確率,但是對于低信噪比光譜數(shù)據(jù)分類效果不是很好,目前大多數(shù)的WDMS的研究者都主要研究信噪比高的光譜,而低信噪比的光譜由于光譜特征不夠明顯,所以研究上有一定的困難性,而本文通過實驗證明深度學(xué)習(xí)對于低信噪比的光譜數(shù)據(jù)也有很好的特征提取的效果。2. WDMS的分類模型構(gòu)造;诖_定好的降維算法,構(gòu)造了不同的分類模型,并對比了不同分類模型的分類效果,最終確定了針對SDSS(斯隆數(shù)字巡天)發(fā)布的DR10的全部數(shù)據(jù)的分類模型。該模型是通過對分類算法和聚類算法的分類的準(zhǔn)確率進(jìn)行對比,然后將二者進(jìn)行整合,利用聚類算法剔除大量的非WDMS,然后對剩余的光譜采用分類的方法,并對分類方法進(jìn)行優(yōu)化,提出了一個基于聚類+分類的高準(zhǔn)確率的WDMS的發(fā)現(xiàn)模型。最終通過該模型在DR10中共找出了4986個結(jié)果,其中4240個是WDMS,經(jīng)過驗證目前沒有被發(fā)現(xiàn)的有22個。實驗表明使用有效的數(shù)據(jù)挖掘方法進(jìn)行特殊天體的自動搜索快速、準(zhǔn)確率高、分類效果明顯,可以將此方法應(yīng)用到其他的望遠(yuǎn)鏡數(shù)據(jù)上。3.對已發(fā)現(xiàn)的WDMS構(gòu)造顏色特征模型。Szkody提出的測光判據(jù)為相關(guān)研究提供了有效的可行性依據(jù),本論文通過構(gòu)建具有多項式特性的高維映射神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò),對WDMS的顏色特征進(jìn)行深度探索,擬合出分類效果更佳明顯的顏色特征模型,從而將該模型使用到SDSS發(fā)布的測光數(shù)據(jù)中,可以對海量的測光數(shù)據(jù)進(jìn)行有效的數(shù)據(jù)篩選,從而大大提高了數(shù)據(jù)挖掘的效率。同時將該模型作為前面分類模型的數(shù)據(jù)預(yù)處理模型,完成海量數(shù)據(jù)挖掘的數(shù)據(jù)篩選工作,然后使用分類模型完成分類工作,實現(xiàn)了分類模型的時間效率的改進(jìn),在分類的準(zhǔn)確率上也得到了一定的提高。
【關(guān)鍵詞】:WDMS 數(shù)據(jù)挖掘 ISOMAP 支持向量機 神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí)
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:P145.5;TP311.13
【目錄】:
- 摘要9-11
- ABSTRACT11-14
- 第1章 緒論14-26
- 1.1 研究背景和意義14-16
- 1.2 天文光譜數(shù)據(jù)研究16-22
- 1.2.1 巡天項目16-18
- 1.2.2 特殊天體WDMS研究18-22
- 1.3 天文數(shù)據(jù)挖掘的研究現(xiàn)狀22-23
- 1.4 本文的主要研究內(nèi)容23-24
- 1.5 本文的主要工作和創(chuàng)新點24-25
- 1.6 論文的組織結(jié)構(gòu)25-26
- 第2章 WDMS特征提取與最佳維數(shù)確定26-48
- 2.1 WDMS光譜實驗數(shù)據(jù)26-28
- 2.2 線性特征提取28-32
- 2.2.1 算法研究28-29
- 2.2.2 基于PCA的光譜數(shù)據(jù)降維29-32
- 2.3 非線性特征提取32-42
- 2.3.1 算法研究32-35
- 2.3.2 基于ISOMAP的光譜數(shù)據(jù)降維35-37
- 2.3.3 基于深度學(xué)習(xí)的光譜數(shù)據(jù)降維37-42
- 2.4 WDMS最佳維數(shù)確定42-45
- 2.4.1 PCA最佳維數(shù)確定42-43
- 2.4.2 ISOMAP最佳維數(shù)確定43-44
- 2.4.3 棧式自編碼最佳維數(shù)確定44-45
- 2.5 實驗結(jié)果分析45-47
- 2.6 本章小結(jié)47-48
- 第3章 WDMS分類模型構(gòu)造48-69
- 3.1 聚類算法研究48-52
- 3.1.1 聚類算法48-49
- 3.1.2 WDMS的聚類實現(xiàn)49-52
- 3.2 分類算法研究52-54
- 3.3 支持向量機的參數(shù)優(yōu)化54-60
- 3.3.1 優(yōu)化算法研究54-57
- 3.3.2 基于PSO的參數(shù)優(yōu)化57-58
- 3.3.3 實驗結(jié)果分析58-60
- 3.4 構(gòu)造WDMS分類模型60-68
- 3.4.1 構(gòu)造ISOMAP與優(yōu)化支持向量機模型61-62
- 3.4.2 構(gòu)造k近鄰聚類預(yù)處理模型62-64
- 3.4.3 構(gòu)造棧式自編碼深度提取模型64-65
- 3.4.4 構(gòu)建One-VS-All多類別自動分類模型65-66
- 3.4.5 組合模型實驗對比66-68
- 3.5 本章小結(jié)68-69
- 第4章 WDMS顏色特征建模69-80
- 4.1 建模算法研究69-72
- 4.2 WDMS顏色特征模型構(gòu)造72-77
- 4.2.1 多項式神經(jīng)網(wǎng)絡(luò)建模72-74
- 4.2.2 徑向基神經(jīng)網(wǎng)絡(luò)建模74-75
- 4.2.3 實驗數(shù)據(jù)75
- 4.2.4 實驗過程75-77
- 4.3 實驗結(jié)果分析77-79
- 4.4 本章小結(jié)79-80
- 第5章 總結(jié)與展望80-82
- 5.1 本文總結(jié)80-81
- 5.2 研究展望81-82
- 參考文獻(xiàn)82-88
- 致謝88-89
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄89-90
- 攻讀學(xué)位期間參與科研項目情況90-91
- 發(fā)表論文91-109
- 附件109
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 覃冬梅,胡占義,趙永恒;基于支撐矢量機的天體光譜自動分類方法[J];光譜學(xué)與光譜分析;2004年04期
2 姜斌;羅阿理;趙永恒;;海量光譜中激變變星候選體的數(shù)據(jù)挖掘[J];光譜學(xué)與光譜分析;2011年08期
3 羅阿理,趙永恒;使用小波技術(shù)自動搜尋天體譜線[J];天體物理學(xué)報;2000年04期
4 ;New supernova candidates from the SDSS-DR7 spectral survey[J];Research in Astronomy and Astrophysics;2009年06期
本文關(guān)鍵詞:海量天文光譜數(shù)據(jù)中白矮主序雙星的發(fā)現(xiàn)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:302831
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/302831.html
最近更新
教材專著