基于集成學(xué)習(xí)的激光誘導(dǎo)擊穿光譜學(xué)技術(shù)定量分析算法及應(yīng)用研究
發(fā)布時間:2021-07-27 21:42
激光誘導(dǎo)擊穿光譜學(xué)技術(shù)(Laser-Induced Breakdown Spectroscopy,LIBS)是一項新的化學(xué)分析技術(shù),由于其多種優(yōu)點目前被廣泛應(yīng)用于材料識別以及混合物定量和定性分析中。其中,LIBS定量分析方法的研究是當(dāng)前的研究熱點,可以便捷地幫助科研工作者確定混合物中的元素組成以及元素含量。因此對LIBS定量分析技術(shù)進行深入研究并提升其分析預(yù)測精度,具有重要的實際應(yīng)用價值。論文綜述了LIBS定量分析領(lǐng)域的研究工作進展,介紹了基于神經(jīng)網(wǎng)絡(luò)、基于支持向量回歸、基于隨機森林回歸的LIBS定量分析方法,并分析了各種方法的優(yōu)缺點以及應(yīng)用范圍。針對單一學(xué)習(xí)器容易受到基體效應(yīng)的影響、容易出現(xiàn)過擬合的風(fēng)險、容易被隨機產(chǎn)生的誤差影響而影響預(yù)測精度的問題,為了進一步提升LIBS定量分析方法的預(yù)測精度,并克服單一學(xué)習(xí)器的不足之處,本文提出了一種兩層結(jié)構(gòu)的基于集成學(xué)習(xí)的LIBS定量分析方法。該方法首先由基學(xué)習(xí)器選擇的流程選擇出合適的基學(xué)習(xí)器。第一層由若干個選擇的基學(xué)習(xí)器組成。將第一層的基學(xué)習(xí)器交叉驗證的過程中對驗證集的預(yù)測作為次級元學(xué)習(xí)器的輸入特征,并以此進行元學(xué)習(xí)器的訓(xùn)練,并將最終訓(xùn)練完成的...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
常見LIBS分析實驗裝置
。Bagging技術(shù)是學(xué)習(xí)結(jié)果集成的經(jīng)典例子。當(dāng)給定一個訓(xùn)練集,它首先會通過對整個訓(xùn)練集進行Bootstrap的隨機抽樣、隨機子空間、擾動、投影等方式來獲得若干個子抽樣訓(xùn)練集。且訓(xùn)練子集抽樣之間盡可能保持相對獨立。這樣,我們可以獲得數(shù)據(jù)集在相對獨立和穩(wěn)定的情況下的抽樣。然后對于這若干個訓(xùn)練集使用不同的基學(xué)習(xí)器進行訓(xùn)練和學(xué)習(xí),再對于分類任務(wù)使用投票的方式、對于回歸任務(wù)使用算術(shù)平均或者加權(quán)平均的方式來形成組合的強學(xué)習(xí)器。最終再使用這些組合學(xué)習(xí)器對測試集中的樣本進行預(yù)測,以獲取這些測試集的對應(yīng)測試結(jié)果。圖2-1Bagging的常見流程結(jié)構(gòu)2.1.2Boosting集成框架概述Boosting是一種可以用于提升弱學(xué)習(xí)器的泛化能力的有監(jiān)督學(xué)習(xí)的集成算法。它最開始由MichaelKearns[3]提出。其主要的思想是將弱學(xué)習(xí)器組裝成強學(xué)習(xí)器。在PAC學(xué)習(xí)框架中,一定可以使用某種方法將弱分類器組裝成一個強分類器。大多數(shù)的Boosting算法由一系列的弱學(xué)習(xí)器組成,使用迭代的方法,根據(jù)他們在分類中的準(zhǔn)確率或者回歸預(yù)測中的誤差情況給予弱學(xué)習(xí)器不同的權(quán)重,同時會對使用的數(shù)據(jù)集進行重新加權(quán),以此來強化對此前分類錯誤或者預(yù)測誤差較大的數(shù)據(jù)的重新分類和預(yù)測。Adaboost[4]算法是學(xué)習(xí)過程集成的典型例子。在AdaBoost的訓(xùn)練中,算法會通過不斷動態(tài)調(diào)整訓(xùn)練集中不同樣本的對應(yīng)信心值(權(quán)值)來體現(xiàn)學(xué)習(xí)器當(dāng)前對樣本的預(yù)測精度,最終將動態(tài)形成的多個弱學(xué)習(xí)器組合成強學(xué)習(xí)器。當(dāng)給定一個原始的訓(xùn)練集時,首先Adaboost會賦予訓(xùn)練集的每個樣本相等的權(quán)重系數(shù),此時說明訓(xùn)練集中的每個樣本的重要程度相等。接著使用這些樣本訓(xùn)練一個弱分類器,并對原始訓(xùn)練集的樣本進行預(yù)測。根據(jù)預(yù)測情況更新樣本的權(quán)重值,提高預(yù)測正確的樣本的權(quán)重,并降低預(yù)測錯誤的樣本的權(quán)重。?
華南理工大學(xué)碩士學(xué)位論文8一個強學(xué)習(xí)器。2.1.3Stacking集成框架概述Stacking[5]方法是指在組合集成多個基學(xué)習(xí)器時使用一個二級元學(xué)習(xí)器來綜合權(quán)衡各個基學(xué)習(xí)器的輸出。首先訓(xùn)練多個不同的基學(xué)習(xí)器,然后把不同的基學(xué)習(xí)器交叉驗證訓(xùn)練過程中對于驗證集的預(yù)測作為二級元學(xué)習(xí)器的輸入進行再次訓(xùn)練,以得到一個最終的輸出。理論上,Stacking可以表示上面提到的兩種集成學(xué)習(xí)方法,只要采用合適的模型組合策略即可。一般來說,會使用Stacking作為提升預(yù)測結(jié)果的方法。圖2-2Stacking集成的常見流程Stacking方法的常見流程如圖2-2所示。首先使用不同的基模型對整個的訓(xùn)練集的不同子抽樣中進行訓(xùn)練和學(xué)習(xí)。注意與Bagging不同的是,在Stacking中的子抽樣是不放回的子抽樣。然后將這些基模型預(yù)測得到的輸出作為第二層學(xué)習(xí)器的輸入,這里常常稱第二層學(xué)習(xí)器為元學(xué)習(xí)器。等待元學(xué)習(xí)器學(xué)習(xí)訓(xùn)練完畢我們便可以得到我們所需的最終模型。在對測試集進行測試的時候也需要使用相同的流程對測試集進行預(yù)訓(xùn)練,再交由元學(xué)習(xí)器比較學(xué)習(xí)效果。2.1.4集成學(xué)習(xí)的相關(guān)應(yīng)用集成學(xué)習(xí)作為當(dāng)前比較熱門的研究方向,被廣大學(xué)者應(yīng)用于各種研究中,以提高單獨學(xué)習(xí)器的預(yù)測性能和泛化能力。PouriyehS[6]等人比較了各類單獨學(xué)習(xí)器在對心臟疾病的圖像分類時的準(zhǔn)確性。對比了包括決策樹(DecisionTree)、樸素貝葉斯(NaiveBayes)、支持向量機(SupportVectorMachine)、K臨近(K-NearestNeighbor)等各種學(xué)習(xí)算法的分類性能。同時分別使用Bagging、Boosting和Stacking三種不同的方式對各類基學(xué)習(xí)器進行集成,并通過實驗發(fā)現(xiàn)使用Boosting的結(jié)構(gòu)在其應(yīng)用場景中可以顯著地提升分類的準(zhǔn)確性以及性能。HeH[7]等人則提出了一個三層的Stacking模型應(yīng)用在用戶信用評級中。該模型通過對XG
【參考文獻】:
期刊論文
[1]基于LIBS技術(shù)的鋼鐵合金中Cr和Ni元素SVM定量分析方法研究[J]. 張瑩,李穎,谷艷紅,郭豪,黎娜. 光譜學(xué)與光譜分析. 2016(07)
碩士論文
[1]基于深度學(xué)習(xí)和集成學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[D]. 竇路路.東華大學(xué) 2018
本文編號:3306596
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
常見LIBS分析實驗裝置
。Bagging技術(shù)是學(xué)習(xí)結(jié)果集成的經(jīng)典例子。當(dāng)給定一個訓(xùn)練集,它首先會通過對整個訓(xùn)練集進行Bootstrap的隨機抽樣、隨機子空間、擾動、投影等方式來獲得若干個子抽樣訓(xùn)練集。且訓(xùn)練子集抽樣之間盡可能保持相對獨立。這樣,我們可以獲得數(shù)據(jù)集在相對獨立和穩(wěn)定的情況下的抽樣。然后對于這若干個訓(xùn)練集使用不同的基學(xué)習(xí)器進行訓(xùn)練和學(xué)習(xí),再對于分類任務(wù)使用投票的方式、對于回歸任務(wù)使用算術(shù)平均或者加權(quán)平均的方式來形成組合的強學(xué)習(xí)器。最終再使用這些組合學(xué)習(xí)器對測試集中的樣本進行預(yù)測,以獲取這些測試集的對應(yīng)測試結(jié)果。圖2-1Bagging的常見流程結(jié)構(gòu)2.1.2Boosting集成框架概述Boosting是一種可以用于提升弱學(xué)習(xí)器的泛化能力的有監(jiān)督學(xué)習(xí)的集成算法。它最開始由MichaelKearns[3]提出。其主要的思想是將弱學(xué)習(xí)器組裝成強學(xué)習(xí)器。在PAC學(xué)習(xí)框架中,一定可以使用某種方法將弱分類器組裝成一個強分類器。大多數(shù)的Boosting算法由一系列的弱學(xué)習(xí)器組成,使用迭代的方法,根據(jù)他們在分類中的準(zhǔn)確率或者回歸預(yù)測中的誤差情況給予弱學(xué)習(xí)器不同的權(quán)重,同時會對使用的數(shù)據(jù)集進行重新加權(quán),以此來強化對此前分類錯誤或者預(yù)測誤差較大的數(shù)據(jù)的重新分類和預(yù)測。Adaboost[4]算法是學(xué)習(xí)過程集成的典型例子。在AdaBoost的訓(xùn)練中,算法會通過不斷動態(tài)調(diào)整訓(xùn)練集中不同樣本的對應(yīng)信心值(權(quán)值)來體現(xiàn)學(xué)習(xí)器當(dāng)前對樣本的預(yù)測精度,最終將動態(tài)形成的多個弱學(xué)習(xí)器組合成強學(xué)習(xí)器。當(dāng)給定一個原始的訓(xùn)練集時,首先Adaboost會賦予訓(xùn)練集的每個樣本相等的權(quán)重系數(shù),此時說明訓(xùn)練集中的每個樣本的重要程度相等。接著使用這些樣本訓(xùn)練一個弱分類器,并對原始訓(xùn)練集的樣本進行預(yù)測。根據(jù)預(yù)測情況更新樣本的權(quán)重值,提高預(yù)測正確的樣本的權(quán)重,并降低預(yù)測錯誤的樣本的權(quán)重。?
華南理工大學(xué)碩士學(xué)位論文8一個強學(xué)習(xí)器。2.1.3Stacking集成框架概述Stacking[5]方法是指在組合集成多個基學(xué)習(xí)器時使用一個二級元學(xué)習(xí)器來綜合權(quán)衡各個基學(xué)習(xí)器的輸出。首先訓(xùn)練多個不同的基學(xué)習(xí)器,然后把不同的基學(xué)習(xí)器交叉驗證訓(xùn)練過程中對于驗證集的預(yù)測作為二級元學(xué)習(xí)器的輸入進行再次訓(xùn)練,以得到一個最終的輸出。理論上,Stacking可以表示上面提到的兩種集成學(xué)習(xí)方法,只要采用合適的模型組合策略即可。一般來說,會使用Stacking作為提升預(yù)測結(jié)果的方法。圖2-2Stacking集成的常見流程Stacking方法的常見流程如圖2-2所示。首先使用不同的基模型對整個的訓(xùn)練集的不同子抽樣中進行訓(xùn)練和學(xué)習(xí)。注意與Bagging不同的是,在Stacking中的子抽樣是不放回的子抽樣。然后將這些基模型預(yù)測得到的輸出作為第二層學(xué)習(xí)器的輸入,這里常常稱第二層學(xué)習(xí)器為元學(xué)習(xí)器。等待元學(xué)習(xí)器學(xué)習(xí)訓(xùn)練完畢我們便可以得到我們所需的最終模型。在對測試集進行測試的時候也需要使用相同的流程對測試集進行預(yù)訓(xùn)練,再交由元學(xué)習(xí)器比較學(xué)習(xí)效果。2.1.4集成學(xué)習(xí)的相關(guān)應(yīng)用集成學(xué)習(xí)作為當(dāng)前比較熱門的研究方向,被廣大學(xué)者應(yīng)用于各種研究中,以提高單獨學(xué)習(xí)器的預(yù)測性能和泛化能力。PouriyehS[6]等人比較了各類單獨學(xué)習(xí)器在對心臟疾病的圖像分類時的準(zhǔn)確性。對比了包括決策樹(DecisionTree)、樸素貝葉斯(NaiveBayes)、支持向量機(SupportVectorMachine)、K臨近(K-NearestNeighbor)等各種學(xué)習(xí)算法的分類性能。同時分別使用Bagging、Boosting和Stacking三種不同的方式對各類基學(xué)習(xí)器進行集成,并通過實驗發(fā)現(xiàn)使用Boosting的結(jié)構(gòu)在其應(yīng)用場景中可以顯著地提升分類的準(zhǔn)確性以及性能。HeH[7]等人則提出了一個三層的Stacking模型應(yīng)用在用戶信用評級中。該模型通過對XG
【參考文獻】:
期刊論文
[1]基于LIBS技術(shù)的鋼鐵合金中Cr和Ni元素SVM定量分析方法研究[J]. 張瑩,李穎,谷艷紅,郭豪,黎娜. 光譜學(xué)與光譜分析. 2016(07)
碩士論文
[1]基于深度學(xué)習(xí)和集成學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[D]. 竇路路.東華大學(xué) 2018
本文編號:3306596
本文鏈接:http://www.sikaile.net/kejilunwen/huaxue/3306596.html
最近更新
教材專著