基于特征重構(gòu)和樣本篩選的遷移學(xué)習(xí)算法研究
發(fā)布時間:2022-01-12 05:45
隨著大數(shù)據(jù)產(chǎn)業(yè)的迅猛發(fā)展,越來越多的產(chǎn)業(yè)需要對相關(guān)數(shù)據(jù)進行深入的分析,以期望從數(shù)據(jù)中獲取有用信息,對業(yè)務(wù)流程進行建模,對業(yè)務(wù)效益進行評估,對業(yè)務(wù)趨勢進行預(yù)測。在基于機器學(xué)習(xí)的業(yè)務(wù)流程建模過程中,數(shù)據(jù)一直是業(yè)務(wù)的核心,擁有質(zhì)量較好的數(shù)據(jù)信息,就可以建立更好的數(shù)據(jù)模型。但是傳統(tǒng)的機器學(xué)習(xí)仍然存在一些很棘手的問題:為了建立足夠好的模型,建模過程需要足夠多的有類別標(biāo)簽的樣本數(shù)據(jù),而往往有些數(shù)據(jù)非常難以獲得,要獲取相關(guān)的數(shù)據(jù)需要花費巨大的人力、物力和財力,甚至有時候獲取某些領(lǐng)域的數(shù)據(jù)是不可能的。遷移學(xué)習(xí)作為一個新興研究方向,可以將一個領(lǐng)域?qū)W習(xí)到的知識遷移到另外一個不同但卻相關(guān)的領(lǐng)域,幫助另外一個領(lǐng)域進行快速建模。在遷移學(xué)習(xí)體系中,如何有效適配兩個領(lǐng)域的數(shù)據(jù)分布,以及如何在領(lǐng)域之間的分布差異較小的情況下篩選出源領(lǐng)域的有效樣本輔助目標(biāo)領(lǐng)域模型的訓(xùn)練,都是影響目標(biāo)領(lǐng)域數(shù)據(jù)模型有效性的關(guān)鍵因素。論文對基于實例的遷移學(xué)習(xí)算法和基于特征表達(dá)的遷移學(xué)習(xí)算法進行了分析,設(shè)計并驗證了三種面向跨領(lǐng)域的遷移學(xué)習(xí)方法。首先,本文提出一個基于實例的簡單遷移模型,模型通過對源領(lǐng)域數(shù)據(jù)進行一次非迭代的樣本篩選,可以豐富目標(biāo)域...
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1傳統(tǒng)機器學(xué)習(xí)和遷移學(xué)習(xí)的對比??
圖1-2源域(紅)和目標(biāo)域(綠)數(shù)據(jù)分布不一致??
一實例遷移中混合沮峨的數(shù)據(jù)來輔助訓(xùn)練目標(biāo)城的任務(wù)
【參考文獻】:
期刊論文
[1]谷歌AutoML幫助不同企業(yè)建立人工智能系統(tǒng)[J]. 機床與液壓. 2017(21)
[2]基于互信息的無監(jiān)督特征選擇[J]. 徐峻嶺,周毓明,陳林,徐寶文. 計算機研究與發(fā)展. 2012(02)
[3]遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)研究[J]. 叢爽,戴誼. 計算機應(yīng)用. 2004(08)
本文編號:3584216
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1傳統(tǒng)機器學(xué)習(xí)和遷移學(xué)習(xí)的對比??
圖1-2源域(紅)和目標(biāo)域(綠)數(shù)據(jù)分布不一致??
一實例遷移中混合沮峨的數(shù)據(jù)來輔助訓(xùn)練目標(biāo)城的任務(wù)
【參考文獻】:
期刊論文
[1]谷歌AutoML幫助不同企業(yè)建立人工智能系統(tǒng)[J]. 機床與液壓. 2017(21)
[2]基于互信息的無監(jiān)督特征選擇[J]. 徐峻嶺,周毓明,陳林,徐寶文. 計算機研究與發(fā)展. 2012(02)
[3]遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)研究[J]. 叢爽,戴誼. 計算機應(yīng)用. 2004(08)
本文編號:3584216
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3584216.html
最近更新
教材專著