分布式半監(jiān)督學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-04-07 08:52
在大數(shù)據(jù)時(shí)代,隨著計(jì)算機(jī)技術(shù)的發(fā)展以及硬件水平的提高,獲取數(shù)據(jù)的途徑和存儲(chǔ)數(shù)據(jù)的硬件也變得越來越多,這使得我們經(jīng)常要面臨數(shù)據(jù)由不同節(jié)點(diǎn)(站點(diǎn))分布式地收集和存儲(chǔ)的情況。在此場景下,分布式信息處理應(yīng)運(yùn)而生。在分布式處理中,各節(jié)點(diǎn)能利用本地?cái)?shù)據(jù)進(jìn)行局部計(jì)算,同時(shí)又能與鄰居節(jié)點(diǎn)進(jìn)行少量的信息交互。通過這樣的方式,各節(jié)點(diǎn)能在不直接傳遞原始數(shù)據(jù)的情況下,獲取了全局的信息,從而實(shí)現(xiàn)了完全去中心化而又具有全局意義的信息處理。在機(jī)器學(xué)習(xí)領(lǐng)域,近年來大量的分布式機(jī)器學(xué)習(xí)算法被相繼提出。然而,已有的算法大多采用有監(jiān)督的學(xué)習(xí)方式,它們通常需要足夠多的有標(biāo)簽樣本以保證學(xué)習(xí)的性能。然而,在許多實(shí)際應(yīng)用中,獲取大量高質(zhì)量的有標(biāo)簽數(shù)據(jù)需要耗費(fèi)大量的人力物力,因而收集來的數(shù)據(jù)常常是無標(biāo)簽的或是弱標(biāo)簽的。此外,由于物理或人為的原因,收集來的數(shù)據(jù)常常存在屬性缺失。針對這些情況,本論文系統(tǒng)地開展了分布式場景下的半監(jiān)督學(xué)習(xí)研究,以期深度挖掘無標(biāo)簽樣本信息,提高分布式學(xué)習(xí)的性能。本論文主要聚焦于網(wǎng)絡(luò)化系統(tǒng)中的流數(shù)據(jù)、多標(biāo)簽數(shù)據(jù)、樣本屬性缺失以及帶有偏標(biāo)簽數(shù)據(jù)四種情況開展了系統(tǒng)的研究。我們克服了分布式實(shí)現(xiàn)的難點(diǎn),并提出了相應(yīng)的分...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學(xué)位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 分布式信息處理
1.2 半監(jiān)督學(xué)習(xí)
1.3 本文研究內(nèi)容和結(jié)構(gòu)安排
2 分布式在線半監(jiān)督學(xué)習(xí)
2.1 引言
2.2 預(yù)備知識
2.3 面向水平劃分的分布式在線半監(jiān)督支持向量機(jī)
2.4 面向垂直劃分的分布式在線半監(jiān)督支持向量機(jī)
2.5 仿真實(shí)驗(yàn)
2.6 本章小結(jié)
3 分布式半監(jiān)督督多標(biāo)簽學(xué)習(xí)
3.1 引言
3.2 問題描述
3.3 基于信息論的分布式半監(jiān)督督多標(biāo)簽學(xué)習(xí)算法
3.4 性能分析
3.5 仿真實(shí)驗(yàn)
3.6 本章小結(jié)
4 帶缺失失數(shù)據(jù)的分布式半監(jiān)督學(xué)習(xí)
4.1 引言
4.2 問題描述
4.3 基于子空間學(xué)習(xí)的分布式半監(jiān)督缺失失數(shù)據(jù)分類算法
4.4 性能分析
4.5 仿真實(shí)驗(yàn)
4.6 本章小結(jié)
5 分布式半監(jiān)督偏標(biāo)簽學(xué)習(xí)
5.1 引言
5.2 問題描述
5.3 基于平均消歧的分布式半監(jiān)督偏標(biāo)簽學(xué)習(xí)算法
5.4 性能分析
5.5 仿真實(shí)驗(yàn)
5.6 本章小結(jié)
6 總結(jié)與展望
參考文獻(xiàn)
攻讀博士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于自訓(xùn)練EM算法的半監(jiān)督文本分類[J]. 張博鋒,白冰,蘇金樹. 國防科技大學(xué)學(xué)報(bào). 2007(06)
博士論文
[1]分布式信息論學(xué)習(xí)[D]. 沈鵬程.浙江大學(xué) 2016
碩士論文
[1]分布式異常檢測算法[D]. 苗雪丹.浙江大學(xué) 2018
[2]傳感器網(wǎng)絡(luò)中的分布式向量量化[D]. 羅奕梁.浙江大學(xué) 2015
本文編號:3123187
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學(xué)位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 分布式信息處理
1.2 半監(jiān)督學(xué)習(xí)
1.3 本文研究內(nèi)容和結(jié)構(gòu)安排
2 分布式在線半監(jiān)督學(xué)習(xí)
2.1 引言
2.2 預(yù)備知識
2.3 面向水平劃分的分布式在線半監(jiān)督支持向量機(jī)
2.4 面向垂直劃分的分布式在線半監(jiān)督支持向量機(jī)
2.5 仿真實(shí)驗(yàn)
2.6 本章小結(jié)
3 分布式半監(jiān)督督多標(biāo)簽學(xué)習(xí)
3.1 引言
3.2 問題描述
3.3 基于信息論的分布式半監(jiān)督督多標(biāo)簽學(xué)習(xí)算法
3.4 性能分析
3.5 仿真實(shí)驗(yàn)
3.6 本章小結(jié)
4 帶缺失失數(shù)據(jù)的分布式半監(jiān)督學(xué)習(xí)
4.1 引言
4.2 問題描述
4.3 基于子空間學(xué)習(xí)的分布式半監(jiān)督缺失失數(shù)據(jù)分類算法
4.4 性能分析
4.5 仿真實(shí)驗(yàn)
4.6 本章小結(jié)
5 分布式半監(jiān)督偏標(biāo)簽學(xué)習(xí)
5.1 引言
5.2 問題描述
5.3 基于平均消歧的分布式半監(jiān)督偏標(biāo)簽學(xué)習(xí)算法
5.4 性能分析
5.5 仿真實(shí)驗(yàn)
5.6 本章小結(jié)
6 總結(jié)與展望
參考文獻(xiàn)
攻讀博士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于自訓(xùn)練EM算法的半監(jiān)督文本分類[J]. 張博鋒,白冰,蘇金樹. 國防科技大學(xué)學(xué)報(bào). 2007(06)
博士論文
[1]分布式信息論學(xué)習(xí)[D]. 沈鵬程.浙江大學(xué) 2016
碩士論文
[1]分布式異常檢測算法[D]. 苗雪丹.浙江大學(xué) 2018
[2]傳感器網(wǎng)絡(luò)中的分布式向量量化[D]. 羅奕梁.浙江大學(xué) 2015
本文編號:3123187
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/3123187.html
最近更新
教材專著