基于劃分與壓縮的加速學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-03-26 04:17
現(xiàn)實(shí)世界中運(yùn)轉(zhuǎn)的許多復(fù)雜系統(tǒng)如基因表達(dá)、風(fēng)險(xiǎn)評(píng)估、經(jīng)濟(jì)預(yù)測(cè)等都可以抽象為特定的預(yù)測(cè)問(wèn)題,而這些預(yù)測(cè)問(wèn)題的高效解決將對(duì)社會(huì)的生產(chǎn)生活產(chǎn)生重大意義.機(jī)器學(xué)習(xí)作為一種解決這些復(fù)雜預(yù)測(cè)問(wèn)題的重要方法,它能夠通過(guò)從經(jīng)驗(yàn)中不斷學(xué)習(xí)來(lái)提高其自身的學(xué)習(xí)與預(yù)測(cè)能力.現(xiàn)階段,隨著信息技術(shù)的迅猛發(fā)展與各領(lǐng)域大數(shù)據(jù)的爆發(fā),很多實(shí)際應(yīng)用中的數(shù)據(jù)規(guī)模都呈現(xiàn)出爆炸式增長(zhǎng).數(shù)據(jù)的大規(guī)模性使得已有機(jī)器學(xué)習(xí)方法在解決預(yù)測(cè)問(wèn)題時(shí)面臨巨大挑戰(zhàn).因此,研究高效的機(jī)器學(xué)習(xí)算法具有重要實(shí)際應(yīng)用價(jià)值和理論意義.有監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中應(yīng)用最為豐富、內(nèi)容最廣泛的部分,如何高效地在大規(guī)模數(shù)據(jù)上訓(xùn)練泛化性能強(qiáng)的學(xué)習(xí)器是機(jī)器學(xué)習(xí)研究領(lǐng)域面臨的關(guān)鍵問(wèn)題之一.為此,本文以數(shù)據(jù)劃分與數(shù)據(jù)壓縮為研究基礎(chǔ),針對(duì)面向海量數(shù)據(jù)如何提升學(xué)習(xí)算法的執(zhí)行效率問(wèn)題開(kāi)展了系統(tǒng)研究.主要研究成果如下:(1)針對(duì)支持向量機(jī)面對(duì)大規(guī)模數(shù)據(jù)訓(xùn)練效率較低的問(wèn)題,借鑒于分而治之的思想,提出了一個(gè)基于局部幾何信息的高效支持向量機(jī)算法.對(duì)于給定的大規(guī)模數(shù)據(jù)集,基于支持向量機(jī)算法中決策函數(shù)由少數(shù)支持向量確定的特點(diǎn),利用線性投影來(lái)探究當(dāng)前數(shù)據(jù)中的分類決策邊界,并深入分析了如何對(duì)數(shù)據(jù)進(jìn)行...
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:126 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 選題背景和研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于數(shù)據(jù)劃分的加速學(xué)習(xí)算法
1.2.2 基于數(shù)據(jù)壓縮的加速學(xué)習(xí)算法
1.3 本文的研究?jī)?nèi)容和組織框架
第二章 基于局部信息的SVM加速算法
2.1 問(wèn)題描述
2.2 相關(guān)概念
2.3 基于局部信息的SVM加速算法
2.3.1 基于線性投影的數(shù)據(jù)劃分
2.3.2 相關(guān)參數(shù)值的確定
2.3.3 時(shí)間復(fù)雜度分析
2.4 實(shí)驗(yàn)分析
2.5 本章小結(jié)
第三章 基于K-means聚類的k-近鄰分類加速算法
3.1 問(wèn)題描述
3.2 相關(guān)概念
3.3 基于數(shù)據(jù)劃分k-近鄰分類加速算法的機(jī)理分析
3.3.1 問(wèn)題的轉(zhuǎn)化
3.3.2 數(shù)據(jù)劃分影響的估計(jì)
3.4 基于K-means聚類的k-近鄰分類加速算法
3.5 實(shí)驗(yàn)分析
3.6 本章小結(jié)
第四章 基于分層抽樣的k-近鄰分類加速算法
4.1 問(wèn)題描述
4.2 基于分層抽樣的k-近鄰分類加速算法
4.2.1 訓(xùn)練集的分層
4.2.2 樣本集的獲取
4.2.3 待識(shí)別實(shí)例的預(yù)測(cè)
4.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第五章 基于實(shí)例選擇的k-近鄰回歸加速算法
5.1 問(wèn)題描述
5.2 相關(guān)概念
5.3 遞減的實(shí)例選擇算法
5.3.1 識(shí)別并移除異常實(shí)例
5.3.2 識(shí)別并移除冗余實(shí)例
5.3.3 相關(guān)參數(shù)值的確定
5.4 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第六章 基于按需抽樣的Logistic回歸加速算法
6.1 問(wèn)題描述
6.2 相關(guān)概念
6.3 基于按需抽樣的Logistic回歸加速算法
6.3.1 樣本量自適應(yīng)確定的按需抽樣
6.3.2 按需抽樣有效性的理論性分析
6.4 實(shí)驗(yàn)分析
6.5 本章小結(jié)
第七章 結(jié)論與展望
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)挖掘的粒計(jì)算理論與方法[J]. 梁吉業(yè),錢宇華,李德玉,胡清華. 中國(guó)科學(xué):信息科學(xué). 2015(11)
[2]基于分歧的半監(jiān)督學(xué)習(xí)[J]. 周志華. 自動(dòng)化學(xué)報(bào). 2013(11)
[3]重采樣方法與機(jī)器學(xué)習(xí)[J]. 畢華,梁洪力,王玨. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
[4]基于加權(quán)模糊c均值聚類的快速圖像自動(dòng)分割算法[J]. 楊潤(rùn)玲,高新波. 中國(guó)圖象圖形學(xué)報(bào). 2007(12)
[5]學(xué)習(xí)特征權(quán)值對(duì)K-均值聚類算法的優(yōu)化[J]. 王熙照,王亞?wèn)|,湛燕,袁方. 計(jì)算機(jī)研究與發(fā)展. 2003(06)
[6]一種基于B樣條曲面的深度圖像重抽樣方法[J]. 李松濤,張長(zhǎng)水,榮鋼,邊肇祺,Zhao Dong ming. 計(jì)算機(jī)學(xué)報(bào). 2000(11)
本文編號(hào):3100932
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:126 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 選題背景和研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于數(shù)據(jù)劃分的加速學(xué)習(xí)算法
1.2.2 基于數(shù)據(jù)壓縮的加速學(xué)習(xí)算法
1.3 本文的研究?jī)?nèi)容和組織框架
第二章 基于局部信息的SVM加速算法
2.1 問(wèn)題描述
2.2 相關(guān)概念
2.3 基于局部信息的SVM加速算法
2.3.1 基于線性投影的數(shù)據(jù)劃分
2.3.2 相關(guān)參數(shù)值的確定
2.3.3 時(shí)間復(fù)雜度分析
2.4 實(shí)驗(yàn)分析
2.5 本章小結(jié)
第三章 基于K-means聚類的k-近鄰分類加速算法
3.1 問(wèn)題描述
3.2 相關(guān)概念
3.3 基于數(shù)據(jù)劃分k-近鄰分類加速算法的機(jī)理分析
3.3.1 問(wèn)題的轉(zhuǎn)化
3.3.2 數(shù)據(jù)劃分影響的估計(jì)
3.4 基于K-means聚類的k-近鄰分類加速算法
3.5 實(shí)驗(yàn)分析
3.6 本章小結(jié)
第四章 基于分層抽樣的k-近鄰分類加速算法
4.1 問(wèn)題描述
4.2 基于分層抽樣的k-近鄰分類加速算法
4.2.1 訓(xùn)練集的分層
4.2.2 樣本集的獲取
4.2.3 待識(shí)別實(shí)例的預(yù)測(cè)
4.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第五章 基于實(shí)例選擇的k-近鄰回歸加速算法
5.1 問(wèn)題描述
5.2 相關(guān)概念
5.3 遞減的實(shí)例選擇算法
5.3.1 識(shí)別并移除異常實(shí)例
5.3.2 識(shí)別并移除冗余實(shí)例
5.3.3 相關(guān)參數(shù)值的確定
5.4 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第六章 基于按需抽樣的Logistic回歸加速算法
6.1 問(wèn)題描述
6.2 相關(guān)概念
6.3 基于按需抽樣的Logistic回歸加速算法
6.3.1 樣本量自適應(yīng)確定的按需抽樣
6.3.2 按需抽樣有效性的理論性分析
6.4 實(shí)驗(yàn)分析
6.5 本章小結(jié)
第七章 結(jié)論與展望
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)挖掘的粒計(jì)算理論與方法[J]. 梁吉業(yè),錢宇華,李德玉,胡清華. 中國(guó)科學(xué):信息科學(xué). 2015(11)
[2]基于分歧的半監(jiān)督學(xué)習(xí)[J]. 周志華. 自動(dòng)化學(xué)報(bào). 2013(11)
[3]重采樣方法與機(jī)器學(xué)習(xí)[J]. 畢華,梁洪力,王玨. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
[4]基于加權(quán)模糊c均值聚類的快速圖像自動(dòng)分割算法[J]. 楊潤(rùn)玲,高新波. 中國(guó)圖象圖形學(xué)報(bào). 2007(12)
[5]學(xué)習(xí)特征權(quán)值對(duì)K-均值聚類算法的優(yōu)化[J]. 王熙照,王亞?wèn)|,湛燕,袁方. 計(jì)算機(jī)研究與發(fā)展. 2003(06)
[6]一種基于B樣條曲面的深度圖像重抽樣方法[J]. 李松濤,張長(zhǎng)水,榮鋼,邊肇祺,Zhao Dong ming. 計(jì)算機(jī)學(xué)報(bào). 2000(11)
本文編號(hào):3100932
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3100932.html
最近更新
教材專著