基于跨媒體特征融合的黑龍江省大米產(chǎn)地分類(lèi)研究
【學(xué)位單位】:哈爾濱商業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2020
【中圖分類(lèi)】:TP391.41;TS210.7
【部分圖文】:
哈爾濱商業(yè)大學(xué)碩士學(xué)位論文15設(shè)訓(xùn)練集T的數(shù)據(jù)分布為:1122,,,,,,mnmTxyxyxyXY(2-1)其中nixXR,1,1iyYi1,2,,m,ix表示第i個(gè)特征向量,當(dāng)1iy時(shí)則ix表示正例,當(dāng)1iy時(shí)則ix表示負(fù)例。若X的分布處于二維空間中,可將上述問(wèn)題轉(zhuǎn)換為一個(gè)基于決策平面與最大間隔的分類(lèi)問(wèn)題,處于決策平面的最大間隔兩側(cè)的點(diǎn)分別定義為正例和負(fù)例。如下圖2-1所示,0Txb即為決策平面的計(jì)算公式。其中,w為超平面法向量,b是常數(shù)項(xiàng),x是訓(xùn)練集樣本。當(dāng)求解問(wèn)題屬于線(xiàn)性可分問(wèn)題時(shí),則決策平面的數(shù)量可為無(wú)窮多個(gè),因此需要計(jì)算決策平面與最近鄰數(shù)據(jù)點(diǎn)最大間隔,利用間隔最大化的方式得出使正例與負(fù)例能夠最好區(qū)分的決策平面。SVM線(xiàn)性分類(lèi)最優(yōu)分割決策平面圖,如圖2-1所示。圖2-1SVM線(xiàn)性分類(lèi)最優(yōu)分割超平面圖特征空間中任意點(diǎn)x到超平面的距離表示為:+Txbs。假設(shè)超平面,b可將訓(xùn)練樣本正確分類(lèi),則1,11,1TiTixbyxby(2-2)被圈住的正例和負(fù)例距離超平面最近,并且使得公式成立,這些點(diǎn)被稱(chēng)為支持向量(supportvector),正負(fù)例支持向量到超平面的距離之和為s,表示間隔。2s(2-3)最大化分離間隔可等價(jià)為:2,1minb2..1,1,,iistyxbim(2-4)
大米產(chǎn)地分類(lèi)研究相關(guān)技術(shù)16找到滿(mǎn)足公式(2-4)中的約束參數(shù),b使Y最大,即可得到最優(yōu)超平面?赏ㄟ^(guò)拉格朗日乘子法來(lái)得到公式(2-4)的對(duì)偶問(wèn)題,如下:1111min2mmmijijijijjjyyxx1..0,0,1,2,,miiiistyim(2-5)根據(jù)凸最優(yōu)化理論可以證明若***12=,,,m為上述對(duì)偶問(wèn)題的最優(yōu)解,令****11=,,|0mmiiijiijjiiiyxbyyxxjj(2-6)則**w,b為使最大的最優(yōu)解,最終得到?jīng)Q策函數(shù):**fxsgnxb(2-7)2.2.2BP神經(jīng)網(wǎng)絡(luò)BP(BackPropagation)神經(jīng)網(wǎng)絡(luò),是1986年由具有“神經(jīng)網(wǎng)絡(luò)之父”之稱(chēng)的Hinton提出來(lái)的。相比于傳統(tǒng)的MLP算法,BP神經(jīng)網(wǎng)絡(luò)有較多的層數(shù)及單元數(shù),通過(guò)結(jié)合反向傳播算法對(duì)神經(jīng)網(wǎng)絡(luò)內(nèi)不同權(quán)重及偏置的優(yōu)化與更新,使得模型能夠擬合較多的線(xiàn)性及非線(xiàn)性分類(lèi)問(wèn)題,因此BP神經(jīng)網(wǎng)絡(luò)是當(dāng)今人工智能領(lǐng)域應(yīng)用較多的算法之一。BP神經(jīng)網(wǎng)絡(luò)是一類(lèi)包含輸入層、隱藏層及輸出層的反向傳播神經(jīng)網(wǎng)絡(luò),其最明顯的特征是:通過(guò)對(duì)誤差反向傳遞來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)參數(shù)優(yōu)化,通過(guò)對(duì)特征的正向傳遞來(lái)進(jìn)行數(shù)據(jù)的分析。一個(gè)典型的三層BP神經(jīng)網(wǎng)絡(luò)架構(gòu)圖,如下圖2-2所示。圖2-2BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
哈爾濱商業(yè)大學(xué)碩士學(xué)位論文172.2.3隨機(jī)森林算法隨機(jī)森林算法是較為經(jīng)典的一種機(jī)器學(xué)習(xí)算法,其由LeoBreiman和AdeleCutler最早提出,其中所包含的集成學(xué)習(xí)思想在當(dāng)今模式識(shí)別領(lǐng)域仍然活躍。隨機(jī)森林(RandomForest,RF)通過(guò)集成多個(gè)決策樹(shù)模型來(lái)進(jìn)行計(jì)算,最終得到分類(lèi)模型為hx,k,k1,,且參數(shù)集(k)是獨(dú)立同分布的隨機(jī)向量,在給定自變量x下,隨機(jī)森林中的各個(gè)決策樹(shù)模型都會(huì)給出一個(gè)預(yù)測(cè)值并利用投票機(jī)制選擇出眾多預(yù)測(cè)值中的最優(yōu)分類(lèi)結(jié)果,隨機(jī)森林原理如圖2-3所示。圖2-3隨機(jī)森林原理圖利用自助采樣法(bootstrapsampling)從原始訓(xùn)練集D中抽取n個(gè)樣本集12,,nDDD,且每個(gè)樣本容量均與原始訓(xùn)練集D一致,未被抽到的樣本為袋外樣本(out-of-bag簡(jiǎn)稱(chēng)OOB),n個(gè)樣本集即對(duì)應(yīng)n個(gè)袋外樣本OOB12,,nOOBOOBOOB;對(duì)12,,nDDD依照hx,k,k1,建立n棵不剪枝的決策樹(shù)模型形成森林,以O(shè)OB數(shù)據(jù)集作為驗(yàn)證集檢驗(yàn)每一棵樹(shù)模型得到袋外誤分率{error1,error2,error3,...errork},袋外誤差估計(jì)公式(2-8)可用于優(yōu)化模型參數(shù),判斷模型優(yōu)劣。11kiiOOBestimateerrorerrork(2-8)每一棵決策樹(shù)的每一個(gè)節(jié)點(diǎn)均從M個(gè)屬性中隨機(jī)選取m(m+M)個(gè)屬性作為候選屬性,在m個(gè)候選屬性中選擇節(jié)點(diǎn)純度最大的屬性作為最終節(jié)點(diǎn)屬性;由n棵決策樹(shù)構(gòu)成了組合分類(lèi)器,利用n個(gè)模型對(duì)測(cè)試集分別進(jìn)行分類(lèi),得到n種分類(lèi)結(jié)果;最后對(duì)n種分類(lèi)結(jié)果累計(jì)投票決定其最
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡圣英;任紅波;張軍;孟利;;大米產(chǎn)地溯源方法研究進(jìn)展[J];中國(guó)農(nóng)學(xué)通報(bào);2020年14期
2 崔志良;安鵬;;吉林省大米品牌發(fā)展情況調(diào)查[J];合作經(jīng)濟(jì)與科技;2020年06期
3 劉金鳳;;大米適度加工檢測(cè)技術(shù)及其應(yīng)用分析[J];科學(xué)技術(shù)創(chuàng)新;2020年13期
4 姜山;胡志剛;;大米拋光磨損研究綜述[J];現(xiàn)代制造技術(shù)與裝備;2020年04期
5 ;大米并非越貴越好[J];發(fā)明與創(chuàng)新(大科技);2018年08期
6 ;吉林大米:一個(gè)省級(jí)區(qū)域公用品牌的崛起之道[J];新農(nóng)業(yè);2019年10期
7 王向社;;柬埔寨前4個(gè)月大米出口量同比大增[J];世界熱帶農(nóng)業(yè)信息;2019年06期
8 王向社;;柬埔寨請(qǐng)求馬來(lái)西亞幫助購(gòu)買(mǎi)大米[J];世界熱帶農(nóng)業(yè)信息;2019年07期
9 蔣文全;;新時(shí)期廣西大米品牌發(fā)展策略探討[J];納稅;2018年15期
10 張星寶;;大米紅,小米黃[J];中小學(xué)音樂(lè)教育;2008年02期
相關(guān)博士學(xué)位論文 前10條
1 萬(wàn)鵬;大米品質(zhì)檢測(cè)系統(tǒng)研究[D];吉林大學(xué);2009年
2 許慶武;地方特色大米產(chǎn)業(yè)創(chuàng)新發(fā)展研究[D];武漢理工大學(xué);2012年
3 陳建新;過(guò)熱蒸汽焙炒黃酒釀造大米機(jī)理及其工程優(yōu)化研究[D];江南大學(xué);2014年
4 陳溪;大米樣品中農(nóng)藥多殘留高通量分析研究[D];沈陽(yáng)農(nóng)業(yè)大學(xué);2015年
5 Nareerut Seerasarn;泰國(guó)和中國(guó)消費(fèi)者對(duì)有機(jī)大米的態(tài)度和行為的交叉對(duì)比[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年
6 夏立婭;大米產(chǎn)地特征因子及溯源方法研究[D];河北大學(xué);2013年
7 張鴻;基于相關(guān)性挖掘的跨媒體檢索研究[D];浙江大學(xué);2007年
8 陳善峰;低溫?cái)D壓加酶大米作啤酒輔料的試驗(yàn)研究[D];河北農(nóng)業(yè)大學(xué);2012年
9 范欣;針對(duì)移動(dòng)設(shè)備的跨媒體網(wǎng)絡(luò)信息檢索及自適應(yīng)信息顯示研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
10 周興華;兩種轉(zhuǎn)基因大米食用安全性的毒理學(xué)研究[D];江蘇大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 李昂;基于跨媒體特征融合的黑龍江省大米產(chǎn)地分類(lèi)研究[D];哈爾濱商業(yè)大學(xué);2020年
2 宋美超;基于圖像與文本特征融合的大米分類(lèi)研究[D];哈爾濱商業(yè)大學(xué);2020年
3 呂思銘;中國(guó)大米貿(mào)易的國(guó)際競(jìng)爭(zhēng)力研究[D];黑龍江大學(xué);2016年
4 曾靖;大米品牌競(jìng)爭(zhēng)力研究[D];華中農(nóng)業(yè)大學(xué);2006年
5 孫源;吉林大米營(yíng)銷(xiāo)策略研究[D];吉林大學(xué);2020年
6 譚聰;消費(fèi)者視角下中國(guó)大米品牌形象提升研究[D];哈爾濱商業(yè)大學(xué);2017年
7 金杰;延邊大米品牌價(jià)值提升研究[D];延邊大學(xué);2016年
8 張帥;我國(guó)擴(kuò)大從東盟進(jìn)口大米研究[D];東北財(cái)經(jīng)大學(xué);2015年
9 郭佩佩;泰國(guó)大米國(guó)際競(jìng)爭(zhēng)力的研究[D];浙江大學(xué);2014年
10 陳瑋;大米氣調(diào)儲(chǔ)藏過(guò)程中脂質(zhì)的變化研究[D];天津科技大學(xué);2007年
本文編號(hào):2873627
本文鏈接:http://www.sikaile.net/shoufeilunwen/boshibiyelunwen/2873627.html