天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

結(jié)構(gòu)化預(yù)測(cè)中N元特征選擇算法的研究

發(fā)布時(shí)間:2020-04-14 20:34
【摘要】:結(jié)構(gòu)化預(yù)測(cè)也叫做結(jié)構(gòu)化學(xué)習(xí),目標(biāo)是從數(shù)據(jù)中學(xué)習(xí)一個(gè)復(fù)雜的結(jié)構(gòu),它是自然語言處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)研究熱點(diǎn)。N元特征在很大程度上反映了結(jié)構(gòu)化預(yù)測(cè)中“結(jié)構(gòu)”的信息,是結(jié)構(gòu)化預(yù)測(cè)中一類特殊且極為重要的特征。然而,絕大多數(shù)關(guān)于N元特征選擇的工作,僅僅將它當(dāng)作一種普通的特征來處理,而沒有考慮N元特征的性質(zhì),其實(shí)質(zhì)仍然是普通特征選擇。少數(shù)幾個(gè)研究考慮了N元特征的性質(zhì),但很不充分,而且僅僅關(guān)注具體任務(wù)中的一種或幾種特征,其方法不具普遍性。因此,對(duì)結(jié)構(gòu)化預(yù)測(cè)中N元特征選擇的研究非常少,可以說幾乎是一片空白。本文將結(jié)構(gòu)化預(yù)測(cè)中N元特征選擇作為一個(gè)全新的研究課題,旨在提出一種適用于結(jié)構(gòu)化預(yù)測(cè)的N元特征選擇的通用框架;趯(duì)該目標(biāo)的分析,論文在緒論部分就確定了該框架的大致雛形,包括特征選擇的方式(封裝式)、特征選擇的對(duì)象(N元特征模板而非特征函數(shù))、特征搜索策略(啟發(fā)式),以及特征搜索的順序(自下而上),并對(duì)該雛形框架可能存在的問題,包括特征選擇效率、魯棒性和過擬合,逐一給出解決方案。本文的主要工作包括以下幾個(gè)方面:1)論文定義了結(jié)構(gòu)化預(yù)測(cè)中的N元特征模板,系統(tǒng)地研究了它的性質(zhì),給出了結(jié)構(gòu)化預(yù)測(cè)中N元特征重要性的大致分布,并通過實(shí)驗(yàn)予以驗(yàn)證。2)論文提出一種高效的N元單特征選擇算法(SNFS)。該算法包括三個(gè)子算法:階數(shù)重要性排序算法、水平搜索算法、特征模板對(duì)組合算法。其中,最關(guān)鍵的是特征模板對(duì)組合算法,它的核心思想是:根據(jù)N元特征的重要性大致分布,我們能定位最有可能的兩個(gè)候選者,通過比較這兩個(gè)候選者和它們的并集,我們能進(jìn)一步準(zhǔn)確地判斷N元特征重要性的具體走向,從而高效地裁剪搜索空間。3)論文提出一種N元多特征選擇算法(MNFS)。SNFS算法每次只能處理一種N元特征,如果任務(wù)中需要同時(shí)選擇多種類型的N元特征,那么該算法必須運(yùn)行多次,每次處理一種特征,最后求并集。但這種做法沒有考慮多種N元特征之間的相關(guān)性,所以得到的特征集可能存在冗余。MNFS算法有效地解決了特征冗余的問題。論文通過實(shí)驗(yàn)全面地分析了算法的特征選擇性能、效率、魯棒性以及抗過擬合的能力,并與經(jīng)典的封裝式特征選擇方法進(jìn)行了對(duì)比。實(shí)驗(yàn)表明,MNFS算法的特征選擇性能與經(jīng)典的封裝式方法大致相當(dāng),但MNFS算法極其高效、魯棒,抗過擬合能力也優(yōu)于經(jīng)典的封裝式方法。4)論文提出一種通用的封裝式特征選擇的加速方法。該方法的基本思想是:“放松”模型中跟訓(xùn)練時(shí)間相關(guān)的變量以加速訓(xùn)練過程,同時(shí)定義了一個(gè)相似度度量值TopMatches用于平橫模型的預(yù)測(cè)性能和特征選擇性能,并利用坐標(biāo)下降法搜索相關(guān)的變量值。5)論文提出一種路徑約束的維特比算法來替代結(jié)構(gòu)化預(yù)測(cè)中耗時(shí)嚴(yán)重的轉(zhuǎn)移特征,進(jìn)一步提高了特征選擇效率。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP393.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張紅濤,胡玉霞,邱道尹;遺傳算法在儲(chǔ)糧害蟲特征選擇中的應(yīng)用[J];華北水利水電學(xué)院學(xué)報(bào);2004年03期

2 徐雷;閻平凡;常迥;;用于特征選擇的BF算法及其與B&B算法的比較[J];自動(dòng)化學(xué)報(bào);1988年05期

3 楊錦英;王碧泉;;K—W檢驗(yàn)和熵法在單個(gè)特征選擇中的應(yīng)用[J];華北地震科學(xué);1989年02期

4 陳晉蘇;特征選擇在電信行業(yè)客戶流失分析中的應(yīng)用[J];科技資訊;2005年22期

5 范勁松,方廷健;特征選擇和提取要素的分析及其評(píng)價(jià)[J];計(jì)算機(jī)工程與應(yīng)用;2001年13期

6 江乃雄;蔡民;;綜合距離特征選擇問題解的存在性與唯一性[J];計(jì)算機(jī)應(yīng)用與軟件;1992年01期

7 錢學(xué)雙;多重篩選逐步回歸特征選擇法及其應(yīng)用[J];信息與控制;1986年05期

8 余勝龍;趙紅;;基于樣本鄰域保持的代價(jià)敏感特征選擇[J];數(shù)據(jù)采集與處理;2018年02期

9 杜政霖;李云;;基于特征聚類集成技術(shù)的在線特征選擇[J];計(jì)算機(jī)應(yīng)用;2017年03期

10 崔亞芬;解男男;;一種基于特征選擇的入侵檢測(cè)方法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2015年01期

相關(guān)會(huì)議論文 前10條

1 史彩娟;沙宇陽;劉健;閆曉東;劉利平;;基于自適應(yīng)半監(jiān)督稀疏特征選擇的圖像標(biāo)注[A];第十屆全國(guó)信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2016年

2 劉培磊;李滿生;王挺;;蛋白質(zhì)相互作用有向關(guān)系抽取的特征選擇[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

3 袁帥;楊宏暉;申f;;基于云模型的特征評(píng)價(jià)準(zhǔn)則[A];第三屆上!靼猜晫W(xué)學(xué)會(huì)學(xué)術(shù)會(huì)議論文集[C];2013年

4 申f;楊宏暉;袁帥;;用于水聲目標(biāo)識(shí)別的互信息無監(jiān)督特征選擇[A];第三屆上!靼猜晫W(xué)學(xué)會(huì)學(xué)術(shù)會(huì)議論文集[C];2013年

5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類SVM分割MR腦圖像特征選擇與優(yōu)化的實(shí)驗(yàn)研究[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

6 李娜;曾向陽;;目標(biāo)識(shí)別中的樣本選擇和特征選擇聯(lián)合算法研究[A];2009年西安-上海聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2009年

7 宋鵬;鄭文明;趙力;;基于子空間學(xué)習(xí)和特征選擇融合的語音情感識(shí)別[A];第十四屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC’2017)論文集[C];2017年

8 臧淼;徐惠民;張永梅;;基于局部約束和稀疏編碼的自動(dòng)圖像標(biāo)注[A];國(guó)防光電子論壇第二屆激光雷達(dá)成像探測(cè)技術(shù)及應(yīng)用研討會(huì)論文集[C];2015年

9 俞士汶;王治敏;朱學(xué)鋒;;文學(xué)語言與自然語言理解研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

10 薛富強(qiáng);葛臨東;陳麗;;新的改進(jìn)遺傳算法用于調(diào)制信號(hào)特征選擇[A];無線傳感器網(wǎng)及網(wǎng)絡(luò)信息處理技術(shù)——2006年通信理論與信號(hào)處理年會(huì)論文集[C];2006年

相關(guān)重要報(bào)紙文章 前7條

1 本報(bào)記者 李振輝;根據(jù)自身特征選擇健身方式[N];廣東科技報(bào);2008年

2 海通證券 婁靜邋吳先興;把握風(fēng)險(xiǎn)收益特征選擇最適合自己的基金[N];上海證券報(bào);2007年

3 鐵嶺市第二高中 高軍;讓學(xué)生“動(dòng)”起來[N];鐵嶺日?qǐng)?bào);2005年

4 鄭衛(wèi)東;高產(chǎn)鵝選種方法和標(biāo)準(zhǔn)[N];中國(guó)畜牧獸醫(yī)報(bào);2007年

5 《網(wǎng)絡(luò)世界》記者 周源;云平臺(tái),只選對(duì)的[N];網(wǎng)絡(luò)世界;2012年

6 鄭軍;高產(chǎn)鵝選種方法和標(biāo)準(zhǔn)[N];河南科技報(bào);2016年

7 記者 丁寧;2012年,我們一起“追”的創(chuàng)新產(chǎn)品[N];上海證券報(bào);2012年

相關(guān)博士學(xué)位論文 前10條

1 任宇林;結(jié)構(gòu)化預(yù)測(cè)中N元特征選擇算法的研究[D];華中科技大學(xué);2018年

2 袁明冬;基于圖的特征提取和特征選擇及其應(yīng)用研究[D];西安電子科技大學(xué);2017年

3 胡小娟;基于特征選擇的文本分類方法研究[D];吉林大學(xué);2018年

4 滕旭陽;面向特征選擇問題的優(yōu)化方法研究[D];哈爾濱工程大學(xué);2017年

5 張麗新;高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學(xué)習(xí)研究[D];清華大學(xué);2004年

6 高青斌;蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)相關(guān)問題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

7 劉風(fēng);基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年

8 馮國(guó)忠;文本分類中的貝葉斯特征選擇[D];東北師范大學(xué);2011年

9 梁建寧;特征選擇與圖像匹配[D];復(fù)旦大學(xué);2011年

10 曹杰;基于SVM的網(wǎng)絡(luò)流量特征降維與分類方法研究[D];吉林大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 黃靜遠(yuǎn);兩種高維小樣本數(shù)據(jù)的分類方法對(duì)比研究[D];華中科技大學(xué);2019年

2 張哲;基于改進(jìn)引力搜索算法的SVM參數(shù)優(yōu)化和特征選擇[D];云南大學(xué);2017年

3 任秀偉;基于嵌入式稀疏特征選擇策略的降維算法研究[D];湖北工業(yè)大學(xué);2018年

4 胡世賽;多樣性增量特征選擇技術(shù)的應(yīng)用[D];內(nèi)蒙古工業(yè)大學(xué);2018年

5 黃曉娟;面向特征選擇的Relief算法研究[D];蘇州大學(xué);2018年

6 楊鈞;高維不完整數(shù)據(jù)的特征選擇研究[D];遼寧大學(xué);2018年

7 余勝龍;基于數(shù)據(jù)相關(guān)性的代價(jià)敏感特征選擇[D];閩南師范大學(xué);2018年

8 黃天意;基于稀疏回歸的特征選擇研究[D];閩南師范大學(xué);2018年

9 朱鑫萍;論文影響力的預(yù)測(cè)方法研究[D];內(nèi)蒙古大學(xué);2018年

10 藍(lán)恭e,

本文編號(hào):2627681


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2627681.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶85322***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com