天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于集成學(xué)習(xí)的標(biāo)題分類算法研究

發(fā)布時(shí)間:2018-02-25 09:19

  本文關(guān)鍵詞: 自然語言處理 標(biāo)題分類 集成學(xué)習(xí) 改進(jìn)隨機(jī)森林 OOB二維權(quán)重分布 出處:《計(jì)算機(jī)應(yīng)用研究》2017年04期  論文類型:期刊論文


【摘要】:標(biāo)題分類是對一個(gè)標(biāo)題性語句進(jìn)行分類,通常這個(gè)標(biāo)題是不超過20個(gè)字的短文本,內(nèi)容精煉且概括性強(qiáng)。針對標(biāo)題文本的特征稀疏性和含義不確定性,提出了一種融合隨機(jī)森林與貝葉斯多項(xiàng)式的標(biāo)題分類算法。該算法將貝葉斯多項(xiàng)式模型引入到隨機(jī)森林底層分類器構(gòu)建過程中,同時(shí)利用隨機(jī)森林附帶的OOB數(shù)據(jù)提出了一種基于二維權(quán)重分布的投票機(jī)制。最后在圖書館真實(shí)書目數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),針對分類性能與當(dāng)前基于LDA主題擴(kuò)展的SVM算法進(jìn)行對比,實(shí)驗(yàn)結(jié)果表明在一定條件下,該方法性能穩(wěn)定、表現(xiàn)較佳。
[Abstract]:Title categorization is the classification of a title statement, usually a short text with no more than 20 words, which is concise and general. A title classification algorithm combining stochastic forest and Bayesian polynomials is proposed, in which Bayesian polynomial model is introduced into the process of constructing stochastic forest classifier. At the same time, a voting mechanism based on two-dimensional weight distribution is proposed by using the OOB data attached to random forest. Finally, an experiment is carried out on the real bibliographic data of the library, and the classification performance is compared with the current SVM algorithm based on the extension of LDA topic. The experimental results show that the performance of this method is stable and good under certain conditions.
【作者單位】: 寧波大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家社會科學(xué)基金資助項(xiàng)目(15FTQ002)
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 葛文鎮(zhèn);劉柏嵩;王洋洋;趙福青;;基于層級類別信息的標(biāo)題自動分類研究[J];計(jì)算機(jī)應(yīng)用研究;2016年07期

2 呂超鎮(zhèn);姬東鴻;吳飛飛;;基于LDA特征擴(kuò)展的短文本分類[J];計(jì)算機(jī)工程與應(yīng)用;2015年04期

3 翟延冬;王康平;張東娜;黃嵐;周春光;;一種基于WordNet的短文本語義相似性算法[J];電子學(xué)報(bào);2012年03期

4 寧亞輝;樊興華;吳渝;;基于領(lǐng)域詞語本體的短文本分類[J];計(jì)算機(jī)科學(xué);2009年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 史慶偉;劉雨詩;張豐田;;基于微博文本的詞對主題演化模型[J];計(jì)算機(jī)應(yīng)用;2017年05期

2 張磊;;文本分類及分類算法研究綜述[J];電腦知識與技術(shù);2016年34期

3 黃賢英;李沁東;劉英濤;;結(jié)合詞性的短文本相似度算法及其在文本分類中的應(yīng)用[J];電訊技術(shù);2017年01期

4 郝偉學(xué);于劍;周雪忠;;本體對齊技術(shù)概述及其在中醫(yī)領(lǐng)域的應(yīng)用探討[J];世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化;2017年01期

5 張謙;高章敏;劉嘉勇;;基于Word2vec的微博短文本分類研究[J];信息網(wǎng)絡(luò)安全;2017年01期

6 段旭磊;張仰森;郭正斌;;微博文本聚類中特征擴(kuò)展策略研究[J];計(jì)算機(jī)工程與應(yīng)用;2017年13期

7 儲濤濤;;基于LDA主題模型的用戶興趣發(fā)現(xiàn)方法[J];軟件;2016年12期

8 王震;代巖巖;陳亮;林曉蘭;;基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析[J];電子技術(shù)與軟件工程;2016年22期

9 張群;王紅軍;王倫文;;一種結(jié)合上下文語義的短文本聚類算法[J];計(jì)算機(jī)科學(xué);2016年S2期

10 李湘東;劉康;丁叢;廖香鵬;;基于知網(wǎng)語義特征擴(kuò)展的題名信息分類[J];圖書館雜志;2017年02期

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 姚長青;杜永萍;;降維技術(shù)在專利文本聚類中的應(yīng)用研究[J];情報(bào)學(xué)報(bào);2014年05期

2 張素智;劉婧姣;;基于語義的KNN短文本分類算法研究[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年06期

3 何力;賈焰;韓偉紅;譚霜;陳志坤;;大規(guī)模層次分類問題研究及其進(jìn)展[J];計(jì)算機(jī)學(xué)報(bào);2012年10期

4 翟延冬;王康平;張東娜;黃嵐;周春光;;一種基于WordNet的短文本語義相似性算法[J];電子學(xué)報(bào);2012年03期

5 劉金嶺;嚴(yán)云洋;;基于上下文的短信文本分類方法[J];計(jì)算機(jī)工程;2011年10期

6 姚全珠;宋志理;彭程;;基于LDA模型的文本分類研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年13期

7 祝翠玲;馬軍;張冬梅;;面向?qū)哟畏诸惖奈谋咎卣鬟x擇方法[J];模式識別與人工智能;2011年01期

8 魯婷;王浩;姚宏亮;;一種基于中心文檔的KNN中文文本分類算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年02期

9 張東娜;周春光;劉彥斌;郭東偉;;一種基于WordNet和Corpus Statistics的語義相似性計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2010年05期

10 賀濤;曹先彬;譚輝;;基于免疫的中文網(wǎng)絡(luò)短文本聚類算法[J];自動化學(xué)報(bào);2009年07期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 袁漢寧;;雙層多示例集成學(xué)習(xí)[J];武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版);2011年05期

2 俞揚(yáng);周志華;;集成學(xué)習(xí)中完全隨機(jī)學(xué)習(xí)策略研究[J];計(jì)算機(jī)工程;2006年17期

3 張滄生;崔麗娟;楊剛;倪志宏;;集成學(xué)習(xí)算法的比較研究[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年05期

4 陳凱;;基于聚類技術(shù)的集成學(xué)習(xí)差異性研究[J];南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年04期

5 李凱;崔麗娟;;集成學(xué)習(xí)算法的差異性及性能比較[J];計(jì)算機(jī)工程;2008年06期

6 潘志松;燕繼坤;;少數(shù)類的集成學(xué)習(xí)[J];南京航空航天大學(xué)學(xué)報(bào);2009年04期

7 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學(xué)習(xí)研究[J];計(jì)算機(jī)科學(xué);2009年09期

8 陳全;趙文輝;李潔;江雨燕;;選擇性集成學(xué)習(xí)算法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期

9 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹選擇性集成學(xué)習(xí)方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年17期

10 饒峰;;核機(jī)器集成學(xué)習(xí)算法的誤差分析[J];重慶文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期

相關(guān)會議論文 前4條

1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類器集成學(xué)習(xí)算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年

2 劉伍穎;王挺;;一種多過濾器集成學(xué)習(xí)垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

4 李燁;蔡云澤;許曉鳴;;基于支持向量機(jī)集成的故障診斷[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年

相關(guān)博士學(xué)位論文 前10條

1 阿里木·賽買提(Alim.Samat);基于集成學(xué)習(xí)的全極化SAR圖像分類研究[D];南京大學(xué);2015年

2 王永明;集成回歸問題若干關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年

3 常征;基于混合集成學(xué)習(xí)的眼部與四肢交互動作建模與識別[D];北京科技大學(xué);2016年

4 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年

5 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年

6 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年

7 王清;集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2011年

8 方育柯;集成學(xué)習(xí)理論研究及其在個(gè)性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年

9 侯勇;特征提取與集成學(xué)習(xí)算法的研究及應(yīng)用[D];北京科技大學(xué);2015年

10 李燁;基于支持向量機(jī)的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年

2 宋文展;基于抽樣的集成進(jìn)化算法研究[D];廣西大學(xué);2015年

3 湯瑩;遷移與集成學(xué)習(xí)在文本分類中的應(yīng)用研究[D];江蘇科技大學(xué);2015年

4 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年

5 丘橋云;結(jié)合文本傾向性分析的股評可信度計(jì)算研究[D];哈爾濱工業(yè)大學(xué);2014年

6 秦海;融合非標(biāo)記樣本選擇的集成學(xué)習(xí)研究[D];湘潭大學(xué);2015年

7 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年

8 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫定量分析[D];解放軍信息工程大學(xué);2014年

9 王希玲;基于選擇性集成學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測方法研究[D];青島科技大學(xué);2016年

10 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年

,

本文編號:1533841

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1533841.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5eb60***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com