基于集成多分類器系統(tǒng)的文本情感分類模型
發(fā)布時(shí)間:2021-01-19 16:30
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,越來(lái)越多的人們喜歡在網(wǎng)絡(luò)上表達(dá)他們的觀點(diǎn)。人們?cè)诰W(wǎng)絡(luò)上發(fā)表的文本內(nèi)容大多包含一定的情感傾向且具有潛在的商業(yè)和社會(huì)價(jià)值,針對(duì)這類網(wǎng)絡(luò)文本的情感分類研究也隨之出現(xiàn)。本文的研究?jī)?nèi)容為文本的情感二分類。針對(duì)這個(gè)任務(wù),本文在一個(gè)基于MCS(Multiple Classifier Systems)的分類模型的基礎(chǔ)上,提出一種基于集成多分類器系統(tǒng)的文本情感分類模型。該模型包含三個(gè)多分類器系統(tǒng),它們的組合策略為多數(shù)投票法?紤]到區(qū)別特征選擇器在特征選擇上的缺陷,提出一種基于類別區(qū)分度的區(qū)別特征選擇器。本文的研究?jī)?nèi)容分別從優(yōu)化分類模型和優(yōu)化特征選擇兩個(gè)方面去提高文本情感分類的分類準(zhǔn)確度。本文詳細(xì)的研究?jī)?nèi)容概括如下:(1)提出一種基于集成多分類器系統(tǒng)的文本情感分類模型。不同于傳統(tǒng)的集成學(xué)習(xí)模型使用單分類器作為集成模型的個(gè)體分類器,本文提出的文本情感分類模型使用三個(gè)多分類器系統(tǒng)作為總模型的個(gè)體分類器,并且這三個(gè)個(gè)體分類器是異質(zhì)的。第一個(gè)多分類器系統(tǒng)使用的個(gè)體分類器是支撐向量機(jī)分類器,使用袋裝法作為多個(gè)個(gè)體分類器的集成方法。第二個(gè)多分類器系統(tǒng)使用的個(gè)體分類器也為支撐向量機(jī)分類器,使用...
【文章來(lái)源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本分類流程
向量空間模型文本表示示意圖
集成學(xué)習(xí)的一般結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于Bagging集成學(xué)習(xí)算法的地震事件性質(zhì)識(shí)別分類[J]. 任濤,林夢(mèng)楠,陳宏峰,王冉冉,李松威,劉曉雨,劉杰. 地球物理學(xué)報(bào). 2019(01)
[2]集成學(xué)習(xí)方法研究[J]. 周鋼,郭福亮. 計(jì)算技術(shù)與自動(dòng)化. 2018(04)
[3]房?jī)r(jià)預(yù)測(cè)機(jī)器學(xué)習(xí)之集成學(xué)習(xí)[J]. 勵(lì)嘉豪,曾丹. 電子技術(shù)與軟件工程. 2018(20)
[4]基于情感傾向和SVM混合極短文本分類模型[J]. 王鶴琴,王楊. 科技通報(bào). 2018(08)
[5]基于微博情感分析和社會(huì)網(wǎng)絡(luò)分析的霧霾輿情研究[J]. 何躍,朱婷婷. 情報(bào)科學(xué). 2018(07)
[6]文本特征提取方法研究綜述[J]. 徐冠華,趙景秀,楊紅亞,劉爽. 軟件導(dǎo)刊. 2018(05)
[7]基于概率模型的非均勻數(shù)據(jù)聚類算法[J]. 楊天鵬,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2018(10)
[8]基于集成學(xué)習(xí)的口令強(qiáng)度評(píng)估模型[J]. 宋創(chuàng)創(chuàng),方勇,黃誠(chéng),劉亮. 計(jì)算機(jī)應(yīng)用. 2018(05)
[9]基于Bagging策略的XGBoost算法在商品購(gòu)買預(yù)測(cè)中的應(yīng)用[J]. 謝冬青,周成驥. 現(xiàn)代信息科技. 2017(06)
[10]混合CHI和MI的改進(jìn)文本特征選擇方法[J]. 王振,邱曉暉. 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(04)
本文編號(hào):2987328
【文章來(lái)源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本分類流程
向量空間模型文本表示示意圖
集成學(xué)習(xí)的一般結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于Bagging集成學(xué)習(xí)算法的地震事件性質(zhì)識(shí)別分類[J]. 任濤,林夢(mèng)楠,陳宏峰,王冉冉,李松威,劉曉雨,劉杰. 地球物理學(xué)報(bào). 2019(01)
[2]集成學(xué)習(xí)方法研究[J]. 周鋼,郭福亮. 計(jì)算技術(shù)與自動(dòng)化. 2018(04)
[3]房?jī)r(jià)預(yù)測(cè)機(jī)器學(xué)習(xí)之集成學(xué)習(xí)[J]. 勵(lì)嘉豪,曾丹. 電子技術(shù)與軟件工程. 2018(20)
[4]基于情感傾向和SVM混合極短文本分類模型[J]. 王鶴琴,王楊. 科技通報(bào). 2018(08)
[5]基于微博情感分析和社會(huì)網(wǎng)絡(luò)分析的霧霾輿情研究[J]. 何躍,朱婷婷. 情報(bào)科學(xué). 2018(07)
[6]文本特征提取方法研究綜述[J]. 徐冠華,趙景秀,楊紅亞,劉爽. 軟件導(dǎo)刊. 2018(05)
[7]基于概率模型的非均勻數(shù)據(jù)聚類算法[J]. 楊天鵬,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2018(10)
[8]基于集成學(xué)習(xí)的口令強(qiáng)度評(píng)估模型[J]. 宋創(chuàng)創(chuàng),方勇,黃誠(chéng),劉亮. 計(jì)算機(jī)應(yīng)用. 2018(05)
[9]基于Bagging策略的XGBoost算法在商品購(gòu)買預(yù)測(cè)中的應(yīng)用[J]. 謝冬青,周成驥. 現(xiàn)代信息科技. 2017(06)
[10]混合CHI和MI的改進(jìn)文本特征選擇方法[J]. 王振,邱曉暉. 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(04)
本文編號(hào):2987328
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2987328.html
最近更新
教材專著