天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于深度學(xué)習(xí)的主題分類及細(xì)粒度情感分析方法研究

發(fā)布時(shí)間:2021-07-03 19:19
  隨著微信、微博、電商等網(wǎng)絡(luò)平臺(tái)的發(fā)展,民眾、企業(yè)以及政府越來越傾向于將重要的文本信息發(fā)表在互聯(lián)網(wǎng)上,挖掘這些文本蘊(yùn)含的信息,無論對(duì)商家還是學(xué)者都有重要的意義。細(xì)粒度情感作為文本內(nèi)容的一種隱含信息,反映出用戶自身情緒和特定主題喜好程度,也包含熱門話題和社會(huì)情況。該應(yīng)用領(lǐng)域在建立評(píng)價(jià)體系、獲取實(shí)時(shí)熱點(diǎn)、控制網(wǎng)絡(luò)輿論等方面上存在巨大的研究價(jià)值。細(xì)粒度情感分析是一種多標(biāo)簽主題預(yù)測與多分類情感預(yù)測相結(jié)合的多任務(wù)問題,它需要對(duì)研究的文本先建立主題,再為主題建立多個(gè)情感屬性。深度學(xué)習(xí)技術(shù)在文本細(xì)粒度分析上存在樣本數(shù)量少,多任務(wù)計(jì)算量大,語義信息不全等問題。對(duì)此,本課題以經(jīng)典神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),從多權(quán)值輸入、組合網(wǎng)絡(luò)模型和優(yōu)化手段三個(gè)方面改進(jìn)研究方案,實(shí)現(xiàn)深度學(xué)習(xí)技術(shù)在細(xì)粒度情感分析上的應(yīng)用。主要工作如下:針對(duì)汽車數(shù)據(jù)集,提出一種基于Softmax回歸的多權(quán)值模型。該模型中從文本和數(shù)據(jù)的特殊性分析了文本特征及組合方式對(duì)主題分類產(chǎn)生的影響,通過擴(kuò)充文本內(nèi)容、修改TF-IDF公式和添加方差加權(quán)獲得增強(qiáng)后的文本信息,最后使用構(gòu)建的淺層神經(jīng)網(wǎng)絡(luò)來識(shí)別文本的主題。實(shí)驗(yàn)結(jié)果表明模型分類的準(zhǔn)確性優(yōu)于傳統(tǒng)的加權(quán)Wor... 

【文章來源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:60 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的主題分類及細(xì)粒度情感分析方法研究


CBOW模型示例

模型圖,示例,模型,單詞


重慶大學(xué)碩士學(xué)位論文2研究方法和相關(guān)分析13圖2.2Skip-gram模型示例Figure2.2Skip-grammodelCBOW和Skip-gram的網(wǎng)絡(luò)結(jié)構(gòu)鏡像對(duì)稱,在求解和學(xué)習(xí)權(quán)重的過程,均使用了反向傳播算法(BP)及梯度下降算法,CBOW和Skip-gram優(yōu)化的對(duì)數(shù)似然函數(shù)如(2.6)、(2.7)所示L=∑log(())∈(2.6)=∑(()|)∈(2.7)其中,()為單詞的上下文,為語料庫。Skip-gram由于在大語料庫下更新權(quán)重的計(jì)算復(fù)雜度過高,Mikolov等[36]在之后提出了分層Softmax及負(fù)采樣改進(jìn)方案降低了計(jì)算復(fù)雜度。Word2vec獲取的單詞向量,雖然擴(kuò)充了單詞的表達(dá)能力,但是仍沒有辦法表達(dá)一篇文檔,因?yàn)槊恳粋(gè)文檔的長度不同,包含的單詞數(shù)目不同,需要有一種方法將單詞向量轉(zhuǎn)換為文檔向量。自Word2vec提出后,有諸多學(xué)者將Word2vec應(yīng)用于文本分類,將不同長度的文本映射到向量空間的方法一般有兩個(gè)。一是將單詞的詞向量求和平均,這樣做的根據(jù)是Word2vec表示的詞向量不會(huì)因?yàn)榫性變換影響其隱含的信息,即將文檔當(dāng)做一個(gè)大型單詞來看待;另一種是結(jié)合tf-idf等詞信息表達(dá)方法做加權(quán)平均,本質(zhì)上與求和平均相同,但是將單詞的影響權(quán)重加入了考量。假設(shè)V為第i個(gè)文檔的文檔向量,L為第i個(gè)文檔的長度,,表示第i個(gè)文檔的第j個(gè)單詞的詞向量,,為第i個(gè)文檔的第j個(gè)單詞的影響權(quán)重,則上述兩種文檔表示法如公式(2.8)、(2.9)所示。V=∑,L=0(2.8)

基于深度學(xué)習(xí)的主題分類及細(xì)粒度情感分析方法研究


RNN展開結(jié)構(gòu)

【參考文獻(xiàn)】:
期刊論文
[1]基于word2vec的網(wǎng)站主題分類研究[J]. 程元堃,蔣言,程光.  計(jì)算機(jī)與數(shù)字工程. 2019(01)
[2]融合社交因素和評(píng)論文本卷積網(wǎng)絡(luò)模型的汽車推薦研究[J]. 馮永,陳以剛,強(qiáng)保華.  自動(dòng)化學(xué)報(bào). 2019(03)
[3]基于Word2vec的句子語義相似度計(jì)算研究[J]. 李曉,解輝,李立杰.  計(jì)算機(jī)科學(xué). 2017(09)
[4]面向汽車評(píng)論的細(xì)粒度情感分析方法研究[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,王麗娟,黃浩,蔡曉鳳.  廣東工業(yè)大學(xué)學(xué)報(bào). 2017(03)
[5]基于Word2vec的微博短文本分類研究[J]. 張謙,高章敏,劉嘉勇.  信息網(wǎng)絡(luò)安全. 2017(01)
[6]基于概率語義分布的短文本分類[J]. 馬成龍,顏永紅.  自動(dòng)化學(xué)報(bào). 2016(11)
[7]深度學(xué)習(xí)的維吾爾語語句隱式情感分類[J]. 李冬白,田生偉,禹龍,艾斯卡爾·艾木都拉,吐爾根·依布拉音.  計(jì)算機(jī)工程與設(shè)計(jì). 2016(09)
[8]基于觀點(diǎn)袋模型的汽車評(píng)論情感極性分類[J]. 廖健,王素格,李德玉,張鵬.  中文信息學(xué)報(bào). 2015(03)
[9]微博汽車領(lǐng)域中用戶觀點(diǎn)句識(shí)別方法的研究[J]. 潘艷茜,姚天昉.  中文信息學(xué)報(bào). 2014(05)
[10]基于LDA特征擴(kuò)展的短文本分類[J]. 呂超鎮(zhèn),姬東鴻,吳飛飛.  計(jì)算機(jī)工程與應(yīng)用. 2015(04)

碩士論文
[1]面向需求分析的汽車論壇虛假評(píng)論識(shí)別方法研究[D]. 倪鑫.合肥工業(yè)大學(xué) 2018
[2]基于汽車品牌評(píng)論的情感分類系統(tǒng)研究[D]. 張連彬.合肥工業(yè)大學(xué) 2017
[3]面向汽車在線評(píng)論的情感分類研究與應(yīng)用[D]. 黃鶴.哈爾濱工業(yè)大學(xué) 2013



本文編號(hào):3263192

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3263192.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f713***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com