天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于卷積神經(jīng)網(wǎng)絡結(jié)合詞向量的中文短文本分類研究

發(fā)布時間:2021-12-09 10:36
  文本分類是自然語言處理領域里用于文本信息處理的關鍵性技術,主要由文本表示和分類模型(算法)組成。在當今文本信息極速增長的時代,文本分類為人們有效、便捷、快速地獲取所需信息發(fā)揮著重大作用。短文本作為文本信息的主要載體之一,具有長度短、特征稀疏、實時性強、格式不規(guī)則等特點,從而基于詞袋特征或向量空間的傳統(tǒng)機器學習算法不能有效的提取短文本特征,進而影響分類效果。深度學習算法強大的特征提取能力在文本分類中具有獨特的優(yōu)勢,因此,利用深度學習進行文本分類建模成為當前的研究熱點。本文基于卷積神經(jīng)網(wǎng)絡模型并結(jié)合詞向量的文本表示方法,針對中文短文本分類的相關技術點進行研究工作,取得的相關研究成果如下:1、提出一種應用于卷積神經(jīng)網(wǎng)絡文本分類的詞向量模型。文本特征提取(文本輸入表示)作為文本分類技術的要點,其構建質(zhì)量直接影響著分類系統(tǒng)的分類效果,F(xiàn)在最流行的文本輸入表示——詞向量(Word Vector)雖然考慮了詞語之間的關聯(lián)性和相似性,但忽略了上下文局部詞序特征,在一些情況下造成文本語義上的缺失和歪曲。為此,本文提出了一種結(jié)合N-Gram特征與Word2vec的詞向量模型WordNG-Vec,其提取出的... 

【文章來源】:重慶理工大學重慶市

【文章頁數(shù)】:45 頁

【學位級別】:碩士

【部分圖文】:

基于卷積神經(jīng)網(wǎng)絡結(jié)合詞向量的中文短文本分類研究


向量空間模型

基于卷積神經(jīng)網(wǎng)絡結(jié)合詞向量的中文短文本分類研究


CBOW模型架構

基于卷積神經(jīng)網(wǎng)絡結(jié)合詞向量的中文短文本分類研究


Skip-gram模型架構

【參考文獻】:
期刊論文
[1]基于吸引子傳播聚類的改進雙通道CNN短文本分類算法[J]. 王儒,劉培玉,王培培.  小型微型計算機系統(tǒng). 2017(08)
[2]卷積神經(jīng)網(wǎng)絡研究綜述[J]. 周飛燕,金林鵬,董軍.  計算機學報. 2017(06)
[3]深度學習研究進展[J]. 劉建偉,劉媛,羅雄麟.  計算機應用研究. 2014(07)
[4]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉.  計算機研究與發(fā)展. 2013(09)
[5]文本分類綜述[J]. 靳小波.  自動化博覽. 2006(S1)
[6]基于機器學習的文本分類技術研究進展[J]. 蘇金樹,張博鋒,徐昕.  軟件學報. 2006(09)

博士論文
[1]基于深度學習的文本表示與分類方法研究[D]. 閆琰.北京科技大學 2016

碩士論文
[1]文本分類系統(tǒng)設計與實現(xiàn)[D]. 張琛馨.中山大學 2015
[2]基于機器學習的中文文本分類方法研究[D]. 劉依璐.西安電子科技大學 2009



本文編號:3530493

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3530493.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶5ad0d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com