天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于CNN的中文文本摘要自動(dòng)生成方法研究

發(fā)布時(shí)間:2021-04-23 21:56
  技術(shù)是指通過(guò)算法對(duì)文本信息高度概括后生成更加精煉、語(yǔ)義通順的摘要,目的是為了在文本類數(shù)據(jù)中快速的篩選信息,解決信息冗余過(guò)載的問(wèn)題。當(dāng)前文本摘要的研究大多集中在傳統(tǒng)抽取式技術(shù),難以完成在大數(shù)據(jù)環(huán)境下的具體工作,得益于深度學(xué)習(xí)技術(shù)的不斷發(fā)展,本文采用CNN與LSTM的方法實(shí)現(xiàn)了基于Seq2seq-attention機(jī)制模型的改進(jìn),并在Sogou CS新聞數(shù)據(jù)上,利用ROUGE評(píng)價(jià)指標(biāo),設(shè)置了4組實(shí)驗(yàn)進(jìn)行對(duì)比和評(píng)估。首先,本文詳細(xì)介紹了傳統(tǒng)文本摘要方法。并以Textrank和TF-IDF兩種較為突出的算法為例,詳細(xì)梳理傳統(tǒng)方法的原理及存在的不足,并將兩種傳統(tǒng)方法的結(jié)果與改進(jìn)后模型的結(jié)果作比較。其次,由于傳統(tǒng)抽取方法在文本摘要中未考慮上下文語(yǔ)義特征的信息,因此本文對(duì)基于傳統(tǒng)Seq2seq-attention機(jī)制模型的框架拆分研究,并根據(jù)深度學(xué)習(xí)算法將CNN框架用在編碼器,LSTM框架用在解碼器,從而實(shí)現(xiàn)了模型改進(jìn),之后在同一數(shù)據(jù)集上與傳統(tǒng)的基于RNN框架的Seq2seq-attention機(jī)制模型對(duì)比。實(shí)驗(yàn)表明,改進(jìn)后的模型在ROUGE評(píng)分上高于傳統(tǒng)生成式模型,可以表明改進(jìn)后的模型能夠運(yùn)用在生... 

【文章來(lái)源】:東北師范大學(xué)吉林省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:55 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
中文摘要
英文摘要
第一章 引言
    1.1 研究背景與研究意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 論文研究?jī)?nèi)容
    1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)知識(shí)
    2.1 文本摘要技術(shù)介紹
    2.2 相關(guān)模型介紹
    2.3 詞向量表示方法
    2.4 本章小結(jié)
第三章 文本摘要生成模型的構(gòu)建
    3.1 數(shù)據(jù)集預(yù)處理
    3.2 評(píng)價(jià)指標(biāo)
    3.3 Word2Vec詞向量模型構(gòu)建
    3.4 Seq2seq模型
    3.5 Seq2seq-Attention模型
    3.6 基于CNN的 Seq2Seq-attention相融合文本摘要模型構(gòu)建
    3.7 實(shí)驗(yàn)
    3.8 本章小結(jié)
第四章 文本摘要系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    4.1 需求分析
    4.2 系統(tǒng)設(shè)計(jì)
    4.3 系統(tǒng)實(shí)現(xiàn)及測(cè)試
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝
在學(xué)期間公開發(fā)表論文及著作情況


【參考文獻(xiàn)】:
期刊論文
[1]異構(gòu)文本數(shù)據(jù)轉(zhuǎn)換中XML解析方法對(duì)比研究[J]. 何卓桁,劉志勇,李璐,李長(zhǎng)明,張琳.  計(jì)算機(jī)工程. 2020(07)
[2]基于Seq2seq模型的推薦應(yīng)用研究[J]. 陳俊航,徐小平,楊恒泓.  計(jì)算機(jī)科學(xué). 2019(S1)
[3]融合詞匯特征的生成式摘要模型[J]. 江躍華,丁磊,李嬌娥,杜皓晅,高凱.  河北科技大學(xué)學(xué)報(bào). 2019(02)
[4]面向非任務(wù)型對(duì)話系統(tǒng)的人工標(biāo)注中文數(shù)據(jù)集[J]. 李菁,張海松,宋彥.  中文信息學(xué)報(bào). 2019(03)
[5]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理.  計(jì)算機(jī)應(yīng)用. 2018(S2)
[6]基于深度學(xué)習(xí)的文本自動(dòng)摘要方案[J]. 張克君,李偉男,錢榕,史泰猛,焦萌.  計(jì)算機(jī)應(yīng)用. 2019(02)
[7]文本摘要研究進(jìn)展與趨勢(shì)[J]. 明拓思宇,陳鴻昶.  網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2018(06)
[8]文本自動(dòng)摘要研究進(jìn)展[J]. 韋福如,周青宇,程骉,周明.  人工智能. 2018(01)
[9]深度神經(jīng)網(wǎng)絡(luò)并行化研究綜述[J]. 朱虎明,李佩,焦李成,楊淑媛,侯彪.  計(jì)算機(jī)學(xué)報(bào). 2018(08)
[10]一種話題敏感的抽取式多文檔摘要方法[J]. 應(yīng)文豪,李素建,穗志方.  中文信息學(xué)報(bào). 2017(06)



本文編號(hào):3156114

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3156114.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶88d45***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com