天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于布谷鳥搜索優(yōu)化算法的多文檔摘要方法

發(fā)布時間:2021-11-09 11:29
  為最大化生成摘要的信息量,提出一種基于布谷鳥搜索(CS)算法與多目標(biāo)函數(shù)的多文檔摘要方法。對多文檔數(shù)據(jù)進(jìn)行預(yù)處理,通過句子分割、分詞、移除停用詞和詞干化將文檔轉(zhuǎn)化為詞語的基本處理形式,計算經(jīng)數(shù)據(jù)預(yù)處理后的句子信息量得分并將其作為CS算法的輸入,再基于多目標(biāo)函數(shù)生成包含原始文檔重要信息的句子以組成最終的摘要。實驗結(jié)果表明,與基于粒子群優(yōu)化算法和雙層K最近鄰算法的多文檔摘要方法相比,該方法在最大化生成摘要信息量的前提下,保證了高可讀性和低冗余性,并且在DUC基準(zhǔn)數(shù)據(jù)集上的摘要平均準(zhǔn)確度高達(dá)0.99。 

【文章來源】:計算機(jī)工程. 2020,46(07)北大核心CSCD

【文章頁數(shù)】:8 頁

【部分圖文】:

基于布谷鳥搜索優(yōu)化算法的多文檔摘要方法


多文檔摘要處理流程

流程圖,詞干,預(yù)處理,句子


預(yù)處理流程

流程圖,流程,句子,信息量


在輸入表示階段,使用預(yù)處理后的數(shù)據(jù)計算每個句子的權(quán)重(術(shù)語頻率之和),即句子信息量得分,將句子信息量得分作為算法輸入,其流程如圖3所示。1.3 摘要表示

【參考文獻(xiàn)】:
期刊論文
[1]一種話題敏感的抽取式多文檔摘要方法[J]. 應(yīng)文豪,李素建,穗志方.  中文信息學(xué)報. 2017(06)
[2]基于LexRank的中文單文檔摘要方法[J]. 劉海燕,張鈺.  兵器裝備工程學(xué)報. 2017(06)
[3]融合句義特征的多文檔自動摘要算法研究[J]. 羅森林,白建敏,潘麗敏,韓磊,孟強(qiáng).  北京理工大學(xué)學(xué)報. 2016(10)
[4]基于增量圖聚類的動態(tài)多文檔摘要算法[J]. 郭海蓉,張暉,趙旭劍,李波,楊春明.  計算機(jī)應(yīng)用研究. 2016(07)
[5]基于文本挖掘的漏洞信息聚類分析[J]. 高嶺,申元,高妮,雷艷婷,孫騫.  東南大學(xué)學(xué)報(自然科學(xué)版). 2015(05)
[6]基于LDA重要主題的多文檔自動摘要算法[J]. 劉娜,路瑩,唐曉君,李明霞.  計算機(jī)科學(xué)與探索. 2015(02)
[7]動態(tài)適應(yīng)布谷鳥搜索算法[J]. 張永韡,汪鐳,吳啟迪.  控制與決策. 2014(04)
[8]逐維改進(jìn)的布谷鳥搜索算法[J]. 王李進(jìn),尹義龍,鐘一文.  軟件學(xué)報. 2013(11)

碩士論文
[1]基于word2vec的中文自動摘要方法研究[D]. 王雪霏.哈爾濱工業(yè)大學(xué) 2017
[2]基于主題句語義融合的多文檔摘要算法研究[D]. 劉子平.重慶大學(xué) 2016



本文編號:3485246

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3485246.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ddf67***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com