基于滑動(dòng)窗口的動(dòng)態(tài)摘要算法
本文選題:動(dòng)態(tài)摘要 + 文本摘要; 參考:《計(jì)算機(jī)工程》2007年06期
【摘要】:動(dòng)態(tài)摘要是根據(jù)查詢檢索詞從文章中動(dòng)態(tài)提取的摘要。用戶僅僅瀏覽動(dòng)態(tài)摘要之后就能了解文章中與查詢相關(guān)的部分,進(jìn)而判斷是否值得詳細(xì)閱讀整篇文章。該文根據(jù)搜索引擎對摘要速度和質(zhì)量的要求,提出了一種使用滑動(dòng)窗口抽取片斷的算法,接著構(gòu)造了摘要評測模型,使用同一個(gè)測試集對新動(dòng)態(tài)摘要算法和Google、百度作對比實(shí)驗(yàn)。結(jié)果證明使用新方法生成的摘要能夠言簡意賅地概括文章的相關(guān)內(nèi)容,在摘要指標(biāo)的分項(xiàng)測試中取得了和Google基本相同的效果,但明顯要比百度好,綜合評價(jià)分別提高了5%和11%。
[Abstract]:Dynamic summary is a summary that is extracted dynamically from the article according to the query key word. After browsing the dynamic summary, the user can understand the query-related part of the article, and then determine whether it is worth reading the whole article. According to the requirements of search engines for the speed and quality of abstracts, this paper proposes an algorithm for extracting segments by sliding windows, and then constructs a model of summary evaluation, and uses the same test set to compare the new dynamic summary algorithm with Google and Baidu. The results show that the abstracts generated by the new method can generalize the relevant contents of the article concisely, and the results are basically the same as those obtained by Google in the itemized test of the summary index, but obviously better than that of Baidu, and the comprehensive evaluation increases by 5% and 11% respectively.
【作者單位】: 鞍山科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 鞍山科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 鞍山科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 鞍山科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院
【基金】:遼寧省自然科學(xué)基金資助項(xiàng)目(2004D110)
【分類號】:TP301.6
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 孫春葵,李蕾,楊曉蘭,鐘義信;基于知識(shí)的文本摘要系統(tǒng)研究與實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2000年07期
2 劉挺,吳巖,王開鑄;自動(dòng)文摘綜述[J];情報(bào)科學(xué);1998年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前7條
1 王繼成 ,武港山 ,周源遠(yuǎn) ,張福炎;一種篇章結(jié)構(gòu)指導(dǎo)的中文Web文檔自動(dòng)摘要方法[J];計(jì)算機(jī)研究與發(fā)展;2003年03期
2 晉耀紅,苗傳江;一個(gè)基于語境框架的文本特征提取算法[J];計(jì)算機(jī)研究與發(fā)展;2004年04期
3 胡俊華,楊波,李金屏;自然語言理解研究略述[J];濟(jì)南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2001年05期
4 王萌,何婷婷,張偉;基于概念向量空間模型的中文自動(dòng)文摘系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2005年01期
5 劉功申,王永成,許一震;小標(biāo)題識(shí)別的意義和方法[J];計(jì)算機(jī)工程;2002年06期
6 徐曉丹;;中文網(wǎng)頁自動(dòng)摘要系統(tǒng)的研究[J];計(jì)算機(jī)與現(xiàn)代化;2006年09期
7 王萌,何婷婷,姬東鴻,王曉榮;基于HowNet概念獲取的中文自動(dòng)文摘系統(tǒng)[J];中文信息學(xué)報(bào);2005年03期
相關(guān)博士學(xué)位論文 前4條
1 耿煥同;范例推理與互聯(lián)網(wǎng)文本信息處理研究[D];中國科學(xué)技術(shù)大學(xué);2006年
2 何清;機(jī)器學(xué)習(xí)與文本挖掘若干算法研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年
3 周文;基于概念的若干知識(shí)表示模型及相關(guān)方法研究[D];上海大學(xué);2007年
4 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 王萌;基于概念向量空間模型的中文自動(dòng)文摘研究[D];華中師范大學(xué);2005年
2 馬長林;中文自動(dòng)文摘技術(shù)若干問題的研究[D];華中師范大學(xué);2002年
3 管冬根;Web文檔中信息的獲取與表示研究[D];重慶大學(xué);2003年
4 陳策;基于WEB技術(shù)的競爭情報(bào)系統(tǒng)的開發(fā)與研究[D];華北電力大學(xué)(河北);2004年
5 李輝;基于語義關(guān)系的摘要提取[D];南京理工大學(xué);2004年
6 關(guān)真珍;基于半督導(dǎo)機(jī)器學(xué)習(xí)的分詞算法的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2004年
7 王江偉;基于最大熵模型的中文命名實(shí)體識(shí)別[D];南京理工大學(xué);2005年
8 陳志敏;基于主題劃分的Web文檔自動(dòng)摘要研究[D];揚(yáng)州大學(xué);2006年
9 李康;自然語言理解中的語義形式化研究[D];西北工業(yè)大學(xué);2007年
10 柴曉麗;自動(dòng)文摘技術(shù)的研究與應(yīng)用[D];長春理工大學(xué);2007年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 姜賢塔,陳根才;利用字頻統(tǒng)計(jì)及機(jī)器學(xué)習(xí)的自動(dòng)文摘方法[J];浙江大學(xué)學(xué)報(bào)(理學(xué)版);1997年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫春葵,李蕾,楊曉蘭,鐘義信;基于知識(shí)的文本摘要系統(tǒng)研究與實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2000年07期
2 王文欣,黃萱菁,吳立德;基于統(tǒng)計(jì)方法的漢語自動(dòng)文摘系統(tǒng)研究[J];計(jì)算機(jī)應(yīng)用與軟件;2000年09期
3 鄒劍章;周經(jīng)野;陳益強(qiáng);胡明清;;基于事件框架的移動(dòng)摘要方法研究[J];微計(jì)算機(jī)信息;2010年12期
4 李建鋒;陳佳良;張美華;;一種基于聚類-遺傳算法的文摘提取方法研究[J];計(jì)算技術(shù)與自動(dòng)化;2007年03期
5 張培穎;;基于句子特征和語義距離的文本摘要技術(shù)[J];微計(jì)算機(jī)應(yīng)用;2009年07期
6 趙晶;林鴻飛;盧冶;;可視化文本分類樹瀏覽機(jī)制[J];小型微型計(jì)算機(jī)系統(tǒng);2006年03期
7 樹柏涵;閆宏飛;;搜索引擎動(dòng)態(tài)摘要算法[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年02期
8 劉茵;李弼程;;基于模糊決策的主旨句生成算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年04期
9 宋人杰;曹振麗;顧寧;;站內(nèi)搜索系統(tǒng)動(dòng)態(tài)摘要算法的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年05期
10 周強(qiáng);施水才;李渝勤;呂學(xué)強(qiáng);;句子重述技術(shù)在中文文本摘要中的應(yīng)用[J];情報(bào)學(xué)報(bào);2008年06期
相關(guān)會(huì)議論文 前10條
1 伊力亞爾·加爾木哈買提;尼亞子別克·阿不都加勒力;;哈薩克文自動(dòng)文本摘要方法淺談[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
2 王慧芳;張勇;邢春曉;張文珂;楊吉江;;文本摘要算法集成與實(shí)現(xiàn)[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
3 張龍凱;王厚峰;;文本摘要中的句子抽取方法研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
4 蔣永鍇;葉東毅;;基于稀疏非負(fù)矩陣分解的自動(dòng)多文摘方法[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
5 李立燕;楊國緯;;中文自動(dòng)文摘系統(tǒng)研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
6 趙國榮;楊爾弘;;事件類時(shí)間短語識(shí)別[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
7 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
8 武洪萍;周國祥;;Web文本挖掘研究[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
9 王萌;王曉榮;李春貴;唐培和;;基于局部與全局信息的自動(dòng)文摘算法[A];廣西計(jì)算機(jī)學(xué)會(huì)2007年年會(huì)論文集[C];2007年
10 周國棟;孔芳;朱巧明;;指代消解:國內(nèi)外研究現(xiàn)狀及趨勢[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)博士學(xué)位論文 前4條
1 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
2 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
3 徐昊;基于跨媒體信息和高效圖像編碼算法的圖像搜索關(guān)鍵技術(shù)[D];中國科學(xué)技術(shù)大學(xué);2011年
4 韋福如;基于圖模型多文檔自動(dòng)文摘研究[D];武漢大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 尹顯貴;基于Web的企業(yè)競爭情報(bào)服務(wù)平臺(tái)中多文本摘要技術(shù)研究[D];昆明理工大學(xué);2012年
2 叢艷;自動(dòng)文本摘要方法的研究及應(yīng)用[D];華北電力大學(xué)(北京);2004年
3 吳世漢;面向查詢的XML文本摘要技術(shù)[D];江西財(cái)經(jīng)大學(xué);2010年
4 苗家;Blog文檔的自動(dòng)文摘方法研究[D];山東大學(xué);2011年
5 劉霞;基于潛在語義分析的單文本自動(dòng)摘要方法研究[D];南京郵電大學(xué);2011年
6 王舟;面向論壇信息文本的有效數(shù)據(jù)抽取研究[D];華中科技大學(xué);2011年
7 梁旭;評論文本的對立觀點(diǎn)摘要的研究[D];北京交通大學(xué);2013年
8 王丫;網(wǎng)絡(luò)新聞流中熱點(diǎn)事件識(shí)別與跟蹤算法的改進(jìn)與驗(yàn)證[D];燕山大學(xué);2007年
9 薛靜;中文信息檢索中相關(guān)算法的研究[D];遼寧科技大學(xué);2007年
10 閆英杰;偏重摘要技術(shù)及其應(yīng)用研究[D];大連理工大學(xué);2007年
,本文編號:2079220
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2079220.html