天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

會議摘要提取技術(shù)與評估方法的研究

發(fā)布時間:2017-08-29 16:21

  本文關(guān)鍵詞:會議摘要提取技術(shù)與評估方法的研究


  更多相關(guān)文章: 有監(jiān)督學(xué)習(xí) 無監(jiān)督學(xué)習(xí) 支持向量機 最大邊際相關(guān) ROUGE值


【摘要】:信息技術(shù)的發(fā)展日新月異,人們獲得信息的渠道也是多種多樣,用戶如何從海量的信息中獲得所需要的摘要信息已經(jīng)成為當今信息領(lǐng)域研究的一個熱門話題,F(xiàn)如今,每天的會議數(shù)不勝數(shù),且由于會議的本身自發(fā)性的特征,從而很容易出現(xiàn)一些與會議內(nèi)容無關(guān)的話題,人們?nèi)羰腔ㄙM時間去參加這些會議或者瀏覽會議全部內(nèi)容必定浪費大量的時間,若是人們能夠通過瀏覽會議摘要就可以獲得會議有效信息的話,不僅能夠節(jié)約冗長的參會時間,而且也提高了信息訪問的工作效率。自動會議摘要提取系統(tǒng)使得用戶僅僅通過瀏覽會議摘要就可以知道會議的內(nèi)容,從而避免了用戶訪問冗余信息,該系統(tǒng)目前引起了研究者的廣泛關(guān)注。提取技術(shù)主要包括有監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法,在使用有監(jiān)督學(xué)習(xí)方法進行會議摘要提取時,摘要提取的任務(wù)被視為一個二元分類問題旨在決定一個句子是否為摘要句。有監(jiān)督學(xué)習(xí)方法重點描述了支持向量機SVM方法,SVM二元分類方法是近幾年廣泛使用的分類方法,SVM在很多二元分類任務(wù)中具有較好的性能,然而那些接近分類面的樣本本身不具備劃分摘要句與非摘要句的明顯特征,雖然這些樣本的置信值有大小區(qū)分,但是仍然是處于分類上的一個模糊地帶,相互之間不存在明顯的優(yōu)先級。針對SVM存在的一些缺陷,后又使用MMR方法對SVM進行了后處理,并通過實驗表明MMR方法不僅可以去除摘要中的冗余信息,而且相比單純使用SVM方法進行摘要提取時性能更高。本文以會議文本為處理對象,以SVM和MMR摘要提取算法為基礎(chǔ),針對當前會議是圍繞某個特定的主題進行討論和交流的特點,提出了一種基于主題的MMR與SVM相融合的會議摘要提取方法。這種方法以主題關(guān)鍵詞為依據(jù)進行打分,并對MMR打分方法進行了改進的同時也兼顧句子位置特征等信息進行評分及重要性排序,使用ROUGE值評估方法進行摘要提取性能的評估。前人的研究中針對會議摘要提取算法已經(jīng)給出了大量的改進算法和不同的評估方法。結(jié)果表明,將基于主題的MMR與SVM相融合的摘要系統(tǒng)分別與SVM摘要系統(tǒng)、MMR摘要系統(tǒng)以及SVM與MMR相結(jié)合摘要系統(tǒng)進行對比時,前者提取的摘要效果更好。大部分的研究是針對會議摘要提取算法的改進和使用,有的研究使用有監(jiān)督摘要提取方法進行摘要句與非摘要句分類來提取會議摘要,有的研究者認為,會議語料庫是龐大的,人為的標注也是費時費力的,因此他們使用無監(jiān)督摘要提取方法進行會議摘要,也有的結(jié)合了有監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法優(yōu)點,提出了一種半監(jiān)督學(xué)習(xí)方法來提取會議摘要,也有的研究者將多種算法進行結(jié)合進行摘要的提取等等。根據(jù)會議所具有的自發(fā)語音的特征進行研究的少之又少。本研究根據(jù)會議所特有的特征,提出一種基于主題的會議摘要提取方法,該方法主要是沿著一個會議中某一個或者若干個特定話題進行摘要句的提取,實驗結(jié)果表明,基于主題的摘要提取方法在會議文本中表現(xiàn)出了較高的性能與優(yōu)點,更便于用戶的閱讀與理解。
【關(guān)鍵詞】:有監(jiān)督學(xué)習(xí) 無監(jiān)督學(xué)習(xí) 支持向量機 最大邊際相關(guān) ROUGE值
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;TP18
【目錄】:
  • 摘要3-5
  • Abstract5-10
  • 第一章 緒論10-20
  • 1.1 課題來源和意義10-15
  • 1.1.1 摘要與語音摘要10-11
  • 1.1.2 會議摘要的一般定義11-13
  • 1.1.3 會議摘要當前研究現(xiàn)狀13-15
  • 1.2 會議摘要的應(yīng)用及價值15-17
  • 1.3 本文主要研究內(nèi)容和組織結(jié)構(gòu)17-18
  • 1.4 本章小結(jié)18-20
  • 第二章 會議摘要提取方法與評估20-28
  • 2.1 會議語料庫簡介20-21
  • 2.2 會議摘要提取方法21-26
  • 2.2.1 無監(jiān)督學(xué)習(xí)方法提取摘要21-23
  • 2.2.2 有監(jiān)督學(xué)習(xí)方法提取摘要23-25
  • 2.2.3 其他方法25-26
  • 2.3 會議摘要提取評估方法26-27
  • 2.3.1 ROUGE值評估方法26-27
  • 2.3.2 金字塔評估方法27
  • 2.4 本章小結(jié)27-28
  • 第三章 SVM與MMR融合的會議摘要技術(shù)28-40
  • 3.1 會議文本特征選擇及預(yù)處理28-32
  • 3.1.1 會議文本預(yù)處理28-29
  • 3.1.2 詞匯特征29-30
  • 3.1.3 結(jié)構(gòu)和話語特征30-31
  • 3.1.4 主題相關(guān)特征31-32
  • 3.2 會議摘要提取技術(shù)描述32-33
  • 3.3 會議摘要提取SVM二元分類算法33-37
  • 3.3.1 支持向量機分類34-37
  • 3.4 SVM與MMR相融合算法37-39
  • 3.5 本章小結(jié)39-40
  • 第四章 基于主題的SVM與MMR融合的會議摘要技術(shù)40-50
  • 4.1 基于主題的會議摘要提出40-42
  • 4.2 基于主題的會議摘要提取技術(shù)42-45
  • 4.2.1 提取主題相關(guān)信息42-43
  • 4.2.2 句子重要性排序43
  • 4.2.3 句子置信值打分43-44
  • 4.2.4 摘要句順序調(diào)整44-45
  • 4.3 實驗仿真及結(jié)果分析45-48
  • 4.3.1 ICSI語料庫以及對其預(yù)處理45
  • 4.3.2 評估方法45
  • 4.3.3 實驗結(jié)果及分析45-48
  • 4.4 本章小結(jié)48-50
  • 第五章 總結(jié)與展望50-52
  • 參考文獻52-58
  • 致謝58-60
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄60

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 錢壽初;;第5屆國際生物醫(yī)學(xué)審稿和出版大會將于2005年召開[J];中國科技期刊研究;2003年03期

中國重要報紙全文數(shù)據(jù)庫 前5條

1 本報記者 周龍 整理;市委七屆十二次全委擴大會暨全市經(jīng)濟工作會議摘要[N];白銀日報;2014年

2 ;全省經(jīng)濟工作和城鎮(zhèn)化工作會議摘要[N];甘肅日報;2013年

3 本報記者 朱小兵;沃野綻放報春花[N];臺州日報;2012年

4 方舟子;腳踏兩只船的院士候選人[N];北京科技報;2005年

5 唐先武;渠氏技術(shù):一朝花開里外香[N];科技日報;2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 孟令閣;會議摘要提取技術(shù)與評估方法的研究[D];太原理工大學(xué);2016年

,

本文編號:754267

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/754267.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶02971***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com