天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的細(xì)粒度復(fù)述抽取技術(shù)研究

發(fā)布時(shí)間:2020-03-18 08:38
【摘要】:復(fù)述的相關(guān)技術(shù)研究很早就在國(guó)內(nèi)外開展了,它是自然語(yǔ)言處理任務(wù)中的一個(gè)重要領(lǐng)域。復(fù)述任務(wù)如果按文本粒度劃分的話,一般可以分為詞匯級(jí),短語(yǔ)級(jí)以及句子級(jí);按具體任務(wù)劃分,可以分為抽取式,判別式以及生成式。本課題基于深度學(xué)習(xí)的細(xì)粒度中文復(fù)述抽取技術(shù)研究,旨在研究細(xì)粒度(詞匯和短語(yǔ))的中文復(fù)述抽取,希望能夠獲取優(yōu)質(zhì)的復(fù)述資源。復(fù)述任務(wù)在自然語(yǔ)言處理任務(wù)中是偏底層的任務(wù),復(fù)述資源的好壞能直接影響很多上層任務(wù),例如:信息檢索、問(wèn)答系統(tǒng)、機(jī)器翻譯等都能夠通過(guò)復(fù)述資源進(jìn)行數(shù)據(jù)增強(qiáng),進(jìn)而提升任務(wù)效果。考慮到傳統(tǒng)方法在復(fù)述任務(wù)上已經(jīng)日趨瓶頸,而深度學(xué)習(xí)相關(guān)技術(shù)日趨火熱,在很多任務(wù)上都能夠幫助提升效果。本課題基于深度學(xué)習(xí)的細(xì)粒度中文復(fù)述抽取技術(shù)研究嘗試將深度學(xué)習(xí)的方法引入到中文復(fù)述任務(wù)中來(lái),希望能夠獲取到更加優(yōu)質(zhì)的復(fù)述資源。本課題所要研究的內(nèi)容主要包括以下三個(gè)部分:首先是詞匯級(jí)中文復(fù)述抽取技術(shù)研究;然后是中文短語(yǔ)劃分的技術(shù)研究;最后是短語(yǔ)級(jí)中文復(fù)述抽取技術(shù)研究。在詞匯級(jí)中文復(fù)述抽取任務(wù)中,本文提出了基于“樞軸法”的中文候選復(fù)述抽取方式,利用豐富的在線英文詞典,能夠獲取到大量的候選復(fù)述數(shù)據(jù)。與此同時(shí),本文還提出了帶負(fù)采樣機(jī)制的多模型融合的判別方式用于在候選中文詞匯復(fù)述的基礎(chǔ)上進(jìn)行判別過(guò)濾。通過(guò)對(duì)最終的中文詞匯的復(fù)述資源進(jìn)行隨機(jī)抽取并人工評(píng)價(jià),結(jié)果顯示:本課題中所提出來(lái)的中文詞匯復(fù)述抽取方法,都要優(yōu)于目前其他的中文詞匯復(fù)述抽取方法。在中文短語(yǔ)劃分的任務(wù)中,本文提出了2*BiLSTM+BiLSTM+CRF的序列標(biāo)注模型,基于CTB8.0的語(yǔ)料進(jìn)行模型訓(xùn)練和測(cè)試。該模型主要用于在中文單語(yǔ)語(yǔ)料上進(jìn)行短語(yǔ)劃分。通過(guò)實(shí)驗(yàn)比對(duì),最終證明的本文提出來(lái)的模型在中文短語(yǔ)劃分上的效果要優(yōu)于同類模型。在中文短語(yǔ)復(fù)述抽取任務(wù)中,本文運(yùn)用預(yù)先提出的序列標(biāo)注模型進(jìn)行中文短語(yǔ)劃分,通過(guò)規(guī)則過(guò)濾獲取到大概103萬(wàn)條優(yōu)質(zhì)的中文短語(yǔ)。在此基礎(chǔ)上進(jìn)行相關(guān)對(duì)比實(shí)驗(yàn),本文提出了基于二元注意力機(jī)制的遞歸自編碼模型,用以學(xué)習(xí)中文短語(yǔ)的向量表示,通過(guò)計(jì)算余弦相似度,以語(yǔ)義距離最相近的40個(gè)短語(yǔ)作為候選短語(yǔ)復(fù)述,同時(shí)按照語(yǔ)義相似度,對(duì)短語(yǔ)復(fù)述進(jìn)行排序。最后基于翻譯數(shù)據(jù)和規(guī)則,過(guò)濾錯(cuò)誤或者低質(zhì)量的候選短語(yǔ)復(fù)述。實(shí)驗(yàn)對(duì)比得出結(jié)論,本課題中提出來(lái)的中文短語(yǔ)復(fù)述抽取方法,要優(yōu)于目前的其他模型。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.1;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 許旭陽(yáng);韓永峰;宋文政;;事件抽取技術(shù)的回顧與展望[J];信息工程大學(xué)學(xué)報(bào);2011年01期

2 張克菊;韓毅;;關(guān)系抽取技術(shù)的發(fā)展與應(yīng)用——以生物信息學(xué)為例[J];情報(bào)科學(xué);2010年01期

3 黃勛;游宏梁;于洋;;關(guān)系抽取技術(shù)研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2013年11期

4 劉振;張智雄;;基于語(yǔ)義標(biāo)注的知識(shí)抽取相關(guān)技術(shù)的國(guó)外進(jìn)展研究[J];情報(bào)科學(xué);2015年08期

5 章順瑞;駱陳;;基于語(yǔ)義角色分析的事件抽取技術(shù)[J];太赫茲科學(xué)與電子信息學(xué)報(bào);2017年02期

6 高強(qiáng);游宏梁;;事件抽取技術(shù)研究綜述[J];情報(bào)理論與實(shí)踐;2013年04期

7 陳英;;基于專家系統(tǒng)的注塑模具關(guān)鍵技術(shù)研究[J];柳州職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年02期

8 葉圣濤;張洋;;隱喻抽取技術(shù)視閾下的大學(xué)生創(chuàng)業(yè)動(dòng)機(jī)初探[J];中國(guó)市場(chǎng);2017年18期

9 黃葆華;一種基于內(nèi)插和抽取技術(shù)的樣點(diǎn)序列延遲器[J];軍事通信技術(shù);1998年03期

10 唐筱璐;;利用ZMET隱喻抽取技術(shù)探討好看簿對(duì)于教師的價(jià)值[J];中國(guó)遠(yuǎn)程教育;2010年08期

相關(guān)會(huì)議論文 前7條

1 趙妍妍;秦兵;車萬(wàn)翔;劉挺;;中文事件抽取技術(shù)研究[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

2 王倩;何婷婷;聞彬;宋樂(lè);張茂元;;基于依存關(guān)系的中文情感要素抽取技術(shù)研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

3 楊潔;季鐸;蔡?hào)|風(fēng);白宇;;基于聯(lián)合權(quán)重的多文檔關(guān)鍵詞抽取技術(shù)[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

4 楊潔;季鐸;蔡?hào)|風(fēng);代翠;;基于TextRank的多文檔關(guān)鍵詞抽取技術(shù)[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

5 陸忠良;蘇厚勤;;基于Oracle/Linux環(huán)境數(shù)據(jù)抽取技術(shù)的研究與實(shí)踐[A];第四屆中國(guó)軟件工程大會(huì)論文集[C];2007年

6 岳玉波;馬淵明;馬凱;晏偉;黃麗娟;;OBN數(shù)據(jù)共反射點(diǎn)道集抽取技術(shù)[A];中國(guó)石油學(xué)會(huì)2019年物探技術(shù)研討會(huì)論文集[C];2019年

7 穆亞?wèn)|;周秉鋒;;基于信念傳播的圖像抽取算法[A];中國(guó)感光學(xué)會(huì)第七次全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)年會(huì)和第七屆青年學(xué)術(shù)交流會(huì)論文摘要集[C];2006年

相關(guān)碩士學(xué)位論文 前10條

1 顏欣;基于深度學(xué)習(xí)的細(xì)粒度復(fù)述抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

2 陳天琪;面向游戲評(píng)論的評(píng)價(jià)標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

3 趙威;面向用戶評(píng)論的觀點(diǎn)目標(biāo)和觀點(diǎn)詞協(xié)同抽取技術(shù)[D];桂林電子科技大學(xué);2019年

4 羅尚q;基于隱喻抽取技術(shù)的目的地風(fēng)景體驗(yàn)價(jià)值研究[D];重慶師范大學(xué);2016年

5 于俊鋒;面向電子郵件的近似世系關(guān)系抽取技術(shù)[D];東北大學(xué);2011年

6 劉培謙;面向海量數(shù)據(jù)的用戶觀點(diǎn)抽取技術(shù)實(shí)現(xiàn)與應(yīng)用[D];中山大學(xué);2015年

7 劉兆慶;博客社區(qū)發(fā)現(xiàn)及其主題抽取技術(shù)的研究[D];蘇州大學(xué);2013年

8 劉克彬;基于核函數(shù)的命名實(shí)體關(guān)系抽取技術(shù)研究[D];上海交通大學(xué);2007年

9 張慧敏;Deep Web查詢結(jié)果抽取技術(shù)研究與實(shí)現(xiàn)[D];暨南大學(xué);2015年

10 吳剛;基于主題的中文事件抽取技術(shù)研究及應(yīng)用[D];蘇州大學(xué);2009年

,

本文編號(hào):2588508

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2588508.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶66466***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com