天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于翻譯關(guān)系圖的復述獲取方法研究

發(fā)布時間:2018-10-08 14:09
【摘要】:復述是同一語言內(nèi),相同語義的不同表述方式,是語言活動中普遍存在的現(xiàn)象,反映了自然語言的多樣性和復雜性,是機器理解自然語言的標準之一。隨著自然語言處理中詞語切分、句法分析等底層技術(shù)不斷發(fā)展,復述研究越來越受到研究者的關(guān)注,其中,復述的研究內(nèi)容主要包括復述知識獲取和復述生成。由于復述實例庫在領(lǐng)域和規(guī)模上的局限性,研究人員嘗試利用更易獲取的大規(guī)模雙語平行語料來抽取復述知識,提出基于“樞軸”的復述知識獲取方法!皹休S”法的基本假設(shè)是:若同一語言中的兩個短語對應相同的外文翻譯,那么它們之間就可能存在復述關(guān)系。在利用大規(guī)模雙語語料獲取復述知識中,傳統(tǒng)“樞軸”法只能考慮兩步以內(nèi)的復述現(xiàn)象。本文針對傳統(tǒng)方法的局限性,提出了改進方法并設(shè)計實驗驗證本文所提方法的有效性。具體工作包括以下幾方面:(1)提出基于短語翻譯表的翻譯關(guān)系圖構(gòu)建方法。在大規(guī)模短語翻譯表中,同一語言某個短語可能對應多個外文翻譯。傳統(tǒng)“樞軸”法在利用大規(guī)模短語表獲取復述短語的方法中,只考慮對應同一外文翻譯的兩個短語之間復述的可能性,有局限性。本文提出基于短語翻譯表構(gòu)建翻譯關(guān)系圖的方法,用以表示大規(guī)模短語翻譯表中短語之間豐富的翻譯關(guān)系,成為本文利用翻譯關(guān)系圖設(shè)計復述短語獲取算法的基礎(chǔ)。(2)設(shè)計基于隨機行走N步的復述獲取算法和基于期望步數(shù)的復述短語可信度計算方法。解決圖中相似節(jié)點搜索問題的典型方法是基于隨機行走的排序算法。研究者嘗試在排序算法中融合取樣技術(shù)與剪枝方法,提出一種高效的圖中節(jié)點相似度的量化計算方法,本文采用該方法實現(xiàn)基于隨機行走的復述短語獲取。同時,我們使用期望步數(shù)對復述短語可信度進行評價,并按照可信度從大到小對復述短語結(jié)果排序。(3)提出利用多語言對擴展翻譯關(guān)系圖的方法。本文在(1)中利用雙語短語翻譯表構(gòu)建的翻譯關(guān)系圖,兩個短語通過與同一個外文短語的翻譯關(guān)系建立復述聯(lián)系。但是,本文研究發(fā)現(xiàn)這樣圖中會出現(xiàn)很多孤立的子圖。為了解決這個問題,本文進一步提出引入新的語言對擴展翻譯關(guān)系圖的方法,有效提升復述短語獲取的效率。(4)基于詞向量的復述短語語義計算。詞向量是一種基于神經(jīng)網(wǎng)絡(luò)的語言表示方法,本文基于詞向量實現(xiàn)復述短語的語義表示,進而計算不同短語之間的語義距離,并與期望步數(shù)進行相關(guān)性比較。本文對所提出的改進方法進行實驗驗證,實驗數(shù)據(jù)采用NTCIR漢英和英日雙語平行語料,分別設(shè)計不同實驗,并與傳統(tǒng)基于“樞軸”的復述獲取方法進行了對比。實驗結(jié)果表明,本文所提出的方法能夠獲取更多的復述知識,而且擴展語言對的翻譯關(guān)系圖能夠有效獲取更多潛在的復述知識。同時,本文利用期望步數(shù)作為復述短語可信度的評價依據(jù)對輸出復述短語排序,能夠?qū)⑴c測試短語語義最相近的復述短語結(jié)果排在靠前的位置,證明了期望步數(shù)作為復述短語可信度的評價依據(jù)是有效可行的。另外,利用詞向量構(gòu)建的復述短語義向量表示和期望步數(shù)之間具有負相關(guān)性,更進一步證明了期望步數(shù)作為復述短語可信度的評價依據(jù)是正確有效的。
[Abstract]:......
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前9條

1 康樂;蔡懿慈;洪先龍;;隨機行走算法研究及其在電源/地線網(wǎng)絡(luò)瞬態(tài)優(yōu)化中的應用[J];計算機輔助設(shè)計與圖形學學報;2007年09期

2 倪峗;;網(wǎng)絡(luò)偏好隨機行走中負載和主本征矢的線性關(guān)聯(lián)[J];信息系統(tǒng)工程;2011年08期

3 王威;狄鵬;胡斌;;基于隨機行走介數(shù)的級聯(lián)失效模型[J];系統(tǒng)工程與電子技術(shù);2012年09期

4 符永銓;王意潔;周婧;;基于自適應隨機行走的可擴展無偏抽樣方法[J];軟件學報;2009年03期

5 朱小飛;郭嘉豐;程學旗;蘭艷艷;;基于吸收態(tài)隨機行走的兩階段效用性查詢推薦方法[J];計算機研究與發(fā)展;2013年12期

6 馬行空;王意潔;鄭重;;基于隨機行走的自適應規(guī)模估計方法[J];計算機工程;2010年12期

7 孫澤武;朱恒亮;曾璇;;考慮懸浮啞元的結(jié)構(gòu)化隨機行走電容提取算法[J];復旦學報(自然科學版);2014年01期

8 鄧俊勇;錢江華;卓成;周金芳;陳抗生;;用于電源/地網(wǎng)絡(luò)分析的隨機行走算法改進[J];浙江大學學報(工學版);2007年08期

9 駱祖瑩,王國璞,蔡懿慈,洪先龍,Sheldon,X.-D.Tan;基于部分隨機行走的電源線/地線(P/G)網(wǎng)絡(luò)快速求解方法[J];計算機輔助設(shè)計與圖形學學報;2004年11期

相關(guān)會議論文 前8條

1 李敏;張永生;郭光燦;;周期勢場中的直線量子隨機行走[A];第十五屆全國量子光學學術(shù)報告會報告摘要集[C];2012年

2 薛鵬;;可擴展的一維及高維量子隨機行走的物理實現(xiàn)[A];第十四屆全國量子光學學術(shù)報告會報告摘要集[C];2010年

3 陳唯;;細胞遷移中的反常隨機行走[A];第七屆全國液體和軟物質(zhì)物理學術(shù)會議程序冊及論文摘要集[C];2010年

4 吳亮;朱士群;;復雜網(wǎng)絡(luò)上基于負載的偏好隨機行走[A];蘇州市自然科學優(yōu)秀學術(shù)論文匯編(2008-2009)[C];2010年

5 顧國慶;余建華;;迷宮不穩(wěn)定性的隨機行走模型[A];科學決策與系統(tǒng)工程——中國系統(tǒng)工程學會第六次年會論文集[C];1990年

6 趙健偉;陳天南;黎紹洪;張世界;;利用隨機行走模擬分子擴散[A];中國化學會第27屆學術(shù)年會第14分會場摘要集[C];2010年

7 駱祖瑩;王國璞;蔡懿慈;洪先龍;Sheldon;X.-D.Tan;;基于部分隨機行走的電源線/地線(P/G)網(wǎng)絡(luò)快速求解算法[A];全國第13屆計算機輔助設(shè)計與圖形學(CAD/CG)學術(shù)會議論文集[C];2004年

8 林方;包景東;;運用CTRW-Metropolis模型數(shù)值研究亞穩(wěn)勢中粒子逃逸問題[A];全國計算物理學會第六屆年會和學術(shù)交流會論文摘要集[C];2007年

相關(guān)博士學位論文 前3條

1 李敏;量子隨機行走的基本性質(zhì)及應用研究[D];中國科學技術(shù)大學;2013年

2 傅應強;基于隨機行走方法的微納受限空間粒子擴散模擬[D];南京大學;2013年

3 吳亮;有限信息背景下的網(wǎng)絡(luò)結(jié)構(gòu)和行為[D];蘇州大學;2009年

相關(guān)碩士學位論文 前10條

1 景興利;隨機行走在復雜網(wǎng)絡(luò)上的交通行為特性分析[D];合肥工業(yè)大學;2015年

2 張宇超;高概率量子隨機行走搜索算法研究[D];解放軍信息工程大學;2015年

3 馬軍;基于翻譯關(guān)系圖的復述獲取方法研究[D];北京交通大學;2017年

4 張國春;平面上的一種隨機行走模型及其計算機模擬[D];河北大學;2010年

5 丁鐵紅;平面上一特殊的隨機行走模型[D];河北大學;2009年

6 李筠;量子隨機行走搜索算法研究[D];華東師范大學;2006年

7 陳莉莉;隨機行走理論在微型分離器件模擬研究中的應用[D];南京大學;2013年

8 胡耀光;復雜網(wǎng)絡(luò)上的隨機行走[D];陜西師范大學;2014年

9 王文娟;非均勻量子隨機行走中波包擴散的動力學行為研究[D];南京師范大學;2014年

10 李縣法;大亞灣潮流場擬譜法計算及物質(zhì)擴散的粒子隨機行走模擬[D];暨南大學;2007年

,

本文編號:2257052

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2257052.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ed60d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com