天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 外語論文 > 小語種論文 >

漢語—泰語的跨語言查詢翻譯和擴展

發(fā)布時間:2020-06-09 20:47
【摘要】:近年來,隨著中國和泰國關(guān)系的發(fā)展,兩國之間在文化、經(jīng)濟、政治等各個方面的交流也不斷深入。由于漢語和泰語屬于兩種不同的語言,為網(wǎng)絡(luò)信息交流和溝通帶來了很多的障礙。為了更好的分享互聯(lián)網(wǎng)信息,促進中泰網(wǎng)絡(luò)信息交流,跨語言信息檢索技術(shù)的研究被提上了日程,它可以很好的解決此語言交流問題。為了提高漢語-泰語的跨語言信息檢索的性能,本文研究了漢泰跨語言查詢翻譯和查詢擴展。目前在漢-泰雙語語言信息化研究方面,主要集中在泰語或漢語本身的詞法、句法、及語義方面的研究,而專門針對漢語和泰語之間的信息處理方面,如漢語與泰語之間的機器翻譯、查詢擴展等方面的研究工作開展的工作還比較少。在漢語到泰語的翻譯研究中,當前沒有合適的雙語詞典作為翻譯工具,而且很多未登錄詞和命名實體也無法用詞典翻譯,同時也容易產(chǎn)生翻譯歧義的問題;由于沒有合適的知識庫作為擴展詞的來源,對泰語擴展詞的研究帶來了一定的難度。針對以上問題,主要完成了以下研究工作:(1)基于Word2Vec的漢語查詢語句的翻譯方法針對漢語查詢語句的翻譯,本文提出了一種基于深度學(xué)習(xí)工具Word2Vec的漢泰翻譯方法。該方法首先需要將漢泰可比語料庫中的詞,利用Word2Vec工具訓(xùn)練成詞向量的形式,以此可以方便挖掘出漢語和泰語詞與詞之間的線性映射關(guān)系,此線性映射關(guān)系體現(xiàn)在將不同語言中,概念相似的詞的詞向量映射到向量空間中其空間分布是相似的。本文利用這種相似分布關(guān)系訓(xùn)練出漢泰的翻譯矩陣,并通過翻譯矩陣獲取到泰語翻譯候選詞。(2)泰語翻譯候選詞的選取針對翻譯歧義問題,本文利用漢語和泰語雙語之間的詞與詞之間的翻譯概率關(guān)系,結(jié)合單語詞與詞之間的關(guān)聯(lián)關(guān)系,提出了一種泰語翻譯候選詞的篩選方法,用來消除翻譯歧義并得到最優(yōu)的翻譯泰語詞。(3)泰語查詢擴展模型的構(gòu)建為了提高檢索系統(tǒng)的性能,本文提出了一種基于偽相關(guān)反饋法的泰語查詢擴展方法。該方法的核心思想主要是應(yīng)用Lucene檢索技術(shù)檢索返回相關(guān)文檔集,并將返回的相關(guān)文檔作為擴展詞的來源,再利用將KL距離和詞共現(xiàn)兩種擴展技術(shù)通過Borda Count排序法相結(jié)合的方法,計算得出查詢擴展詞。最后,將擴展詞添加到原查詢語句中,最終可得到泰語查詢擴展語句。(4)設(shè)計并實現(xiàn)漢泰跨語言查詢翻譯和擴展的原型系統(tǒng),為進一步研究漢泰跨語言信息檢索提供了平臺,為以后的跨語言查詢擴展的研究做好堅實的基礎(chǔ)。
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:H412

【相似文獻】

相關(guān)會議論文 前10條

1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數(shù)字檔案檢索策略[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年

2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴展[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

3 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴展方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

4 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

5 李東園;白宇;蔡東風(fēng);;基于用戶日志分析的查詢擴展研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年

6 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年

7 王秉卿;張奇;吳立德;黃萱菁;;機器學(xué)習(xí)的查詢擴展在博客檢索中的應(yīng)用[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年

8 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

9 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

10 郭文;史曉東;陳毅東;;跨語言信息檢索中的查詢擴展[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年

相關(guān)重要報紙文章 前1條

1 鐘威 何擁軍;數(shù)字檔案信息擴展查詢功能需求分析及實現(xiàn)方式[N];中國檔案報;2011年

相關(guān)博士學(xué)位論文 前3條

1 郭曉黎;煤礦安全事件本體及其在查詢擴展中的應(yīng)用研究[D];中國礦業(yè)大學(xué)(北京);2016年

2 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學(xué);2011年

3 王俊義;正負相關(guān)反饋與查詢擴展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 吳德鈺;基于標簽篩選的文檔排序方法研究[D];華中師范大學(xué);2015年

2 李維銀;基于有監(jiān)督學(xué)習(xí)的查詢擴展技術(shù)研究[D];北京理工大學(xué);2015年

3 鐘廷偉;生物醫(yī)學(xué)文本的標注與檢索研究[D];電子科技大學(xué);2015年

4 王宇;煤礦安全事件本體構(gòu)建及其查詢擴展的研究與應(yīng)用[D];北京工業(yè)大學(xué);2015年

5 崔倩倩;基于文檔重構(gòu)的查詢擴展[D];北京工業(yè)大學(xué);2015年

6 陳建榮;基于用戶反饋的智能查詢擴展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年

7 燕澤權(quán);基于主題模型的查詢擴展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年

8 鄭永軍;基于DMLS的語音關(guān)鍵詞檢測技術(shù)研究[D];解放軍信息工程大學(xué);2014年

9 李云飛;基于查詢?nèi)罩镜膭討B(tài)查詢擴展研究[D];內(nèi)蒙古大學(xué);2016年

10 楊振瑜;基于概念語義相似度的長句查詢擴展研究[D];山東理工大學(xué);2013年

,

本文編號:2705233

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/waiyulunwen/zhichangyingyu/2705233.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶db46d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com