天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于維基百科的未登錄詞譯文挖掘

發(fā)布時(shí)間:2019-04-23 18:29
【摘要】:未登錄詞(out of vocabulary,OOV)的查詢(xún)翻譯是影響跨語(yǔ)言信息檢索(cross-language information retrieval,CLIR)性能的關(guān)鍵因素之一.它根據(jù)維基百科(Wikipedia)的數(shù)據(jù)結(jié)構(gòu)和語(yǔ)言特性,將譯文環(huán)境劃分為目標(biāo)存在環(huán)境和目標(biāo)缺失環(huán)境.針對(duì)目標(biāo)缺失環(huán)境下的譯文挖掘難點(diǎn),它采用頻度變化信息和鄰接信息實(shí)現(xiàn)候選單元抽取,并建立基于頻度-距離模型、表層匹配模板和摘要得分模型的混合譯文挖掘策略.實(shí)驗(yàn)將基于搜索引擎的未登錄詞挖掘技術(shù)作為baseline,并采用TOP1進(jìn)行評(píng)測(cè).實(shí)驗(yàn)驗(yàn)證基于維基百科的混合譯文挖掘方法可達(dá)到0.6822的譯文正確率,相對(duì)baseline取得6.98%的改進(jìn).
[Abstract]:......
【作者單位】: 蘇州大學(xué)江蘇省計(jì)算機(jī)信息處理重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(60970057,61003152)
【分類(lèi)號(hào)】:TP391.1

【共引文獻(xiàn)】

相關(guān)期刊論文 前1條

1 何曉聰;跨語(yǔ)言信息檢索初探[J];情報(bào)科學(xué);2005年02期

相關(guān)碩士學(xué)位論文 前2條

1 趙秀文;基于SSH和LDAP的網(wǎng)絡(luò)安全文件系統(tǒng)的研究[D];清華大學(xué);2005年

2 張東偉;中英文跨語(yǔ)言信息檢索模型研究[D];黑龍江大學(xué);2006年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張海粟;馬大明;鄧智龍;;基于維基百科的語(yǔ)義知識(shí)庫(kù)及其構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用研究;2011年08期

2 壽思聰;姚從磊;李曉明;;發(fā)現(xiàn)維基百科文章相關(guān)圖片[J];計(jì)算機(jī)科學(xué)與探索;2011年07期

3 龔書(shū);瞿有利;田盛豐;;基于維基語(yǔ)義的多文檔文摘研究[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

4 李文;李淼;梁青;朱海;應(yīng)玉龍;烏達(dá)巴拉;;基于短語(yǔ)統(tǒng)計(jì)機(jī)器翻譯模型蒙古文形態(tài)切分[J];中文信息學(xué)報(bào);2011年04期

5 姜文斌;吳金星;烏日力嘎;那順烏日?qǐng)D;劉群;;蒙古語(yǔ)有向圖形態(tài)分析器的判別式詞干詞綴切分[J];中文信息學(xué)報(bào);2011年04期

6 辛浩;;基于關(guān)聯(lián)規(guī)則的中文姓名識(shí)別方法[J];宿州學(xué)院學(xué)報(bào);2011年05期

7 張永興;孫四明;張峰;;基于本體的信息檢索系統(tǒng)研究[J];微計(jì)算機(jī)信息;2011年07期

8 劉興林;鄭啟倫;馬千里;;中文合成詞識(shí)別及分詞修正[J];計(jì)算機(jī)應(yīng)用研究;2011年08期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會(huì)議論文 前10條

1 何偉;侯敏;;利用詞匯時(shí)間分布信息提取未登錄詞[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年

2 郝博一;夏云慶;鄭方;;OPINAX:一個(gè)有效的產(chǎn)品屬性挖掘系統(tǒng)[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

3 雷靜;;漢語(yǔ)機(jī)構(gòu)名的構(gòu)成模式[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

4 李雙龍;劉樂(lè)中;劉群;;利用單字碎片過(guò)濾改進(jìn)漢語(yǔ)分詞性能[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

5 蘇小康;何婷婷;涂新輝;何金卓;;一種基于維基百科知識(shí)庫(kù)的中文文本分類(lèi)方法研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

6 郭志立;;使用互信息輔助在篇章范圍內(nèi)識(shí)別命名實(shí)體[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

7 張?jiān)茲?龔玲;王永成;;識(shí)別中文文本中的未登錄專(zhuān)有名詞的類(lèi)別[A];2007年中國(guó)智能自動(dòng)化會(huì)議論文集[C];2007年

8 趙偉;王美艷;劉闖;;基于古漢語(yǔ)語(yǔ)料數(shù)據(jù)庫(kù)詞的劃分方法研究與探索[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

9 劉東生;尹寶生;張桂平;徐立軍;苗雪雷;;面向?qū)@墨I(xiàn)的中文分詞技術(shù)的研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

10 計(jì)峰;高沫;邱錫鵬;黃萱菁;;中文機(jī)構(gòu)名簡(jiǎn)稱(chēng)的自動(dòng)生成研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

相關(guān)博士學(xué)位論文 前5條

1 李峗;基于中文維基百科的語(yǔ)義知識(shí)挖掘相關(guān)研究[D];北京郵電大學(xué);2009年

2 孫曉;中文詞法分析的研究及其應(yīng)用[D];大連理工大學(xué);2010年

3 黃魏;植物營(yíng)養(yǎng)診斷自動(dòng)應(yīng)答網(wǎng)絡(luò)專(zhuān)家系統(tǒng)研究[D];華中農(nóng)業(yè)大學(xué);2007年

4 楊傳耀;中文信息檢索索引模型及相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年

5 孫越恒;基于統(tǒng)計(jì)的NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年

相關(guān)碩士學(xué)位論文 前10條

1 國(guó)瑋瑋;基于網(wǎng)絡(luò)資源的未登錄詞擴(kuò)展研究[D];安徽大學(xué);2012年

2 聞?dòng)癖?一種基于組合模型的中文未登錄詞詞性猜測(cè)方法[D];云南大學(xué);2011年

3 都菁;基于論壇語(yǔ)料的未登錄詞自動(dòng)識(shí)別新方法[D];西南大學(xué);2010年

4 張淑梅;詞典與后綴數(shù)組相結(jié)合的中文分詞[D];吉林大學(xué);2006年

5 孔海霞;基于最大熵的漢語(yǔ)詞性標(biāo)注[D];大連理工大學(xué);2007年

6 張衛(wèi);中文詞性標(biāo)注的研究與實(shí)現(xiàn)[D];南京師范大學(xué);2007年

7 王剛;自動(dòng)抽取維基百科文本中的語(yǔ)義關(guān)系[D];上海交通大學(xué);2008年

8 蘇綏綏;基于統(tǒng)計(jì)語(yǔ)言模型的跨語(yǔ)言信息檢索[D];大連理工大學(xué);2009年

9 于海濤;可比較語(yǔ)料庫(kù)的研究與構(gòu)建[D];大連理工大學(xué);2009年

10 王偉偉;維基出版模式研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

,

本文編號(hào):2463696

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2463696.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)fc194***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com