天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

越南語(yǔ)句法分析與樹(shù)庫(kù)轉(zhuǎn)化方法研究

發(fā)布時(shí)間:2020-03-12 16:04
【摘要】:自然語(yǔ)言處理是人工智能研究中非常重要的一部分,而人工智能的飛速發(fā)展也推動(dòng)了自然語(yǔ)言處理的研究熱潮。句法分析是自然語(yǔ)言處理中的關(guān)鍵技術(shù)之一,其基本任務(wù)就是確定句子的句法結(jié)構(gòu)。句法分析不僅能夠?yàn)樽匀徽Z(yǔ)言處理的上層應(yīng)用提供服務(wù),也能為自然語(yǔ)言處理的底層處理提供幫助。目前,漢語(yǔ)英語(yǔ)的句法分析研究相對(duì)比較成熟,但針對(duì)越南語(yǔ)句法分析的研究很少。越南語(yǔ)句法分析和樹(shù)庫(kù)轉(zhuǎn)換方法研究的目的是構(gòu)建一定規(guī)模的越南語(yǔ)短語(yǔ)樹(shù)和依存樹(shù),同時(shí)增強(qiáng)越南語(yǔ)句法分析的準(zhǔn)確率和效率。本文將從越南語(yǔ)短語(yǔ)句法分析、越南語(yǔ)復(fù)雜長(zhǎng)句句法分析和越南語(yǔ)短語(yǔ)樹(shù)到依存樹(shù)的轉(zhuǎn)換三個(gè)方面進(jìn)行深入分析。(1)提出融合越南語(yǔ)語(yǔ)言特征與改進(jìn)PCFG的越南語(yǔ)短語(yǔ)樹(shù)庫(kù)構(gòu)建方法。目前對(duì)越南語(yǔ)句法分析的研究工作較少,還沒(méi)建立越南語(yǔ)短語(yǔ)樹(shù)庫(kù)。本文首先通過(guò)分析越南語(yǔ)的語(yǔ)言特征,制定出越南語(yǔ)的語(yǔ)言特征集;然后利用Inside-Outside算法從人工標(biāo)注的少量越南語(yǔ)短語(yǔ)樹(shù)獲取PCFG模型中的語(yǔ)法規(guī)則集;最后將語(yǔ)法特征集作為語(yǔ)法規(guī)則集的補(bǔ)充融入PCFG模型,用得到的新模型最終完成越南語(yǔ)短語(yǔ)樹(shù)庫(kù)的構(gòu)建。實(shí)驗(yàn)結(jié)果表明,本文提出的新的PCFG模型針對(duì)越南語(yǔ)短語(yǔ)樹(shù)庫(kù)構(gòu)建的準(zhǔn)確率達(dá)到了 81.14%,相比傳統(tǒng)PCFG模型以及基于最大熵的樹(shù)庫(kù)構(gòu)建方法準(zhǔn)確率明顯提高了兩到三個(gè)百分點(diǎn)。(2)提出基于規(guī)則分層的越南語(yǔ)復(fù)雜長(zhǎng)句句法分析方法。目前已有的句法分析研究大都忽略了標(biāo)點(diǎn)符號(hào)這一重要的句法特征或者只進(jìn)行非常簡(jiǎn)單的處理,越南語(yǔ)的句法分析也是如此。首先根據(jù)標(biāo)點(diǎn)符號(hào)的句法結(jié)構(gòu)特性,提出規(guī)則分層的概念;然后根據(jù)標(biāo)點(diǎn)符號(hào)在句子中的特有特征和位置關(guān)系,給出了利用標(biāo)點(diǎn)符號(hào)進(jìn)行規(guī)則分層的二次分析方法;最終,將標(biāo)點(diǎn)融入越南語(yǔ)復(fù)雜長(zhǎng)句句法分析中。本文所用的實(shí)驗(yàn)數(shù)據(jù)均來(lái)自賓州樹(shù)庫(kù)中的越南語(yǔ)短語(yǔ)樹(shù)。對(duì)越南語(yǔ)復(fù)雜長(zhǎng)句句法分析進(jìn)行了對(duì)比實(shí)驗(yàn),本文所提出的越南語(yǔ)復(fù)雜長(zhǎng)句句法分析準(zhǔn)確率和召回率提高了兩到三個(gè)百分點(diǎn),同時(shí)時(shí)間開(kāi)銷降低了近1/3。(3)越南語(yǔ)短語(yǔ)樹(shù)到依存樹(shù)的轉(zhuǎn)換研究。本文提出一種新的方法,嘗試結(jié)合越南語(yǔ)的語(yǔ)言特點(diǎn)和語(yǔ)法特征,利用中心子節(jié)點(diǎn)過(guò)濾表的思想與統(tǒng)計(jì)的方法將越南語(yǔ)的短語(yǔ)結(jié)構(gòu)樹(shù)轉(zhuǎn)換成依存結(jié)構(gòu)樹(shù)。首先依據(jù)中文依存關(guān)系標(biāo)注體系與越南語(yǔ)的語(yǔ)法規(guī)則,制定出依存關(guān)系列表;然后結(jié)合越南語(yǔ)的語(yǔ)言特點(diǎn),制定出了中心子節(jié)點(diǎn)過(guò)濾表,利用中心子節(jié)點(diǎn)過(guò)濾表的思想進(jìn)行初步轉(zhuǎn)化;最后使用依存關(guān)系標(biāo)注器來(lái)進(jìn)行依存關(guān)系標(biāo)注;谵D(zhuǎn)換后得到的依存結(jié)構(gòu)樹(shù),利用MSTParser工具進(jìn)一步訓(xùn)練得到更多的越南語(yǔ)依存結(jié)構(gòu)樹(shù)。本文對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了抽樣評(píng)估,樹(shù)庫(kù)轉(zhuǎn)換的準(zhǔn)確率達(dá)到了 89.4%,較好地解決了越南語(yǔ)由短語(yǔ)樹(shù)到依存樹(shù)的轉(zhuǎn)換問(wèn)題。
【圖文】:

越南語(yǔ),句法樹(shù),短語(yǔ)


2.5實(shí)驗(yàn)及結(jié)果分析逡逑2.5.1實(shí)驗(yàn)數(shù)據(jù)逡逑本文中所涉及的實(shí)驗(yàn)數(shù)據(jù)來(lái)源主要包括兩個(gè)方面:其中,10000句越南語(yǔ)短逡逑語(yǔ)樹(shù)來(lái)自賓州樹(shù)庫(kù),25981條經(jīng)過(guò)詞性標(biāo)注處理的越南語(yǔ)句子來(lái)自實(shí)驗(yàn)室自己在逡逑網(wǎng)站上獲取的語(yǔ)料。10000句的越南語(yǔ)短語(yǔ)樹(shù)有兩個(gè)用處:一是從中隨機(jī)抽。福埃埃板义暇渥鳛橛(xùn)練語(yǔ)料,,2000句作為測(cè)試語(yǔ)料;二是利用10000句短語(yǔ)樹(shù)統(tǒng)計(jì)出越南語(yǔ)逡逑語(yǔ)法規(guī)則集,并計(jì)算得到初始概率值。25981條越南語(yǔ)句子主要來(lái)自中國(guó)國(guó)際廣逡逑14逡逑

越南語(yǔ),句法樹(shù),輸出分析,短語(yǔ)


2.5實(shí)驗(yàn)及結(jié)果分析逡逑2.5.1實(shí)驗(yàn)數(shù)據(jù)逡逑本文中所涉及的實(shí)驗(yàn)數(shù)據(jù)來(lái)源主要包括兩個(gè)方面:其中,10000句越南語(yǔ)短逡逑語(yǔ)樹(shù)來(lái)自賓州樹(shù)庫(kù),25981條經(jīng)過(guò)詞性標(biāo)注處理的越南語(yǔ)句子來(lái)自實(shí)驗(yàn)室自己在逡逑網(wǎng)站上獲取的語(yǔ)料。10000句的越南語(yǔ)短語(yǔ)樹(shù)有兩個(gè)用處:一是從中隨機(jī)抽。福埃埃板义暇渥鳛橛(xùn)練語(yǔ)料,2000句作為測(cè)試語(yǔ)料;二是利用10000句短語(yǔ)樹(shù)統(tǒng)計(jì)出越南語(yǔ)逡逑語(yǔ)法規(guī)則集,并計(jì)算得到初始概率值。25981條越南語(yǔ)句子主要來(lái)自中國(guó)國(guó)際廣逡逑14逡逑
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李英;郭劍毅;余正濤;線巖團(tuán);陳瑋;;融合越南語(yǔ)語(yǔ)言特征與改進(jìn)PCFG的越南語(yǔ)短語(yǔ)樹(shù)庫(kù)構(gòu)建[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2017年02期

2 李英;郭劍毅;余正濤;毛存禮;線巖團(tuán);;越南語(yǔ)短語(yǔ)樹(shù)到依存樹(shù)的轉(zhuǎn)換研究[J];計(jì)算機(jī)科學(xué)與探索;2017年04期

3 李發(fā)杰;余正濤;郭劍毅;李英;周蘭江;;借助漢-越雙語(yǔ)詞對(duì)齊語(yǔ)料構(gòu)建越南語(yǔ)依存樹(shù)庫(kù)[J];中文信息學(xué)報(bào);2015年06期

4 潘清清;周楓;余正濤;郭劍毅;線巖團(tuán);;基于條件隨機(jī)場(chǎng)的越南語(yǔ)命名實(shí)體識(shí)別方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2014年01期

5 車萬(wàn)翔;張梅山;劉挺;;基于主動(dòng)學(xué)習(xí)的中文依存句法分析[J];中文信息學(xué)報(bào);2012年02期

6 張宏亮;;越漢翻譯中雙音節(jié)漢越詞的運(yùn)用問(wèn)題[J];青年文學(xué)家;2010年01期

7 劉挺;馬金山;;漢語(yǔ)自動(dòng)句法分析的理論與方法[J];當(dāng)代語(yǔ)言學(xué);2009年02期

8 李正華;車萬(wàn)翔;劉挺;;短語(yǔ)結(jié)構(gòu)樹(shù)庫(kù)向依存結(jié)構(gòu)樹(shù)庫(kù)轉(zhuǎn)化研究[J];中文信息學(xué)報(bào);2008年06期

9 詹新明;黃南山;楊燦;;語(yǔ)音識(shí)別技術(shù)研究進(jìn)展[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年09期

10 毛奇;連樂(lè)新;周文翠;袁春風(fēng);;基于標(biāo)點(diǎn)符號(hào)分割的漢語(yǔ)句法分析算法[J];中文信息學(xué)報(bào);2007年02期

相關(guān)博士學(xué)位論文 前1條

1 李軍輝;中文句法語(yǔ)義分析及其聯(lián)合學(xué)習(xí)機(jī)制研究[D];蘇州大學(xué);2010年

相關(guān)碩士學(xué)位論文 前7條

1 李發(fā)杰;越南語(yǔ)依存樹(shù)庫(kù)構(gòu)建以及依存關(guān)系分析方法研究[D];昆明理工大學(xué);2016年

2 熊明明;越南語(yǔ)詞法分析方法研究[D];昆明理工大學(xué);2016年

3 莫媛媛;漢越雙語(yǔ)詞語(yǔ)對(duì)齊方法研究[D];昆明理工大學(xué);2015年

4 陳鑫;基于主動(dòng)學(xué)習(xí)的漢語(yǔ)依存樹(shù)庫(kù)構(gòu)建[D];哈爾濱工業(yè)大學(xué);2011年

5 李正華;依存句法分析統(tǒng)計(jì)模型及樹(shù)庫(kù)轉(zhuǎn)化研究[D];哈爾濱工業(yè)大學(xué);2008年

6 邵剛;基于中文的句法分析系統(tǒng)的研究與實(shí)現(xiàn)[D];西安科技大學(xué);2008年

7 周云;漢語(yǔ)越南語(yǔ)機(jī)器翻譯實(shí)驗(yàn)系統(tǒng)[D];中國(guó)人民解放軍外國(guó)語(yǔ)學(xué)院;2006年



本文編號(hào):2586575

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2586575.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a84f3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com