支配詞一致性原則與語(yǔ)言分類優(yōu)化
發(fā)布時(shí)間:2017-03-28 13:14
本文關(guān)鍵詞:支配詞一致性原則與語(yǔ)言分類優(yōu)化,,由筆耕文化傳播整理發(fā)布。
【摘要】:本研究采用計(jì)量研究方法,試圖解決詞序類型學(xué)中有關(guān)支配詞一致性原則的爭(zhēng)論,并優(yōu)化利用依存方向進(jìn)行語(yǔ)言分類研究的方法。為此,我們基于21種印歐語(yǔ)的依存樹庫(kù),提取了10種詞序特征值,并利用支持向量機(jī)模型對(duì)語(yǔ)言分類的效果進(jìn)行評(píng)估。一方面,我們統(tǒng)計(jì)出各個(gè)詞序特征的比例,進(jìn)行了交叉性相關(guān)分析。這不僅檢驗(yàn)了已知的與動(dòng)賓組配共現(xiàn)的關(guān)系對(duì),而且為語(yǔ)言使用中的支配詞一致性原則提供了大規(guī)模、跨語(yǔ)言的證據(jù)。我們進(jìn)一步發(fā)現(xiàn)同向的依存關(guān)系(支配詞居前或支配詞居后)傾向于聚集在一起。另一方面,本文運(yùn)用了兩種提高詞序類型學(xué)分類精度的方法——細(xì)化依存關(guān)系或?qū)⒁来婢嚯x設(shè)為依存方向的權(quán)值。我們發(fā)現(xiàn)形容詞和名詞組配的分類效果最為理想,而傳統(tǒng)的動(dòng)詞和賓語(yǔ)組配的分類結(jié)果不佳。這表明對(duì)依存關(guān)系進(jìn)行精細(xì)化處理可以提高語(yǔ)言分類的精度。此外,本研究提出了加權(quán)依存方向的指標(biāo),發(fā)現(xiàn)在長(zhǎng)距離依存關(guān)系受限的前提下,這一指標(biāo)比依存方向的分類效果更好。為證實(shí)以上兩種方法的可靠性,我們對(duì)兩種潛在的干擾因素(樹庫(kù)大小和句長(zhǎng))進(jìn)行了討論。結(jié)果表明,這兩項(xiàng)文本特征并不足以對(duì)詞序特征產(chǎn)生顯著影響。盡管依存方向和加權(quán)依存方向均與句長(zhǎng)相關(guān),但兩項(xiàng)指標(biāo)依然比較穩(wěn)定。
【關(guān)鍵詞】:支配詞一致性原則 語(yǔ)言分類 依存樹庫(kù) 加權(quán)依存方向
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:H08
【目錄】:
- 摘要5-6
- Abstract6-8
- Acknowledgements8-12
- Chapter 1 Introduction12-17
- 1.1 Research background12-13
- 1.2 Research purposes and significance13-14
- 1.3 Research questions14-15
- 1.4 Thesis structure15-17
- Chapter 2 Literature Review17-27
- 2.1 VO-OV typology17-23
- 2.2 Dependency direction and branching direction23-27
- Chapter 3 Materials and Methods27-34
- 3.1 Harmonized dependency treebanks27-29
- 3.2 Dependency direction and weighted dependency direction29-34
- Chapter 4 Results34-53
- 4.1 General statistics of Indo-European language dependency treebanks34-37
- 4.2 Cross.correlation tests on word order features37-45
- 4.2.1 Word order features37-41
- 4.2.2 Word order correlations41-45
- 4.3 Language classification evaluation45-53
- 4.3.1 Classification accuracy for word order features45-48
- 4.3.2 Classification accuracy for weighted dependency direction48-53
- Chapter 5 Discussions53-63
- 5.1 Influences of treebank size53-56
- 5.2 Influences of sentence length56-63
- Chapter 6 Conclusions and Future Directions63-65
- 6.1 Major findings63-64
- 6.2 Limitations and future directions64-65
- Appendices65-70
- References70-75
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條
1 R.H.Robins;林書武;;語(yǔ)言分類史(上)[J];國(guó)外語(yǔ)言學(xué);1983年01期
2 吳海彬;;剖析語(yǔ)言中的性別歧視——從語(yǔ)言分類切入[J];太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年03期
3 洪玲;;旅游接待禮儀中的服務(wù)語(yǔ)言分類及運(yùn)用藝術(shù)[J];現(xiàn)代商貿(mào)工業(yè);2012年04期
4 霍曉晶;;維納格拉多夫的語(yǔ)言分類中成語(yǔ)特點(diǎn)和翻譯技巧分析[J];林區(qū)教學(xué);2013年08期
5 ;[J];;年期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 敬應(yīng)奇;支配詞一致性原則與語(yǔ)言分類優(yōu)化[D];浙江大學(xué);2016年
本文關(guān)鍵詞:支配詞一致性原則與語(yǔ)言分類優(yōu)化,由筆耕文化傳播整理發(fā)布。
本文編號(hào):272341
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/272341.html
最近更新
教材專著