漢語詞長的計量研究
發(fā)布時間:2018-07-22 19:30
【摘要】:"詞"是構成人類語言系統(tǒng)的基本單位,在詞的諸多特征中,"長度"又是最基本且易于量化的詞匯結構屬性特征之一。本文從共時和歷時兩個層面,運用計量語言學的方法系統(tǒng)考察了漢語詞長問題。本文第1、2章介紹了如何運用計量語言學的理論和方法系統(tǒng)考察漢語詞長問題。在計量語言學中,對于任一種語言結構屬性特征,我們一般都假設其應該滿足如下一些文本特性:"頻率分布"、"序列分布"、"協同關系"、"層級關系"、"歷時演化"。本文中,我們以詞長本身所具有的"頻率分布"和"序列分布"特性為基本考察面,兼具考察其系統(tǒng)特性"協同關系"和"層級關系",并且結合漢語有大量歷時文本記載的優(yōu)勢,考察了詞長特性的"歷時演化"。對于漢語詞長的"頻率分布",我們在本文第3、4章進行了考察。第3章從共時層面(現代漢語)考察了漢語口語和書面語的詞長分布問題。在這一部分中,我們主要考察了三個問題:漢語口語和書面語中的最佳詞長測量單位、口語和書面語詞長分布對比、詞長與詞在語言單位層級中的位置的關系?疾旖Y果顯示,"音節(jié)"是口語中最佳的詞長測量單位。部件是書面語中最佳的詞長測量單位;漢語口語和書面語在詞長分布上存在一定差異,尤其是在短詞使用頻率上;在漢語書面語中,"詞-部件-筆畫"是符合"門策拉—阿爾特曼"定律的漢語語言單位層級;漢語口語和書面語存在交互效應,現代漢語口語受到了書面語的較大影響。本文第4章從歷時層面考察了漢語詞長分布問題。在這一部分中,我們運用不同計量方法分別進行了近一千年(分4個時段,大語料庫)和近兩千年(分6個時段,小語料庫)漢語文本詞長分布演化的考察。兩種不同考察的結果都顯示,漢語詞長分布有著非常顯著的歷時演化規(guī)律,即詞長分布越來越趨于"鐘形分布",平均詞長增加。進一步,基于詞長與其它語言結構特性的"協同關系"考察顯示,漢語詞長的演化不是孤立的,而是發(fā)生在一個自組織的語言系統(tǒng)中的:詞長與詞頻相互依賴,協同演化;詞長演化也引起了整個詞匯系統(tǒng)甚至語言系統(tǒng)的演化;詞長的演化是在"省力原則"控制下的,詞長的演化促進了語言交流效率的提高。對于漢語詞長的"序列分布",本文在第5章進行了考察?疾旆止矔r和歷時兩部分?偲饋碚f,考察結果顯示:漢語口語和書面語具有相同的詞長動鏈分布模型;從詞長動鏈長度分布的總體分布趨勢來看,它與詞長分布的情況非常相似,所以,詞長動鏈長度分布確實繼承了詞長分布的一些特性。為了進一步考察漢語詞長序列的歷時演化,我們又使用了 N-gram詞長熵的方法?疾祜@示,N-gram詞長熵主要受到了詞長分布的影響,且詞長序列在越長距離上會表現出越高的相關性;漢語詞長熵歷時增加,詞長搭配趨于模式化。綜上,本文以計量語言學理論為指導,以"詞長"這一重要詞匯結構特性為切入點,綜合運用了最新的計量統(tǒng)計方法,從共時和歷時兩個角度深入分析了漢語詞長"頻率分布"和"序列分布"兩個文本特性。我們期望本文研究成果一方面有利于推動計量語言學尤其是"協同詞匯學"的進一步發(fā)展,另一方面也有助于漢語本身的語言結構規(guī)律及演化規(guī)律發(fā)現,推動漢語語言學的發(fā)展。
[Abstract]:In this part , we study the long - term evolution of the word length in Chinese spoken and written languages . In this part , we study the long - term evolution of the word length . In this part , we use different measurement methods to study the long - term evolution of the word length . In this part , we study the long - term evolution of the word length .
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:H146.1
,
本文編號:2138337
[Abstract]:In this part , we study the long - term evolution of the word length in Chinese spoken and written languages . In this part , we study the long - term evolution of the word length . In this part , we use different measurement methods to study the long - term evolution of the word length . In this part , we study the long - term evolution of the word length .
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:H146.1
,
本文編號:2138337
本文鏈接:http://www.sikaile.net/shoufeilunwen/rwkxbs/2138337.html