句子長(zhǎng)度的分布規(guī)律及其制約因素
本文關(guān)鍵詞:句子長(zhǎng)度的分布規(guī)律及其制約因素
更多相關(guān)文章: 句長(zhǎng) 句頻 分布規(guī)律 影響因素 句法
【摘要】:句長(zhǎng)統(tǒng)計(jì)是一種針對(duì)句子在語用方面分析研究的統(tǒng)計(jì)方法,即通過統(tǒng)計(jì)定量的語料庫(kù)中長(zhǎng)度相同的句子出現(xiàn)的次數(shù),再根據(jù)得到的數(shù)據(jù)繪制成表格,從句長(zhǎng)的分布規(guī)律從而分析人們?cè)诰渥邮褂梅矫娴囊?guī)律,從而分析出造成這種情況的原因。而且對(duì)于句長(zhǎng)的研究在語言學(xué)——特別是第二語言教學(xué)中發(fā)揮著重要的作用,另外,在信息學(xué)、文獻(xiàn)計(jì)量學(xué)及情報(bào)學(xué)方面也有所涉及。本文的研究工作,主要是從歷時(shí)角度建立不同時(shí)間段的語料庫(kù),通過統(tǒng)計(jì)各個(gè)時(shí)間段的句長(zhǎng)及其分布規(guī)律,再進(jìn)行對(duì)比分析從而了解漢語的發(fā)展規(guī)律;最后,通過共時(shí)角度的漢英句長(zhǎng)的對(duì)比分析異同點(diǎn),從而證明語言具有共同性。文章一共分為六章:第一章是緒論,主要介紹了本文的選題背景以及國(guó)內(nèi)外關(guān)于句法學(xué)、統(tǒng)計(jì)語言學(xué)及句長(zhǎng)的研究現(xiàn)狀,簡(jiǎn)要介紹了本文的研究目的與意義、研究思路和研究方法以及本文的結(jié)構(gòu)組成。第二章是主要是針對(duì)本文在句長(zhǎng)統(tǒng)計(jì)的過程中所要涉及到的相關(guān)實(shí)驗(yàn)軟件進(jìn)行的分析,主要分四個(gè)部分:第一,對(duì)已有的句長(zhǎng)及句頻的相關(guān)概念作了簡(jiǎn)單的說明;第二,介紹了統(tǒng)計(jì)語言學(xué)中三種主要的中文分詞算法及中文分詞算法的難點(diǎn)——未登錄詞識(shí)別和歧義識(shí)別;第三,介紹了一般情況下檢測(cè)實(shí)驗(yàn)軟件的標(biāo)準(zhǔn)——正確率和召回率及F指標(biāo),在這三個(gè)檢測(cè)標(biāo)準(zhǔn)的基礎(chǔ)上,利用漢語及英語句長(zhǎng)、句頻的樣本統(tǒng)計(jì)實(shí)驗(yàn)對(duì)本文所要使用的軟件進(jìn)行檢測(cè),從而確認(rèn)本文實(shí)驗(yàn)軟件的可行性;第四,大致介紹了本文語料的收集與整理的過程,為了確保數(shù)據(jù)的可靠性,本文語料庫(kù)中漢語的語料上溯先秦,下及現(xiàn)當(dāng)代,以及兩漢、魏晉南北朝、隋唐、宋元、明清等時(shí)期,英語語料收集的主要是中世紀(jì)文藝復(fù)興后的,文章篇幅也涉及了短篇、中篇及長(zhǎng)篇,包括經(jīng)、史、子、集各種典籍。第三章是本文為下文作準(zhǔn)備的基礎(chǔ)部分,主要介紹了統(tǒng)計(jì)句長(zhǎng)及句頻的實(shí)驗(yàn)設(shè)備、程序代碼的編寫及實(shí)驗(yàn)步驟。本文所使用的軟件是在Java軟件的基礎(chǔ)上完成的,由于本文所采用的語料涉及古今中外,既有縱向的從先秦到現(xiàn)當(dāng)代,又有橫向的中英文對(duì)比,并且是從字本位和詞本位兩個(gè)角度來統(tǒng)計(jì)分析的,因此本文所要進(jìn)行的實(shí)驗(yàn)也是具有針對(duì)性的,這種"針對(duì)性"就要通過不同的程序代碼來實(shí)現(xiàn)的。在實(shí)驗(yàn)設(shè)備和程序代碼都具備的情況下,就可以進(jìn)行句長(zhǎng)及句頻統(tǒng)計(jì)的實(shí)驗(yàn)了。第四章主要是對(duì)句長(zhǎng)及句頻實(shí)驗(yàn)數(shù)據(jù)的整理分析。根據(jù)上文的實(shí)驗(yàn)得出的數(shù)據(jù)繪制成Excel表格,再繪制成各個(gè)時(shí)期的散點(diǎn)圖,從而通過每個(gè)時(shí)期高頻句的句長(zhǎng)及平均句長(zhǎng)發(fā)現(xiàn)語言發(fā)展是比較穩(wěn)定的。然后通過對(duì)漢語句長(zhǎng)、句頻在不同時(shí)間段的分析及同時(shí)間段漢英句長(zhǎng)、句頻的對(duì)比分析,從而得出句子長(zhǎng)度的分布規(guī)律:一篇文章的句長(zhǎng)是呈現(xiàn)拋物線的分布趨勢(shì)的。即在理論上語言本身的遞歸性使得句子的長(zhǎng)度是無限長(zhǎng)的,但在語言的實(shí)際運(yùn)用中,因?yàn)槭艿礁鞣N因素的影響,使得語言的長(zhǎng)度是有限的,從而為下文分析句長(zhǎng)制約的因素作了基礎(chǔ)。第五章是本文的重點(diǎn)部分,先說明因?yàn)檎Z言的遞歸性及重寫規(guī)則使得句子可以無限長(zhǎng)的,然而上文的實(shí)驗(yàn)數(shù)據(jù)表明每個(gè)時(shí)期無論是平均句長(zhǎng)還是高頻句的句長(zhǎng)都是有限的,因此本章從信息加工的處理方式、語體、語調(diào)、強(qiáng)制性表達(dá)方式、語言的經(jīng)濟(jì)規(guī)則及個(gè)人的語言風(fēng)格等六個(gè)方面來結(jié)合實(shí)驗(yàn)數(shù)據(jù)詳細(xì)分析了它們對(duì)句長(zhǎng)產(chǎn)生的作用。然后通過對(duì)復(fù)句及獨(dú)立成分的分析證明句法是無法制約句長(zhǎng)的。第六章是本文的結(jié)語,在總結(jié)了本文主要內(nèi)容的基礎(chǔ)上,指出本文還存在的一些不足之處,最后對(duì)將來在句長(zhǎng)方面的研究作了一些展望。
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:H195.3
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 唐亦功;;佛羅倫薩城古建筑分布規(guī)律及特點(diǎn)研究[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
2 ;出版消息[J];讀書;1960年07期
3 ;論點(diǎn)摘登[J];外語教學(xué)與研究;1994年03期
4 賈俊俠;《史記》中辯士的分布規(guī)律及其成因[J];唐都學(xué)刊;1996年02期
5 范玲;;常用字部件中的點(diǎn)筆畫分布研究[J];學(xué)行堂語言文字論叢;2012年00期
6 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 汪紅燕;;常山站風(fēng)的分布規(guī)律分析[A];首屆長(zhǎng)三角氣象科技論壇論文集[C];2004年
2 汪紅燕;;常山站風(fēng)的分布規(guī)律分析[A];首屆長(zhǎng)三角科技論壇——?dú)庀罂萍及l(fā)展論壇論文集[C];2004年
3 魏曉;;從我國(guó)西北景觀帶的分布規(guī)律探討寧夏的水土保持[A];全面建設(shè)小康社會(huì):中國(guó)科技工作者的歷史責(zé)任——中國(guó)科協(xié)2003年學(xué)術(shù)年會(huì)論文集(上)[C];2003年
4 董聯(lián)合;周元岐;馬玉生;程瓊;田保權(quán);;胡慶油田最大地應(yīng)力方向分布規(guī)律[A];中國(guó)石油石化工程技術(shù)和物裝手冊(cè)(第一分冊(cè))[C];2003年
5 陳之祿;;粘土地基中“后生軟土”產(chǎn)生的條件和分布規(guī)律[A];全國(guó)第三次工程地質(zhì)大會(huì)論文選集(上卷)[C];1988年
6 張家祥;;運(yùn)用地球動(dòng)力作用原理推斷黃金埋藏分布規(guī)律[A];中國(guó)地質(zhì)科學(xué)院文集(22)[C];1991年
7 陸松;;廣東厚婆坳多金屬礦床銀的分布規(guī)律[A];地球科學(xué)與資源環(huán)境——華南青年地學(xué)學(xué)術(shù)研討會(huì)論文集[C];2003年
8 朱金善;章文俊;孫立成;;海上光污染的致因及其分布規(guī)律的研究[A];2010年船舶防污染學(xué)術(shù)年會(huì)論文集[C];2010年
9 劉洪福;白春明;舒祥澤;;煤炭自燃區(qū)上部地氣氡分布規(guī)律的實(shí)驗(yàn)研究[A];1994年中國(guó)地球物理學(xué)會(huì)第十屆學(xué)術(shù)年會(huì)論文集[C];1994年
10 張彩緋;王盼盼;李建糧;;天臺(tái)縣溫度降水分布規(guī)律分析[A];第31屆中國(guó)氣象學(xué)會(huì)年會(huì)S6 大氣成分與天氣、氣候變化[C];2014年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 河北魏縣第一中學(xué) 常靜靜;簡(jiǎn)析煤炭分布規(guī)律的成因[N];學(xué)知報(bào);2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 徐明鉆;北山地區(qū)典型Cu礦中元素地球化學(xué)分布規(guī)律及成礦預(yù)測(cè)方法技術(shù)研究[D];中國(guó)地質(zhì)科學(xué)院;2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 楊秀;幽門螺桿菌感染者的證候特點(diǎn)及其證型分布規(guī)律的研究[D];南京中醫(yī)藥大學(xué);2017年
2 邱小燕;句子長(zhǎng)度的分布規(guī)律及其制約因素[D];安徽大學(xué);2017年
3 李瑩;裂縫間距分布規(guī)律對(duì)導(dǎo)流能力的影響研究[D];成都理工大學(xué);2013年
4 趙善定;荒漠戈壁區(qū)地表覆蓋層中元素的分布規(guī)律與存在形式[D];長(zhǎng)安大學(xué);2005年
5 樊新昱;重癥肺炎中醫(yī)證素分布規(guī)律及與預(yù)后影響因素相關(guān)性研究[D];中國(guó)中醫(yī)科學(xué)院;2014年
6 李東辰;陶一煤礦地應(yīng)力測(cè)試及其變化分布規(guī)律的研究[D];河北工程大學(xué);2014年
,本文編號(hào):1261206
本文鏈接:http://www.sikaile.net/shoufeilunwen/zaizhiboshi/1261206.html