漢語方言資源數(shù)據(jù)庫管理系統(tǒng)
【學位授予單位】:西北民族大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:H17;TP311.13
【圖文】:
西北民族大學碩士學位論文2音節(jié)聲韻調(diào)切分模塊此模塊是將現(xiàn)有的音節(jié)與聲母、韻母的國際音標比較,從而得出自己的聲韻母和聲調(diào)。一個漢字就是一個音節(jié),按照音韻學的分類方法,一個音節(jié)是聲母、韻母和聲調(diào)三個部分組成的。聲母就是等于一個輔音,它可以缺省,做零聲母(表示有效位置)。韻母可包括三個音素:介音、主要元音、尾音。介和尾音是可以缺省的。普通話的聲調(diào)一般有 5種:陰平,陽平,上聲、去聲、聲。普通話的音節(jié)結(jié)構(gòu)可概括如圖 2.1。在音節(jié)字符串中,要準確的找到聲、韻母和聲調(diào),主要是要找到音節(jié)的邊界字符,因為漢藏語言絕大部分都是調(diào)語言,它的音節(jié)可以分析出這三種構(gòu)成成分。漢語音節(jié)包括 24個聲母,6單韻母和 30個復韻母,還有 4種聲調(diào)(陰平、陽平、上聲、去聲)。本模塊主要任務是將音節(jié)的聲母、韻母還有聲調(diào)分離開,例如:巴(pa陰平)分解,聲母為 p,韻母為 a,聲調(diào)是陰平;他(t a陰平)分解后,聲母為 t ,韻母為調(diào)為陰平。本模塊分解后的表如 2.2 所示。
容易學習又容易使用,函數(shù)名和表達更接近于書寫計算公式的表達方強大而智能化的圖形功能;開放性好,易于擴充等等。這也是 MAT深入到科學研究及工程計算各個領(lǐng)域,如此受歡迎的重要原因。3.2 系統(tǒng)總體設計及界面實現(xiàn)系統(tǒng)打算分為以下幾個模塊:語音選擇區(qū)、檢索區(qū)、音位統(tǒng)計區(qū)區(qū)、功能區(qū)和結(jié)果顯示區(qū)等。語言選擇區(qū)包括 20個方言點,如北京沙、成都等;檢索區(qū)包括漢字、拼音、聲母、韻母、聲調(diào);音位統(tǒng)計母、韻母和聲調(diào)三大部分,聲母分為兩個部分:發(fā)音部位(雙唇音)法(塞音),韻母也分為兩個部分,結(jié)構(gòu)(鼻化元音)和韻頭(開口調(diào)分為:陰平、陽平、陰上、陽上、陰去、陽去、陰入、陰入等等;區(qū)包括音位負擔計算和方言距離的計算;功能區(qū)包括音韻調(diào)切分、屬注和頻次;音頻視頻的顯示與播放可以在結(jié)果顯示區(qū)點擊單字顯示,的結(jié)果可保存為 excel 表。圖 3.1和圖 3.2是系統(tǒng)總體的設計圖和系統(tǒng)體界面圖。
圖 3.2 系統(tǒng)總體界面圖3.3 系統(tǒng)功能實現(xiàn)3.3.1音節(jié)聲韻調(diào)切分模塊實現(xiàn)本模塊的核心思想是最大正向匹配算法,其基本思路為:假設 a為聲母庫中最大聲母的字符數(shù),那么匹配字段為被處理數(shù)據(jù)的當前字串中的前 i個字,在聲母庫中查找。如果這樣的一個 a在聲母庫中被查找到,那么匹配成功,匹配字段就被作為這個音節(jié)的聲母而切分出來。如果聲母中沒有找到這樣的一個a字符,那么匹配失敗,接著去掉匹配字段 a 中的最后一個字符,重新匹配剩下的子串,如此循環(huán)下去,直到匹配到聲母成功為止,也就是直到最后切分出一個聲母,這樣的話,聲母就會被尋找出來,由于聲母找到,韻母就是聲母留下的部分,而聲調(diào)就是 a 這個音節(jié)的最后兩個。一個音節(jié)被分開成聲母、韻母和聲調(diào)后,就會然后再匹配處理下一個 a,直到掃描完整個數(shù)據(jù)庫為止。數(shù)據(jù)庫中的音節(jié)儲存形式為(以北京話為例)這樣的,巴(pa陰平)、宿( iou去
【參考文獻】
相關(guān)期刊論文 前10條
1 富林;;國家社會科學基金重大項目“漢語方言音系匯纂及方音對照處理系統(tǒng)研究”啟動[J];陜西師范大學學報(哲學社會科學版);2015年04期
2 曹志耘;;方言瀕危、文化碎片和方言學者的使命[J];中國語言學報;2014年00期
3 韓夏;李龍;潘悟云;;計算機田野調(diào)查及處理系統(tǒng)[J];清華大學學報(自然科學版);2013年06期
4 范俊軍;;漢語方言自然口語語料庫建設的幾個基本問題[J];學術(shù)研究;2013年02期
5 解林清;方華萍;金雅聲;;漢語普通話常用字、音節(jié)和音位的統(tǒng)計分析[J];西北民族大學學報(自然科學版);2012年03期
6 范俊軍;;基于調(diào)查字表詞表注音的漢藏語言音系處理系統(tǒng)[J];語言文字應用;2012年02期
7 安見才讓;;面向漢語教學的漢藏語料庫系統(tǒng)設計和實現(xiàn)[J];微處理機;2012年02期
8 李宇明;;論中國語言資源有聲數(shù)據(jù)庫的建設[J];中國語文;2010年04期
9 洪拓夷;;漢語方言語音數(shù)據(jù)庫建設構(gòu)想[J];圖書情報工作;2009年05期
10 金慧敏;廖燕莎;史菁;陳琪;;藏語方言計算機輔助系統(tǒng)的研究[J];科技信息;2009年01期
相關(guān)碩士學位論文 前2條
1 顧宇杰;面向微博評論的中文文本情感分類研究[D];云南財經(jīng)大學;2018年
2 張義;基于MAPGIS的中國歷史方言地理信息系統(tǒng)(CHDGIS)設計與實現(xiàn)[D];華中科技大學;2006年
本文編號:2786501
本文鏈接:http://www.sikaile.net/guanlilunwen/glzh/2786501.html