哈薩克語句法分析輔助特征提取研究
發(fā)布時間:2020-10-15 10:36
哈薩克語的信息處理目前已經完成了基本短語自動識別、固定短語抽取和詞性標注。本文對哈薩克語進行短語結構的句法分析研究,主要采用了基于移進-歸約的句法分析方法,使用感知器算法和柱搜索算法在句法分析過程中進行訓練與解碼,并通過加入神經網絡為解碼過程添加輔助特征,幫助更高效地解析出哈薩克語句法結構。本文的主要研究工作如下:1.在哈薩克語句法分析過程中,以基于移進-歸約的句法分析方法為整體框架,通過每一步的移進-歸約動作,最終得出哈薩克語短語結構的句法樹。2.在哈薩克語句法分析訓練階段,采用感知器算法對標準的哈薩克語句法結構的句子進行訓練,傳統(tǒng)的句法分析主要依賴語言的規(guī)則庫,而感知器算法訓練是一個不斷調整參數(shù)不斷學習哈薩克語句子特征的過程。它初始化參數(shù)向量全為零,并通過對訓練樣本進行解碼來更新參數(shù)。3.在哈薩克語句法分析解碼階段,采用柱搜索算法進行解碼,在解析句子過程中,通過放棄一些權重比較小的小概率節(jié)點,來控制搜索空間的大小,以獲得概率較大的句法樹。既控制了解碼過程中所占用的搜索空間,又通過統(tǒng)計的方法獲得最合適的句法樹。4.在解碼過程中通過神經網絡添加輔助特征,在解析句子過程中,本文構建了一個雙向LSTM模型,利用它提取句子中每個單詞之間組成結構的信息,以預測每個單詞在句法樹中的句法組成部分,然后將結果作為輔助特征傳遞給句法分析過程,幫助生成哈薩克語句法樹。經實驗證明,使用基于移進-歸約的句法分析方法可以解析出哈薩克語句法結構,對于句法分析過程中使用神經網絡提取一些輔助特征來輔助解碼后,在解析速度和準確性上都有所提高。
【學位單位】:新疆大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP391.1
【部分圖文】:
單層感知器原理圖
【參考文獻】
本文編號:2842062
【學位單位】:新疆大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP391.1
【部分圖文】:
單層感知器原理圖
【參考文獻】
相關期刊論文 前10條
1 于智娟;古麗拉·阿東別克;;基于層疊條件隨機場的哈語樹庫構建技術研究[J];計算機應用與軟件;2016年03期
2 牛娜;古麗拉·阿東別克;;基于規(guī)則的哈薩克語句法分析算法研究[J];計算機技術與發(fā)展;2015年09期
3 尚文清;古麗拉·阿東別克;牛娜;于智娟;;基于PCFG模型的哈薩克語句法分析[J];現(xiàn)代計算機(專業(yè)版);2015年14期
4 戶冰心;古麗拉·阿東別克;祁卉;;哈薩克語“v+n+n”格式的歧義消解[J];計算機工程;2014年12期
5 汪泱;古麗拉·阿東別克;戶冰心;牛寧寧;;基于條件隨機場的哈薩克語基本短語自動識別[J];計算機工程與設計;2014年10期
6 古麗扎達·海沙;古麗拉·阿東別克;;哈薩克語動詞短語自動識別研究與實現(xiàn)[J];計算機工程與應用;2015年02期
7 桑海巖;古麗拉·阿東別克;牛寧寧;;基于最大熵的哈薩克語詞性標注模型[J];計算機工程與應用;2013年11期
8 吳偉成;周俊生;曲維光;;基于統(tǒng)計學習模型的句法分析方法綜述[J];中文信息學報;2013年03期
9 馬驥;朱慕華;肖桐;朱靖波;;面向移進—歸約句法分析器的單模型系統(tǒng)整合算法[J];中文信息學報;2012年03期
10 劉挺;馬金山;;漢語自動句法分析的理論與方法[J];當代語言學;2009年02期
本文編號:2842062
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2842062.html