基于條件隨機場的口語理解研究
本文關鍵詞:基于條件隨機場的口語理解研究
【摘要】:隨著互聯網技術的飛速發(fā)展,用戶對人機交互質量和人機對話系統的性能需求隨之增加。在人機對話系統中需要利用到口語理解技術,該技術的發(fā)展水平對人機對話系統的性能起著至關重要的作用,因而需要尋找到合適的口語理解方式,以便促進人機對話系統的發(fā)展?谡Z理解過程涉及到自動語音識別技術,該技術在神經網絡聲學模型的發(fā)展帶動下取得了很大進展。由于系統因素的影響,在自動語音識別時也可能出現一些識別錯誤問題,這些錯誤可能會因為不規(guī)則口語的存在而更明顯。本文主要是對目前的口語理解問題進行了研究,通過對這些問題的分析提出了基于條件隨機場模型的穩(wěn)健性口語理解方法。本文的主要工作及創(chuàng)新點如下:1.語音識別性能的不理想造成的識別錯誤以及不符合文法的口語輸入往往造成口語理解性能下降。針對此問題,本文提出一種改進口語理解穩(wěn)健性的方法。該方法通過在訓練數據集中人工加入錯誤文本噪聲進行語料擴充,送入條件隨機場口語理解模型進行訓練,用得到的模型對具有噪聲的未知數據集進行口語理解。2.針對口語理解語句中詞與詞向量之間的關系對口語理解的性能所產生的影響,提出了一種基于詞嵌入的改進口語理解方法。首先用word2vec對口語理解語句進行詞嵌入處理,得到語句中所有詞的向量。通過計算詞向量之間的相似度,從而得到每個詞之間的相似度,再經過聚類,得到一個初始模糊分類。然后將這個初始模糊分類作為一個特征,與其他的特征一起送入條件隨機場進行口語理解訓練,得到最終的分類結果。最后對所建立的模型在漢語交通查詢領域進行實證。實驗結果表明,本文建立的這種方法顯著優(yōu)于先前的基于規(guī)則的方法,此外相比數據驅動算法而言,可以顯著降低開發(fā)成本,性能卻沒有受到影響。
【關鍵詞】:人機對話系統 條件隨機場 口語理解 詞嵌入
【學位授予單位】:新疆大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要2-3
- Abstract3-7
- 第1章 緒論7-20
- 1.1 人機口語對話7-8
- 1.2 國內外人機對話研究現狀8-9
- 1.3 口語理解9-18
- 1.3.1 口語理解方法10-18
- 1.4 論文的主要工作18-19
- 1.5 論文的組織結構19-20
- 第2章 條件隨機場20-35
- 2.1 概率無向圖模型20-23
- 2.1.1 模型定義20-22
- 2.1.2 概率無向圖模型的因子分解22-23
- 2.2 條件隨機場的定義與形式23-26
- 2.2.1 條件隨機場的定義23-24
- 2.2.2 條件隨機場的參數化形式24-25
- 2.2.3 條件隨機場的簡化形式25-26
- 2.3 條件隨機場的概率計算問題26-28
- 2.3.1 前向-后向算法26-27
- 2.3.2 概率計算27
- 2.3.3 期望值的計算27-28
- 2.4 條件隨機場的學習算法28-32
- 2.4.1 改進的迭代尺度法29-32
- 2.5 條件隨機場的預測算法32-34
- 2.6 本章小結34-35
- 第3章 基于條件隨機場的口語理解35-45
- 3.1 特征項選擇35-36
- 3.2 實驗準備36-41
- 3.2.1 實驗所用的軟件工具36-37
- 3.2.2 實驗語料庫37
- 3.2.3 文本預處理37
- 3.2.4 語料標注37-38
- 3.2.5 特征模板選擇38-41
- 3.3 評估指標41
- 3.4 穩(wěn)健性口語理解實驗過程與結果分析41-44
- 3.4.1 無噪聲條件下的口語理解41-42
- 3.4.2 噪聲條件下的口語理解42-43
- 3.4.3 實驗結果及分析43-44
- 3.5 本章小結44-45
- 第4章 基于詞嵌入的改進口語理解45-52
- 4.1 基于詞嵌入的改進口語理解系統框架45
- 4.2 詞嵌入45-47
- 4.3 K -means聚類算法47
- 4.4 實驗結果及分析47-50
- 4.5 與其他統計方法的比較50
- 4.6 本章小結50-52
- 第5章 總結與展望52-53
- 5.1 論文總結52
- 5.2 展望52-53
- 參考文獻53-58
- 致謝58-59
- 攻讀碩士期間已發(fā)表或錄用的論文59-60
【相似文獻】
中國期刊全文數據庫 前10條
1 宗萍;施水才;王濤;呂學強;;基于條件隨機場的英文地理行政實體識別[J];現代圖書情報技術;2009年02期
2 張開旭;夏云慶;宇航;;基于條件隨機場的古漢語自動斷句與標點方法[J];清華大學學報(自然科學版);2009年10期
3 成姣;蔡東風;季鐸;;基于條件隨機場的日語依存分析[J];沈陽航空工業(yè)學院學報;2010年05期
4 李玲玲;金泰松;李翠華;;基于局部特征和隱條件隨機場的場景分類方法[J];北京理工大學學報;2012年07期
5 寧偉;蔡東風;張桂平;季鐸;苗雪雷;;基于條件隨機場的冠詞選擇研究[J];中文信息學報;2008年06期
6 張玉芳;莫凌琳;熊忠陽;耿曉斐;;基于條件隨機場的科研論文信息分層抽取[J];計算機應用研究;2009年10期
7 王昌厚;;基于條件隨機場的中文命名體識別[J];福建電腦;2012年02期
8 施水才;王鍇;韓艷鏵;呂學強;;基于條件隨機場的領域術語識別研究[J];計算機工程與應用;2013年10期
9 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯合結構自動識別[J];中文信息學報;2008年06期
10 方瑩;;基于條件隨機場的英文農產品名識別[J];河南科學;2011年03期
中國重要會議論文全文數據庫 前5條
1 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯合結構自動識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
2 張奇;翁富良;黃萱菁;吳立德;;英文口語中非流利區(qū)域的檢測[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
3 魏瑋;杜金華;徐波;;基于分層語塊分析的統計翻譯研究[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
4 王根;趙軍;;基于多重冗余標記CRF的句子情感分析研究[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
5 寧偉;蔡東風;季鐸;;基于條件隨機場的冠詞選擇研究[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
中國博士學位論文全文數據庫 前1條
1 熊英;中文自然語言理解中基于條件隨機場理論的詞法分析研究[D];上海交通大學;2009年
中國碩士學位論文全文數據庫 前10條
1 趙九洋;圖像中行人檢測關鍵技術研究[D];南京大學;2015年
2 寧振;基于層疊條件隨機場的情感分析[D];南昌大學;2015年
3 楊獻祥;面向中文微博的產品名實體識別與規(guī)范化算法設計與實現[D];北京理工大學;2015年
4 肖s,
本文編號:1102191
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1102191.html