小詞匯量語音識別在旅行服務中的應用研究
發(fā)布時間:2017-05-24 20:23
本文關鍵詞:小詞匯量語音識別在旅行服務中的應用研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人們生活水平的不斷提高,旅游業(yè)在中國蓬勃發(fā)展。同時,信息技術的進步讓旅行的過程變得更加便捷和豐富。目前,已出現(xiàn)了一些移動應用來幫助人們記錄旅行過程,并自動生成游記。本文在對旅行記錄類安卓應用進行調(diào)研和分析后,針對這類應用通常需要人工輸入標注信息的問題,研究使用基于關鍵字的語音識別技術來代替手動標注,進一步改善用戶體驗。 本文簡要介紹了語音識別技術的歷史、原理和流程,重點研究了小詞匯量語音識別和關鍵詞識別技術及其在Android系統(tǒng)下的實現(xiàn),論文的主要工作如下: (1)針對旅游應用的特點,本文利用爬蟲技術在現(xiàn)有旅游網(wǎng)站上抓取了近4500份游記,經(jīng)過詞語提取和詞頻排序,最終選擇50個詞語作為本文語音識別系統(tǒng)的關鍵詞詞庫。 (2)針對智能手機應用場景,本文對現(xiàn)有的語音識別引擎進行了分析和比較,選擇了適用于移動終端的開源語音識別引擎——PocketSphinx。在詳細研究PocketSphinx的源碼、識別原理和工作流程的基礎上,本文在Cygwin環(huán)境下搭建了PocketSphinx的運行和訓練環(huán)境,對語言模型和發(fā)音字典進行了訓練和制作,對語音素材在不同參數(shù)環(huán)境下的識別性能進行測試,選擇了最優(yōu)參數(shù)。 (3)設計并實現(xiàn)了具有關鍵詞識別功能的旅游App。該應用利用JNI技術將PocketSphinx編譯到Android端,使安卓應用可以調(diào)用語音識別接口。此外,本文還針對旅游服務類應用的特點,研究了地圖、地理定位、數(shù)據(jù)庫、照相機等技術,借助異步任務、手機傳感器、緩存機制對應用進行了進一步的優(yōu)化,提高了可用性。 基于本論文研究成果開發(fā)的安卓應用可以通過地圖、圖片和文字完整地記錄旅行過程,并能借助語音識別技術方便地進行關鍵詞的標注。經(jīng)過了若干用戶的使用和測試,系統(tǒng)運行穩(wěn)定、交互友好,語音識別模塊能夠識別輸入語句中80%以上的關鍵詞,基本可以滿足用戶在旅行環(huán)境中的使用需求。
【關鍵詞】:語音識別 關鍵詞識別 PocketSphinx 旅游信息化
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-16
- 1.1 旅游服務的研究背景9-10
- 1.2 與旅游相關的應用與系統(tǒng)10-13
- 1.2.1 面包旅行10-12
- 1.2.2 在路上12-13
- 1.3 本文的研究內(nèi)容和組織結構13-16
- 1.3.1 主要研究內(nèi)容13-14
- 1.3.2 章節(jié)安排14-16
- 第二章 小詞匯量語音識別技術16-31
- 2.1 什么是語音識別16-18
- 2.1.1 什么是語音識別16
- 2.1.2 語音識別技術的分類16-17
- 2.1.3 語音識別的流程和算法17-18
- 2.2 語音識別的關鍵技術18-27
- 2.2.1 語音信號的預處理18-22
- 2.2.2 HMM的基本原理22-25
- 2.2.3 聲學模型25
- 2.2.4 語言模型25-26
- 2.2.5 解碼過程26-27
- 2.3 小詞匯量語音識別27-28
- 2.4 關鍵詞識別28-29
- 2.5 常見的語音識別系統(tǒng)29-31
- 2.5.1 CMU SPHINX29-30
- 2.5.2 HTK30
- 2.5.3 訊飛語音+30
- 2.5.4 本文選擇的語音識別系統(tǒng)30-31
- 第三章 基于PocketSphinx的語音識別系統(tǒng)31-45
- 3.1 PockeSphinx對嵌入式平臺的優(yōu)化31-32
- 3.2 PocketSphinx主要模塊32-35
- 3.2.1 語料庫33
- 3.2.2 發(fā)音字典33-34
- 3.2.3 語言模型34-35
- 3.3 PocketSphinx的算法原理35-40
- 3.3.1 搜索結構的初始化36-37
- 3.3.2 語音預處理37-38
- 3.3.3 搜索步驟38-40
- 3.4 PocketSphinx的運行和性能分析40-42
- 3.5 基于PocketSphinx的小詞匯量語音識別系統(tǒng)的優(yōu)化42-45
- 第四章 小詞匯量語音識別技術在旅行服務中的應用設計45-51
- 4.1 應用場景45
- 4.2 應用系統(tǒng)設計45-47
- 4.2.1 功能設計45-46
- 4.2.2 數(shù)據(jù)庫設計46-47
- 4.3 系統(tǒng)主要功能模塊47-48
- 4.4 語音系統(tǒng)的準備48-51
- 4.4.1 PocketSphinx-Android的編譯48
- 4.4.2 關鍵詞的選取48-51
- 第五章 小詞匯量語音識別技術在旅行應用中的實現(xiàn)51-66
- 5.1 旅行應用的模塊51-61
- 5.1.1 首頁展示模塊51-52
- 5.1.2 攝影模塊的實現(xiàn)52-55
- 5.1.3 語音識別模塊實現(xiàn)55-56
- 5.1.4 地圖模塊的實現(xiàn)56-59
- 5.1.5 游記列表模塊的實現(xiàn)59-61
- 5.2 旅行應用的測試61-66
- 5.2.1 應用流程測試61-65
- 5.2.2 語音模塊測試65-66
- 第六章 總結與展望66-68
- 6.1 全文總結66-67
- 6.1.1 論文主要工作66
- 6.1.2 論文成果66
- 6.1.3 問題分析66-67
- 6.2 未來展望67-68
- 參考文獻68-70
- 致謝70
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 張恒喜;史爭軍;;基于SQLite的Android數(shù)據(jù)庫編程[J];電腦編程技巧與維護;2011年21期
2 黎世紅;程耕國;彭正濤;;基于Android平臺的Camera系統(tǒng)研究及應用[J];電子設計工程;2013年06期
3 施舒陽;;使用Python在SNS獲取和發(fā)布信息[J];電腦編程技巧與維護;2014年09期
4 許金如;;論中國旅游業(yè)發(fā)展的五大趨勢[J];開發(fā)研究;2014年02期
5 傅細三;;旅游信息化研究文獻綜述[J];商業(yè)時代;2009年02期
本文關鍵詞:小詞匯量語音識別在旅行服務中的應用研究,由筆耕文化傳播整理發(fā)布。
本文編號:391911
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/391911.html
最近更新
教材專著