基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)
本文關(guān)鍵詞:基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)
更多相關(guān)文章: 語音對話 智慧語音助理 命令詞控制
【摘要】:隨著移動互聯(lián)網(wǎng)的到來,各種移動終端設(shè)備正在越來越多被應(yīng)用到人們的日常生活中,尤其是智能手機(jī)的應(yīng)用,它讓人們可以隨時隨地娛樂、上網(wǎng)等,但隨著手機(jī)功能增強,人們和智能手機(jī)的交互復(fù)雜度也越來越大。近年來對語音交互技術(shù)已逐步被應(yīng)用到智能手機(jī)中,人們可以使用語音實現(xiàn)語音撥打電話、發(fā)送短信等功能;也可以收聽手機(jī)新來電話、信息等,使用者不用轉(zhuǎn)移雙眼就可以完成電話接聽、信息查看。目前的手機(jī)語音應(yīng)用一般采用多次語音交互完成特定任務(wù),這從根本上來講并沒有提升人機(jī)交互的效率,反而由于多次語音交互降低了語音識別率,增加交互的次數(shù)。多次語音交互無法體現(xiàn)語音技術(shù)的便捷性,并且增加了人機(jī)交互的復(fù)雜度。課題針對安卓智能手機(jī)應(yīng)用場景提出一種語音交互方案,用戶通過說出多命令詞控制智能手機(jī)完成基本通訊、日常使用信息查詢等復(fù)雜的任務(wù),如“打電話/發(fā)短信給XXX”、“我想聽XXX的歌”等,智能手機(jī)終端也自動將任務(wù)執(zhí)行結(jié)果播報給用戶,整個語音交互過程摒棄了繁瑣的多步對話確認(rèn),解放了用戶的眼睛和手,相比于傳統(tǒng)點擊、觸控交互方式,該語音交互方案很大程度提升了人機(jī)交互的便捷性。同時,本課題將基于安徽科大訊飛信息科技股份提供的語音技術(shù)開放平臺研制的語音交互系統(tǒng)應(yīng)用到Android智能手機(jī)上,開發(fā)了智慧語音手機(jī)助理軟件,軟件結(jié)構(gòu)主要由語音識別、語音合成、音頻任務(wù)調(diào)度、語音交互服務(wù)管理等子模塊構(gòu)成,語音交互管理模塊負(fù)責(zé)整體的任務(wù)調(diào)度,首先調(diào)用語音識別服務(wù)識別用于語音,并將識別結(jié)果發(fā)送給相應(yīng)的業(yè)務(wù)流程,然后根據(jù)業(yè)務(wù)需要調(diào)用語音合成模塊對業(yè)務(wù)結(jié)果進(jìn)行播報;而音頻任務(wù)調(diào)度模塊隨時監(jiān)聽音頻任務(wù)的變化,當(dāng)有新的用戶音頻數(shù)據(jù)進(jìn)入時,調(diào)度模塊根據(jù)業(yè)務(wù)設(shè)計邏輯決定是否結(jié)束當(dāng)前任務(wù)流程,開始新的任務(wù)流程。通過模塊之間有序的任務(wù)協(xié)調(diào)及管理,避免了多次語音交互時相互之間的干擾。經(jīng)過大規(guī)模數(shù)據(jù)驗證,語音交互系統(tǒng)在智能Android手機(jī)上運行穩(wěn)定。系統(tǒng)在辦公室等相對安靜環(huán)境下的識別率達(dá)到90%,在駕車關(guān)窗低車載噪音環(huán)境中識別率達(dá)85%,單次語音交互時間小于3S,很好的驗證了語音交互系統(tǒng)的可用性。
【關(guān)鍵詞】:語音對話 智慧語音助理 命令詞控制
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.52;TN912.3
【目錄】:
- 摘要3-4
- Abstract4-8
- 第一章 緒論8-11
- 1.1 課題研究背景及意義8-9
- 1.2 課題國內(nèi)外研究現(xiàn)狀9
- 1.3 本論文主要研究內(nèi)容9-10
- 1.4 本論文的組織結(jié)構(gòu)10
- 1.5 本章小結(jié)10-11
- 第二章 語音人機(jī)交互技術(shù)11-17
- 2.1 人機(jī)交互技術(shù)11-12
- 2.1.1 人機(jī)交互模型11-12
- 2.1.2 人機(jī)交互基本流程12
- 2.2 語音合成技術(shù)12-14
- 2.2.1 基本概念12-13
- 2.2.2 語音合成的方法13-14
- 2.3 語音識別技術(shù)14-16
- 2.3.1 基本概念14-15
- 2.3.2 語音識別方法15-16
- 2.4 本章小結(jié)16-17
- 第三章 智慧語音助理系統(tǒng)方案的設(shè)計17-27
- 3.1 智慧語音助理交互方案特性17-18
- 3.2 智慧語音助理語音交互系統(tǒng)介紹18-19
- 3.3 智慧語音助理的核心子系統(tǒng)19-26
- 3.3.1 MSP語音云平臺19-22
- 3.3.2 智慧語音助理客戶端22-25
- 3.3.2.1 Web與引擎的交互22-23
- 3.3.2.2 Native與引擎的交互23-24
- 3.3.2.3 Web與Native的交互24-25
- 3.3.3 語音能力的輸入輸出25-26
- 3.4 本章小結(jié)26-27
- 第四章 智慧語音助理手機(jī)客戶端的實現(xiàn)27-54
- 4.1 系統(tǒng)開發(fā)環(huán)境27
- 4.2 科大訊飛MSP語音服務(wù)平臺接入27-35
- 4.2.1 語音識別引擎27-33
- 4.2.1.1 語法功能29-30
- 4.2.1.2 語音識別框架及邏輯實現(xiàn)30-33
- 4.2.2 語音合成引擎33-35
- 4.2.3 語音聽寫35
- 4.3 智慧語音助理客戶端35-49
- 4.3.1 業(yè)務(wù)層的總體架構(gòu)36-37
- 4.3.1.1 插件管理框架36
- 4.3.1.2 中間件容器36-37
- 4.3.2 單業(yè)務(wù)模塊結(jié)構(gòu)37-39
- 4.3.2.1 web層總體架構(gòu)38-39
- 4.3.3 客戶端業(yè)務(wù)層架構(gòu)實現(xiàn)39-42
- 4.3.3.1 語音交互調(diào)度模塊40-41
- 4.3.3.2 音頻任務(wù)控制模塊41
- 4.3.3.3 應(yīng)用程序接口實現(xiàn)41-42
- 4.3.4 單業(yè)務(wù)模塊實現(xiàn)—打電話42-49
- 4.4 智能語音助理系統(tǒng)運行測試及界面展示49-52
- 4.4.1 系統(tǒng)運行流程50-51
- 4.4.2 運行結(jié)果分析51
- 4.4.3 智慧語音助理使用流程及界面展示51-52
- 4.5 本章小結(jié)52-54
- 第五章 總結(jié)與展望54-56
- 5.1 總結(jié)54
- 5.2 下一步工作54-56
- 參考文獻(xiàn)56-58
- 致謝58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 邴志剛,劉媛,崔世鋼;機(jī)器人開發(fā)平臺中語音交互系統(tǒng)的實現(xiàn)[J];天津職業(yè)技術(shù)師范學(xué)院學(xué)報;2004年02期
2 ;首臺美女機(jī)器人亮相[J];科技與經(jīng)濟(jì)畫報;2006年03期
3 施寒瀟;;基于互聯(lián)網(wǎng)語音交互系統(tǒng)的研究與實現(xiàn)[J];計算機(jī)系統(tǒng)應(yīng)用;2006年02期
4 韓超;劉加;;新型多模態(tài)人性化語音交互系統(tǒng)[J];電聲技術(shù);2009年08期
5 禪影;爭鋒,在人機(jī)語音交互的技術(shù)制高點[J];軟件工程師;2001年12期
6 李麗;;人機(jī)語音交互技術(shù)的原理及發(fā)展前景[J];科技資訊;2013年32期
7 易定;用Microsoft Speech SDK5.1實現(xiàn)中文語音交互的方法[J];電腦開發(fā)與應(yīng)用;2005年04期
8 陳斌,郭大勇,施克仁;用于擬人機(jī)器人的嵌入式語音交互系統(tǒng)研究[J];機(jī)器人;2003年05期
9 庾錫昌;劉偉平;武晉;黃紅斌;;基于VoiceXML的語音交互平臺的設(shè)計與實現(xiàn)[J];計算機(jī)工程與設(shè)計;2007年08期
10 姜曉慶;崔世耀;殷艷華;;人機(jī)語音交互中的情感語音處理[J];濟(jì)南大學(xué)學(xué)報(自然科學(xué)版);2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 徐波;;海量音頻處理及嵌入式語音交互[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年
2 張戰(zhàn)鋒;韋瑋;呂成興;李成榮;;人機(jī)語音交互平臺以及在Linux下的移植實現(xiàn)[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年
3 李雪峰;付慧生;周敏;;具有語音交互功能的電子鐘的設(shè)計與實現(xiàn)[A];第十六屆全國煤炭自動化學(xué)術(shù)年會、中國煤炭學(xué)會自動化專業(yè)委員會學(xué)術(shù)會議論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 鄭陽;嵌入式語音交互技術(shù)[N];人民郵電;2014年
2 ;云之聲牽手英特爾 語音交互助力芯突破[N];中國計算機(jī)報;2014年
3 本報記者 王哲瑋 實習(xí)記者 梁菲;語音交互 王者歸來[N];計算機(jī)世界;2012年
4 ;快人快語 隨身接入[N];網(wǎng)絡(luò)世界;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王智國;嵌入式人機(jī)語音交互系統(tǒng)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 顧亞平;基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)[D];南京郵電大學(xué);2015年
2 賈玉輝;面向語音交互的云計算系統(tǒng)的研究[D];中國海洋大學(xué);2013年
3 朱潤華;網(wǎng)絡(luò)環(huán)境下基于語音交互的虛擬裝配系統(tǒng)研究[D];西南交通大學(xué);2008年
4 寧正華;Space OS服務(wù)秘書語音交互系統(tǒng)的研究與實現(xiàn)[D];首都師范大學(xué);2009年
5 于貴博;高校醫(yī)院管理及疾病預(yù)警系統(tǒng)[D];吉林大學(xué);2005年
6 李金耀;One-Shot車載語音交互系統(tǒng)的設(shè)計與實現(xiàn)[D];安徽大學(xué);2012年
7 于基業(yè);GIS圖形系統(tǒng)中語音交互核心問題的研究[D];長安大學(xué);2014年
8 鮑艷艷;機(jī)器人語音交互系統(tǒng)的研究與設(shè)計[D];東北大學(xué);2012年
9 李永量;基于SALT的網(wǎng)上直銷系統(tǒng)的實現(xiàn)[D];四川大學(xué);2004年
,本文編號:1019786
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1019786.html