天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)

發(fā)布時間:2017-10-12 16:31

  本文關(guān)鍵詞:基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)


  更多相關(guān)文章: 語音對話 智慧語音助理 命令詞控制


【摘要】:隨著移動互聯(lián)網(wǎng)的到來,各種移動終端設(shè)備正在越來越多被應(yīng)用到人們的日常生活中,尤其是智能手機(jī)的應(yīng)用,它讓人們可以隨時隨地娛樂、上網(wǎng)等,但隨著手機(jī)功能增強,人們和智能手機(jī)的交互復(fù)雜度也越來越大。近年來對語音交互技術(shù)已逐步被應(yīng)用到智能手機(jī)中,人們可以使用語音實現(xiàn)語音撥打電話、發(fā)送短信等功能;也可以收聽手機(jī)新來電話、信息等,使用者不用轉(zhuǎn)移雙眼就可以完成電話接聽、信息查看。目前的手機(jī)語音應(yīng)用一般采用多次語音交互完成特定任務(wù),這從根本上來講并沒有提升人機(jī)交互的效率,反而由于多次語音交互降低了語音識別率,增加交互的次數(shù)。多次語音交互無法體現(xiàn)語音技術(shù)的便捷性,并且增加了人機(jī)交互的復(fù)雜度。課題針對安卓智能手機(jī)應(yīng)用場景提出一種語音交互方案,用戶通過說出多命令詞控制智能手機(jī)完成基本通訊、日常使用信息查詢等復(fù)雜的任務(wù),如“打電話/發(fā)短信給XXX”、“我想聽XXX的歌”等,智能手機(jī)終端也自動將任務(wù)執(zhí)行結(jié)果播報給用戶,整個語音交互過程摒棄了繁瑣的多步對話確認(rèn),解放了用戶的眼睛和手,相比于傳統(tǒng)點擊、觸控交互方式,該語音交互方案很大程度提升了人機(jī)交互的便捷性。同時,本課題將基于安徽科大訊飛信息科技股份提供的語音技術(shù)開放平臺研制的語音交互系統(tǒng)應(yīng)用到Android智能手機(jī)上,開發(fā)了智慧語音手機(jī)助理軟件,軟件結(jié)構(gòu)主要由語音識別、語音合成、音頻任務(wù)調(diào)度、語音交互服務(wù)管理等子模塊構(gòu)成,語音交互管理模塊負(fù)責(zé)整體的任務(wù)調(diào)度,首先調(diào)用語音識別服務(wù)識別用于語音,并將識別結(jié)果發(fā)送給相應(yīng)的業(yè)務(wù)流程,然后根據(jù)業(yè)務(wù)需要調(diào)用語音合成模塊對業(yè)務(wù)結(jié)果進(jìn)行播報;而音頻任務(wù)調(diào)度模塊隨時監(jiān)聽音頻任務(wù)的變化,當(dāng)有新的用戶音頻數(shù)據(jù)進(jìn)入時,調(diào)度模塊根據(jù)業(yè)務(wù)設(shè)計邏輯決定是否結(jié)束當(dāng)前任務(wù)流程,開始新的任務(wù)流程。通過模塊之間有序的任務(wù)協(xié)調(diào)及管理,避免了多次語音交互時相互之間的干擾。經(jīng)過大規(guī)模數(shù)據(jù)驗證,語音交互系統(tǒng)在智能Android手機(jī)上運行穩(wěn)定。系統(tǒng)在辦公室等相對安靜環(huán)境下的識別率達(dá)到90%,在駕車關(guān)窗低車載噪音環(huán)境中識別率達(dá)85%,單次語音交互時間小于3S,很好的驗證了語音交互系統(tǒng)的可用性。
【關(guān)鍵詞】:語音對話 智慧語音助理 命令詞控制
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.52;TN912.3
【目錄】:
  • 摘要3-4
  • Abstract4-8
  • 第一章 緒論8-11
  • 1.1 課題研究背景及意義8-9
  • 1.2 課題國內(nèi)外研究現(xiàn)狀9
  • 1.3 本論文主要研究內(nèi)容9-10
  • 1.4 本論文的組織結(jié)構(gòu)10
  • 1.5 本章小結(jié)10-11
  • 第二章 語音人機(jī)交互技術(shù)11-17
  • 2.1 人機(jī)交互技術(shù)11-12
  • 2.1.1 人機(jī)交互模型11-12
  • 2.1.2 人機(jī)交互基本流程12
  • 2.2 語音合成技術(shù)12-14
  • 2.2.1 基本概念12-13
  • 2.2.2 語音合成的方法13-14
  • 2.3 語音識別技術(shù)14-16
  • 2.3.1 基本概念14-15
  • 2.3.2 語音識別方法15-16
  • 2.4 本章小結(jié)16-17
  • 第三章 智慧語音助理系統(tǒng)方案的設(shè)計17-27
  • 3.1 智慧語音助理交互方案特性17-18
  • 3.2 智慧語音助理語音交互系統(tǒng)介紹18-19
  • 3.3 智慧語音助理的核心子系統(tǒng)19-26
  • 3.3.1 MSP語音云平臺19-22
  • 3.3.2 智慧語音助理客戶端22-25
  • 3.3.2.1 Web與引擎的交互22-23
  • 3.3.2.2 Native與引擎的交互23-24
  • 3.3.2.3 Web與Native的交互24-25
  • 3.3.3 語音能力的輸入輸出25-26
  • 3.4 本章小結(jié)26-27
  • 第四章 智慧語音助理手機(jī)客戶端的實現(xiàn)27-54
  • 4.1 系統(tǒng)開發(fā)環(huán)境27
  • 4.2 科大訊飛MSP語音服務(wù)平臺接入27-35
  • 4.2.1 語音識別引擎27-33
  • 4.2.1.1 語法功能29-30
  • 4.2.1.2 語音識別框架及邏輯實現(xiàn)30-33
  • 4.2.2 語音合成引擎33-35
  • 4.2.3 語音聽寫35
  • 4.3 智慧語音助理客戶端35-49
  • 4.3.1 業(yè)務(wù)層的總體架構(gòu)36-37
  • 4.3.1.1 插件管理框架36
  • 4.3.1.2 中間件容器36-37
  • 4.3.2 單業(yè)務(wù)模塊結(jié)構(gòu)37-39
  • 4.3.2.1 web層總體架構(gòu)38-39
  • 4.3.3 客戶端業(yè)務(wù)層架構(gòu)實現(xiàn)39-42
  • 4.3.3.1 語音交互調(diào)度模塊40-41
  • 4.3.3.2 音頻任務(wù)控制模塊41
  • 4.3.3.3 應(yīng)用程序接口實現(xiàn)41-42
  • 4.3.4 單業(yè)務(wù)模塊實現(xiàn)—打電話42-49
  • 4.4 智能語音助理系統(tǒng)運行測試及界面展示49-52
  • 4.4.1 系統(tǒng)運行流程50-51
  • 4.4.2 運行結(jié)果分析51
  • 4.4.3 智慧語音助理使用流程及界面展示51-52
  • 4.5 本章小結(jié)52-54
  • 第五章 總結(jié)與展望54-56
  • 5.1 總結(jié)54
  • 5.2 下一步工作54-56
  • 參考文獻(xiàn)56-58
  • 致謝58

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 邴志剛,劉媛,崔世鋼;機(jī)器人開發(fā)平臺中語音交互系統(tǒng)的實現(xiàn)[J];天津職業(yè)技術(shù)師范學(xué)院學(xué)報;2004年02期

2 ;首臺美女機(jī)器人亮相[J];科技與經(jīng)濟(jì)畫報;2006年03期

3 施寒瀟;;基于互聯(lián)網(wǎng)語音交互系統(tǒng)的研究與實現(xiàn)[J];計算機(jī)系統(tǒng)應(yīng)用;2006年02期

4 韓超;劉加;;新型多模態(tài)人性化語音交互系統(tǒng)[J];電聲技術(shù);2009年08期

5 禪影;爭鋒,在人機(jī)語音交互的技術(shù)制高點[J];軟件工程師;2001年12期

6 李麗;;人機(jī)語音交互技術(shù)的原理及發(fā)展前景[J];科技資訊;2013年32期

7 易定;用Microsoft Speech SDK5.1實現(xiàn)中文語音交互的方法[J];電腦開發(fā)與應(yīng)用;2005年04期

8 陳斌,郭大勇,施克仁;用于擬人機(jī)器人的嵌入式語音交互系統(tǒng)研究[J];機(jī)器人;2003年05期

9 庾錫昌;劉偉平;武晉;黃紅斌;;基于VoiceXML的語音交互平臺的設(shè)計與實現(xiàn)[J];計算機(jī)工程與設(shè)計;2007年08期

10 姜曉慶;崔世耀;殷艷華;;人機(jī)語音交互中的情感語音處理[J];濟(jì)南大學(xué)學(xué)報(自然科學(xué)版);2008年04期

中國重要會議論文全文數(shù)據(jù)庫 前3條

1 徐波;;海量音頻處理及嵌入式語音交互[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年

2 張戰(zhàn)鋒;韋瑋;呂成興;李成榮;;人機(jī)語音交互平臺以及在Linux下的移植實現(xiàn)[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年

3 李雪峰;付慧生;周敏;;具有語音交互功能的電子鐘的設(shè)計與實現(xiàn)[A];第十六屆全國煤炭自動化學(xué)術(shù)年會、中國煤炭學(xué)會自動化專業(yè)委員會學(xué)術(shù)會議論文集[C];2006年

中國重要報紙全文數(shù)據(jù)庫 前4條

1 鄭陽;嵌入式語音交互技術(shù)[N];人民郵電;2014年

2 ;云之聲牽手英特爾 語音交互助力芯突破[N];中國計算機(jī)報;2014年

3 本報記者 王哲瑋 實習(xí)記者 梁菲;語音交互 王者歸來[N];計算機(jī)世界;2012年

4 ;快人快語 隨身接入[N];網(wǎng)絡(luò)世界;2003年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 王智國;嵌入式人機(jī)語音交互系統(tǒng)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條

1 顧亞平;基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)[D];南京郵電大學(xué);2015年

2 賈玉輝;面向語音交互的云計算系統(tǒng)的研究[D];中國海洋大學(xué);2013年

3 朱潤華;網(wǎng)絡(luò)環(huán)境下基于語音交互的虛擬裝配系統(tǒng)研究[D];西南交通大學(xué);2008年

4 寧正華;Space OS服務(wù)秘書語音交互系統(tǒng)的研究與實現(xiàn)[D];首都師范大學(xué);2009年

5 于貴博;高校醫(yī)院管理及疾病預(yù)警系統(tǒng)[D];吉林大學(xué);2005年

6 李金耀;One-Shot車載語音交互系統(tǒng)的設(shè)計與實現(xiàn)[D];安徽大學(xué);2012年

7 于基業(yè);GIS圖形系統(tǒng)中語音交互核心問題的研究[D];長安大學(xué);2014年

8 鮑艷艷;機(jī)器人語音交互系統(tǒng)的研究與設(shè)計[D];東北大學(xué);2012年

9 李永量;基于SALT的網(wǎng)上直銷系統(tǒng)的實現(xiàn)[D];四川大學(xué);2004年

,

本文編號:1019786

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1019786.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd129***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com