基于DMLS的語音關(guān)鍵詞檢測技術(shù)研究
本文選題:關(guān)鍵詞檢測 切入點:動態(tài)匹配詞格檢索 出處:《解放軍信息工程大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:語音關(guān)鍵詞檢測是指在語音數(shù)據(jù)中查找到所有可能出現(xiàn)的給定詞的過程,是有效處理口語和實現(xiàn)人機智能通信的解決方案之一,具有廣泛的應(yīng)用前景。目前,基于動態(tài)匹配詞格檢索(Dynamic Match Lattice Spotting, DMLS)的方法是關(guān)鍵詞檢測的主流方法之一。DMLS將基于Lattice的快速檢測和動態(tài)序列匹配技術(shù)融合在一起,在Lattice檢索過程中應(yīng)用最小編輯距離來補償音素識別器的插入、刪除和替換錯誤,實現(xiàn)了快速而準確的關(guān)鍵詞檢測。本文針對DMLS方法的特點,在Lattice生成、索引創(chuàng)建、關(guān)鍵詞置信度和集外詞檢測等方面開展研究,主要工作及創(chuàng)新點如下:(1)音素Lattice的精度直接影響關(guān)鍵詞檢測的性能,為了提高Lattice的精度,應(yīng)用TRAP特征和多層感知器構(gòu)建了更為精準的音素Lattice生成系統(tǒng),并在此基礎(chǔ)上搭建了基于DMLS的關(guān)鍵詞檢測基線系統(tǒng)。該系統(tǒng)采用改進的維特比算法遍歷Lattice來創(chuàng)建一個固定長度的音素序列數(shù)據(jù)庫(Sequence Database, SDB),在檢索階段應(yīng)用最小編輯距離作為置信度來實現(xiàn)關(guān)鍵詞的檢出。實驗結(jié)果表明,基于TRAP特征生成的Lattic e搭建的基線系統(tǒng)相比MFCC和PLP特征具有一定的優(yōu)勢,系統(tǒng)的召回率提升了約5%。(2)針對DMLS中索引階段SDB創(chuàng)建損失部分信息和查詢項長度超出索引長度的問題,提出了一種改進的混合索引的方法,將最大概率音素序列和SDB融合構(gòu)成混合索引。最大概率音素序列是語音識別中的1-best完整結(jié)果,可以代表整個Lattice上的全局最優(yōu)結(jié)果,與SDB形成一定的互補,并且最大概率音素序列不受音素序列長度N的影響,可以用于輔助音素序列較長的查詢項的檢測。實驗結(jié)果表明,混合索引方法相比單一的SDB索引系統(tǒng)的品質(zhì)因數(shù)提升了1.4%。(3)在基于DMLS的關(guān)鍵詞檢測系統(tǒng)中,應(yīng)用最小編輯距離作為關(guān)鍵詞檢出的置信度,該方法在提高檢出率的同時也增加了虛警率。針對此問題,提出了一種融合后驗概率的混合置信度方法。該方法首先將基于Lattice的后驗概率引入到DMLS的索引建立中,其次應(yīng)用數(shù)據(jù)驅(qū)動的音素替換、插入和刪除代價來實現(xiàn)更加靈活的近似匹配,最后通過聯(lián)合最小編輯距離和后驗概率置信度得分進行關(guān)鍵詞檢測。實驗結(jié)果表明,最小編輯距離和后驗概率置信度具有一定的互補性,系統(tǒng)的等錯誤率相對降低了13.3%。(4)針對關(guān)鍵詞檢測中的集外詞問題,提出了一種融合查詢擴展和動態(tài)匹配的方法。由于查詢擴展和動態(tài)匹配是在不同的層面補償集外詞發(fā)音的不確定性,考慮到兩者潛在的互補性,研究了兩種融合方法:一種方法是結(jié)果融合,分別應(yīng)用查詢擴展和動態(tài)匹配并行的檢測集外詞,然后合并檢測結(jié)果;另一種是置信度融合,融合最小編輯距離和發(fā)音得分構(gòu)成混合置信度進行集外詞的檢出與確認。實驗結(jié)果表明,第二種融合方法的效果更好,系統(tǒng)的品質(zhì)因數(shù)相對提升了19.8%。
[Abstract]:Speech keyword detection refers to the voice data to find all possible for a given word, is the effective treatment of oral and one solution to achieve intelligent man-machine communication, has wide application prospect. At present, the dynamic matching word lattice based retrieval (Dynamic Match Lattice Spotting, DMLS) method is one of the main methods of keyword detection.DMLS rapid detection and dynamic Lattice sequence matching technology together based on the application of insertion of the minimum edit distance in the Lattice retrieval process to compensate phoneme recognizer, delete and replace error, realize keyword detection quickly and accurately. This paper is based on DMLS method, create the index in the Lattice generation, and carry out study on the key words of confidence and out of vocabulary testing and other aspects, the main work and innovation are as follows: (1) directly affect the accuracy of the phoneme Lattice keyword detection ring The performance, in order to improve the accuracy of Lattice, application of TRAP and multilayer perceptron constructs a more precise phoneme Lattice generation system, which is established on the basis of DMLS baseline system based on keyword detection. The system adopts an improved Viterbi algorithm to traverse the Lattice to create a fixed length phoneme sequence database (Sequence Database. SDB), in the detection of phase retrieval using minimum edit distance as the confidence to achieve the keywords. The experimental results show that the baseline system characteristics of TRAP generated Lattic e based structures compared to MFCC and PLP feature has certain advantages, enhance the recall rate of about 5%. system (2) for the DMLS SDB to create the index loss part of the information and query length exceeds the length of the index, proposed a hybrid index improved, the maximum probability of phoneme sequences and SDB fusion hybrid The maximum probability index. 1-best is a complete sequence of phonemes results in speech recognition, can represent the global optimal results on the Lattice, form a complementary and SDB, and the maximum probability of phoneme sequence is not affected by the phoneme sequence length of N, can be used for the detection of query auxiliary phoneme sequences longer. The experimental results show that the mixed compared the quality factor index method SDB index system the improved 1.4%. (3) in the DMLS based keyword detection system, the application of minimum edit distance as the keyword detection confidence, this method can improve the detection rate and increase the false alarm rate. To solve this problem, we propose a hybrid fusion the confidence probability method. Firstly, Lattice posterior probability is introduced into the DMLS index based on data driven application to replace the second phone, insert and delete the price. The more flexible approximate matching, finally combined with the minimum edit distance and a posteriori probability confidence score for keyword detection. The experimental results show that the minimum edit distance and a posteriori confidence has a complementary system, etc. the relative error rate is reduced by 13.3%. (4) according to the problems in the detection of out of vocabulary words. This paper presents a fusion method for query expansion and dynamic matching. Because the query expansion and dynamic matching in pronunciation level compensation out of vocabulary of different uncertainty, considering the complementarity of the two potential, two kinds of fusion methods: one is the result of fusion was detected by out of vocabulary expansion and dynamic parallel matching the query, then merge the results; the other is confidence fusion, fusion minimum edit distance and the pronunciation score constitutes detection and validation of hybrid reliability of out of vocabulary words. The experimental results show that the effect of the second fusion methods is better, and the quality factor of the system is improved by 19.8%.
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TN912.3
【相似文獻】
相關(guān)期刊論文 前10條
1 陽小華;蔣輝;馬家宇;;基于任務(wù)上下文的查詢擴展方法[J];鄭州大學(xué)學(xué)報(理學(xué)版);2010年01期
2 吳煈;張奇;黃萱菁;;基于整數(shù)線性規(guī)劃的查詢擴展[J];計算機研究與發(fā)展;2013年08期
3 何燕;;基于用戶反饋的查詢擴展研究[J];情報理論與實踐;2013年08期
4 黃偉群;;基于用戶視角的交互式查詢擴展研究[J];圖書情報工作;2014年05期
5 黃名選;嚴小衛(wèi);張師超;;查詢擴展技術(shù)進展與展望[J];計算機應(yīng)用與軟件;2007年11期
6 林國俊;葉飛躍;耿冬;鄭國良;;基于語義的概念查詢擴展[J];計算機工程與設(shè)計;2009年06期
7 鞏玉璽;王大玲;;一種改進的基于偽相關(guān)反饋的查詢擴展[J];微計算機信息;2009年15期
8 黃名選;張師超;嚴小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴展[J];計算機工程;2009年10期
9 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹的查詢擴展[J];計算機工程;2009年14期
10 羅小聰;;基于專用雙語詞典的查詢擴展[J];現(xiàn)代計算機(專業(yè)版);2009年10期
相關(guān)會議論文 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數(shù)字檔案檢索策略[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴展[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴展方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
4 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
5 李東園;白宇;蔡東風(fēng);;基于用戶日志分析的查詢擴展研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
6 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
7 王秉卿;張奇;吳立德;黃萱菁;;機器學(xué)習(xí)的查詢擴展在博客檢索中的應(yīng)用[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
8 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
9 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
10 郭文;史曉東;陳毅東;;跨語言信息檢索中的查詢擴展[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
相關(guān)重要報紙文章 前1條
1 鐘威 何擁軍;數(shù)字檔案信息擴展查詢功能需求分析及實現(xiàn)方式[N];中國檔案報;2011年
相關(guān)博士學(xué)位論文 前3條
1 郭曉黎;煤礦安全事件本體及其在查詢擴展中的應(yīng)用研究[D];中國礦業(yè)大學(xué)(北京);2016年
2 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學(xué);2011年
3 王俊義;正負相關(guān)反饋與查詢擴展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 鄭永軍;基于DMLS的語音關(guān)鍵詞檢測技術(shù)研究[D];解放軍信息工程大學(xué);2014年
2 姚小同;查詢擴展技術(shù)研究[D];北京郵電大學(xué);2009年
3 許威;基于概念格的查詢擴展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年
4 胡保祥;基于查詢?nèi)罩镜牟樵償U展研究[D];北京郵電大學(xué);2013年
5 董靜;基于信任網(wǎng)絡(luò)的查詢擴展技術(shù)研究[D];哈爾濱工程大學(xué);2013年
6 郭青;基于用戶標注信息的查詢擴展方法研究[D];大連理工大學(xué);2014年
7 尹俊杰;基于本體術(shù)語關(guān)系的局部查詢擴展[D];河北大學(xué);2012年
8 瞿國忠;查詢擴展技術(shù)研究[D];華中師范大學(xué);2007年
9 林智超;基于查詢擴展的網(wǎng)絡(luò)信息語義檢索服務(wù)的研究與實現(xiàn)[D];華東師范大學(xué);2012年
10 陳U,
本文編號:1589914
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1589914.html