仿人聽覺系統(tǒng)的發(fā)育網絡模型研究
本文選題:聽覺模型 + 發(fā)育網絡; 參考:《鄭州大學》2017年碩士論文
【摘要】:隨著人工智能技術的普及,機器人已逐漸進入人類的日常生活。讓機器人聽懂人類的語言,就是使機器人能夠像人類一樣獲得聽覺。目前,聲音識別是機器聽覺領域的核心方向,相比于機器聽覺,人類聽覺系統(tǒng)能準確、快速地識別聲音的內容,所以模擬人類聽覺系統(tǒng)構建人工聽覺模型已成為機器聽覺領域研究的熱點。本文引入發(fā)育網絡,通過粗略模擬人類聽覺系統(tǒng)信息處理的腹側通路結構來構建聽覺模型,腹側通路主要處理聲音的內容信息,即主要負責聲音的內容識別。為了體現所構建模型的性能,本文設置語音識別實驗進行驗證。本文的工作主要分為三部分。首先簡單概述了人類聽覺系統(tǒng)的結構,并對其信息傳導通路進行詳細的分析,為構建聽覺模型提供理論基礎。接著重點介紹了腦殼封閉的發(fā)育網絡的基礎理論,對自主發(fā)育的思想進行了闡述,并解釋了發(fā)育網絡的基本模型和學習算法。其次,基于發(fā)育網絡,粗略模擬人類聽覺系統(tǒng)信息處理的腹側通路結構建立發(fā)育網絡模型。簡述了發(fā)育網絡模型的特點,并對其模型結構提出改進。對發(fā)育網絡引入多種仿生機制,如設計神經元的連接方式和學習狀態(tài)實現神經元的自主學習;采用神經元再生機制實現神經元的充分利用;增加神經元釋放機制解決神經元的資源分配問題。設計了發(fā)育網絡模型的發(fā)育程序,并錄制語音創(chuàng)建語音庫,然后設置了語音識別實驗對發(fā)育網絡模型的性能進行驗證。實驗結果表明,發(fā)育網絡模型對英文單詞和短語的識別率分別可達到94.44%和90.19%,說明模型初步具備了對實際環(huán)境中語音的識別能力。最后,為了進一步提高發(fā)育網絡模型的性能,引入了深度信念網絡構建特征提取器對語音提取深度特征,分析了語音經過深度信念網絡的特征表示,并對其特征進行可視化。在原有語音數據庫的基礎上,結合新特征,對發(fā)育網絡模型進行語音識別實驗。從實驗結果可以看出,發(fā)育網絡模型在新特征的基礎上對英文單詞和短語識別率分別可達96.30%和92.96%,表明模型的性能得到了較大的改善。與傳統(tǒng)的語音識別模型相比,發(fā)育網絡模型表現出較優(yōu)的性能。
[Abstract]:With the popularization of artificial intelligence technology, robots have gradually entered the daily life of human beings.To make robots understand human language is to enable robots to get hearing just like humans.At present, sound recognition is the core direction in the field of machine hearing. Compared with machine hearing, human auditory system can recognize the content of sound accurately and quickly.Therefore, simulating human auditory system to build artificial auditory model has become a hot spot in the field of machine hearing.In this paper, the developmental network is introduced to construct the auditory model by roughly simulating the ventral pathway structure of human auditory system information processing. The ventral pathway mainly deals with the content information of sound, that is, it is mainly responsible for the content recognition of sound.In order to reflect the performance of the model, this paper set up speech recognition experiments to verify.The work of this paper is divided into three parts.Firstly, the structure of human auditory system is briefly summarized, and its information transmission pathway is analyzed in detail, which provides a theoretical basis for the construction of auditory model.Then the basic theory of the closed development network of the skull is introduced, the idea of autonomous development is expounded, and the basic model and learning algorithm of the development network are explained.Secondly, the development network model is established based on the development network, which roughly simulates the ventral pathway structure of human auditory system information processing.In this paper, the characteristics of the developmental network model are briefly described, and the improvement of its model structure is put forward.A variety of biomimetic mechanisms are introduced to the development network, such as designing the connection mode and learning state of neurons to realize autonomous learning of neurons, adopting the mechanism of neuron regeneration to make full use of neurons.The mechanism of neuronal release is added to solve the problem of resource allocation of neurons.The development program of the development network model is designed and the speech database is recorded. Then the performance of the development network model is verified by setting up the speech recognition experiment.The experimental results show that the developmental network model has a recognition rate of 94.44% and 90.19% for English words and phrases respectively.Finally, in order to further improve the performance of the development network model, a feature extractor constructed by the depth belief network is introduced to extract the depth features of speech, and the feature representation of speech passing through the depth belief network is analyzed, and the features are visualized.Based on the original speech database and the new features, the speech recognition experiment of the development network model is carried out.It can be seen from the experimental results that the recognition rates of English words and phrases are 96.30% and 92.96%, respectively, based on the new features of the developmental network model, which indicates that the performance of the model has been greatly improved.Compared with the traditional speech recognition model, the developmental network model has better performance.
【學位授予單位】:鄭州大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP242
【相似文獻】
相關期刊論文 前10條
1 曲超;;容量網絡模型及其性質研究[J];東莞理工學院學報;2011年03期
2 黃威,林麗閩,宋亮;基于第三方整合的商業(yè)網絡模型[J];合肥工業(yè)大學學報(自然科學版);2003年S1期
3 韋洛霞;耦合生長網絡模型的模擬[J];河南大學學報(自然科學版);2004年02期
4 郝玉;葉世偉;;基于軟競爭機制的對傳網絡模型及應用[J];計算機仿真;2006年03期
5 馬費成;王曉光;;知識轉移的社會網絡模型研究[J];江西社會科學;2006年07期
6 孟凡玲;范向軍;;水電工程監(jiān)理評標BP網絡模型研究[J];人民黃河;2007年07期
7 李文林;苗靜;劉振紅;;含時滯的復雜動態(tài)網絡模型的指數同步[J];河南師范大學學報(自然科學版);2009年05期
8 魯智勇;張權;張希;唐朝京;;等效分組級聯BP網絡模型及其應用[J];電子學報;2010年06期
9 江瓊琴;宋文廣;;一種改進的BP網絡模型在唇裂手術預測分析中的應用[J];池州學院學報;2012年06期
10 殷洪義 ,榮明宗 ,周昭南 ,周曼殊;網絡模型的統(tǒng)一表征[J];國防科技大學學報;1981年02期
相關會議論文 前10條
1 張書超;那日薩;;具有老化機制的阿波羅網絡模型[A];2006全國復雜網絡學術會議論文集[C];2006年
2 王仲君;黃紅球;;一個具有確定度分布的有向網絡模型[A];2006全國復雜網絡學術會議論文集[C];2006年
3 李季明;張寧;;具有隨機性的確定性網絡模型[A];2006全國復雜網絡學術會議論文集[C];2006年
4 秦紹萌;陳勇;;生態(tài)系統(tǒng)宏觀演化的網絡模型[A];2006全國復雜網絡學術會議論文集[C];2006年
5 駱繼明;郭新軍;;分布復雜機電系統(tǒng)網絡模型圖自動生成算法研究[A];煤礦機電一體化新技術創(chuàng)新與發(fā)展2012學術年會論文集[C];2012年
6 周勝利;耿顯民;;具有真實網絡一般特性的復雜網絡模型[A];第七屆中國不確定系統(tǒng)年會論文集[C];2009年
7 楊洪勇;王福生;;基于帶寬的Internet網絡模型[A];2007中國控制與決策學術年會論文集[C];2007年
8 趙雁飛;劉永忠;陳三強;孫皓;;冷凍干燥過程相遷移和相分布的孔尺度網絡模型與模擬[A];第八屆全國冷凍干燥學術交流會論文集[C];2005年
9 梁昌洪;鄭家駿;;復電介質反演的精確網絡模型[A];2001年全國微波毫米波會議論文集[C];2001年
10 劉杰;陸君安;;兩類復雜網絡模型及其同步能力研究[A];2006全國復雜網絡學術會議論文集[C];2006年
相關重要報紙文章 前10條
1 ;智能光網絡的網絡模型[N];人民郵電;2003年
2 琪東;老年人的聽覺變化及調適[N];中國醫(yī)藥報;2004年
3 馮衛(wèi)東;美構建可快速確認基因功能的基因網絡模型[N];科技日報;2008年
4 賀贊暉 唐大海;價格網絡與金融屬性定價[N];期貨日報;2010年
5 本報記者 王峰;消除耳朵里的嗡鳴聲[N];中國消費者報;2002年
6 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年
7 閆婷;語音識別 理想與現實的距離[N];計算機世界;2007年
8 劉喜喜;語音識別將把鼠標鍵盤打入冷宮?[N];中國計算機報;2008年
9 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年
10 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年
相關博士學位論文 前10條
1 齊峰;人工神經樹網絡模型的優(yōu)化研究與應用[D];山東師范大學;2011年
2 李淑靜;復合復雜網絡模型研究與應用[D];青島大學;2011年
3 譚利;復雜網絡模型及應用研究[D];中南大學;2010年
4 隋毅;多子網復合復雜網絡模型及其相關性質的研究[D];青島大學;2012年
5 黃朝琴;基于離散縫洞網絡模型的多尺度兩相流動模擬理論研究[D];中國石油大學(華東);2012年
6 岳博;Bayes網絡模型及其學習算法研究[D];西安電子科技大學;2002年
7 彭利民;基于Cayley圖的無線P2P覆蓋網絡模型及相關技術研究[D];華南理工大學;2011年
8 王晨晨;碳酸鹽巖介質雙孔隙網絡模型構建理論與方法[D];中國石油大學(華東);2013年
9 李克勇;聽覺系統(tǒng)聲誘發(fā)反應的磁聲場記錄[D];中國協和醫(yī)科大學;1996年
10 蔡先鋒;礦井三維地理網絡模型及網絡分析研究[D];中國礦業(yè)大學(北京);2012年
相關碩士學位論文 前10條
1 譚達佩;仿人聽覺系統(tǒng)的發(fā)育網絡模型研究[D];鄭州大學;2017年
2 王芳;基于深度信念網絡的資源檢索與推薦系統(tǒng)[D];北京郵電大學;2015年
3 楊光勇;科研合作超網絡模型的構建及其應用研究[D];上海理工大學;2013年
4 李倩;深度網絡模型構建及學習算法研究[D];西安電子科技大學;2014年
5 閆廷亞;基于GHSOM網絡模型的FY-2E夜間衛(wèi)星云圖分類方法研究[D];華東交通大學;2015年
6 劉峰;軌道車輛MVB網絡模型研究與設計[D];長春工業(yè)大學;2016年
7 齊亞萍;具有實數詞匯結構的語言競爭復雜agent網絡模型[D];昆明理工大學;2016年
8 邵春昌;基于圖理論的信息網絡模型研究[D];中央民族大學;2016年
9 鄭光璞;模擬視覺皮層工作機制的發(fā)育網絡模型研究[D];鄭州大學;2016年
10 張磊;微博超網絡模型的建立及關鍵節(jié)點識別方法研究[D];南京航空航天大學;2016年
,本文編號:1747640
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1747640.html