<s id="eoqoe"><xmp id="eoqoe">
<button id="eoqoe"><strong id="eoqoe"></strong></button>
<s id="eoqoe"><xmp id="eoqoe">
<button id="eoqoe"><strong id="eoqoe"></strong></button>
<wbr id="eoqoe"></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><label id="eoqoe"></label></wbr>
<button id="eoqoe"></button>
<wbr id="eoqoe"></wbr>
你的位置:首頁(yè) > 測試測量 > 正文

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”

發(fā)布時(shí)間:2014-12-06 責任編輯:echolady

【導讀】本文主要實(shí)現了家庭監護機器人在語(yǔ)音識別系統的重大突破。本次設計的系統不僅具有語(yǔ)音識別功能,而且還具備較高的識別率,響應速度也明顯加快。本文將為大家闡述語(yǔ)音識別系統在家庭機器人中的應用。

語(yǔ)音是人類(lèi)最常用的交流方式,也是人類(lèi)和計算機交流最渴望的方式。因此用語(yǔ)音同計算機交流也成為了最近研究的熱點(diǎn),計算機對語(yǔ)音的理解是計算機科學(xué)中的一個(gè)引人人勝的、富有挑戰性的課題。

進(jìn)入90年代,隨著(zhù)多媒體時(shí)代的來(lái)臨,迫切要求語(yǔ)音識別系統從實(shí)驗室走向實(shí)用。許多發(fā)達國家如美國、日本、韓國以及IBM、Apple、AT&T、NTT等著(zhù)名公司都為語(yǔ)音識別系統的實(shí)用化開(kāi)發(fā)研究投以巨資。IBM公司于1997年開(kāi)發(fā)出漢語(yǔ)ViaVoice語(yǔ)音識別系統,次年又開(kāi)發(fā)出可以識別上海話(huà)、廣東話(huà)和四川話(huà)等地方口音的語(yǔ)音識別系統ViaVoice''98.目前市場(chǎng)上已經(jīng)出現了語(yǔ)音識別電話(huà)、語(yǔ)音識別記事本等產(chǎn)品,如美國VPTC公司的Voice Organizer和法國的Parrot等。

我國語(yǔ)音識別研究工作開(kāi)始的較晚,但近年來(lái)發(fā)展得很快,一直緊跟國際水平,國家也很重視,并把大詞匯量語(yǔ)音識別的研究列入"8 63"計劃,由中科院聲學(xué)所、自動(dòng)化所、清華大學(xué)電子工程系及北京大學(xué)等單位研究開(kāi)發(fā),取得了高水平的科研成果,如中科院自動(dòng)化所研制的非特定人、連續語(yǔ)音聽(tīng)寫(xiě)系統和漢語(yǔ)語(yǔ)音人機對話(huà)系統,其字準確率或系統響應率可達90%以上。鑒于中國未來(lái)龐大的市場(chǎng),國外也非常重視漢語(yǔ)語(yǔ)音識別的研究。美國、新加坡等地聚集了一批來(lái)自大陸、臺灣、香港等地的學(xué)者,研究成果已達到相當高水平。

1 系統設計

文中是家庭監護機器人項目中的語(yǔ)音識別系統設計部分,設計目的是設計出一種可以識別語(yǔ)音的、協(xié)助監護家庭行動(dòng)不方便人員的機器人。為實(shí)現該語(yǔ)音識別系統,設計了語(yǔ)音識別系統總體結構框圖,如圖1所示。

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”
圖1 系統總體結構框圖
 
1.1 硬件設計

文中所研究和設計的功能,都是應用在移動(dòng)機器人上的。因而系統的研究設計需要考慮到體積小、省電、便于移動(dòng)的特性,并需具有便于家庭用戶(hù)操作的友好顯示界面。對于語(yǔ)音識別部分,需要用到用于語(yǔ)音識別算法處理的處理器、語(yǔ)音采集電路和語(yǔ)音輸出電路,如圖2所示。其中語(yǔ)音識別算法運算的處理器主要負責算法的運算處理,相當于機器人的大腦;語(yǔ)音采集電路負責采集外部的聲音信號,相當于機器人的耳朵;語(yǔ)音輸出電路負責輸出話(huà)語(yǔ)聲音,相當于機器人的嘴巴。

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”
圖2 系統硬件結構圖
 
[page]  
1)語(yǔ)音識別算法處理器選擇

根據系統設計功能的要求,目前常用的語(yǔ)音識別芯片種類(lèi)一般有:?jiǎn)纹瑱C(MCU)、DSP和SoC(System on Circuit)??紤]到普通單片機(MCU)資源的緊缺及運行速度較慢的缺點(diǎn),因而在本系統設計將不考慮使用單片機(MCU)作為語(yǔ)音識別的處理器。DSP包含用作數字信號處理的專(zhuān)用部件,運算能力強、精度高,但目前DSP的價(jià)格比較高,同時(shí)考慮到本系統的特性,需要選擇一種既有較強的運算能力,合適于語(yǔ)音識別的功能,并且能實(shí)現較好的用戶(hù)操作界面,并帶有文件系統(用于識別地圖)的功能,因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有雙內核ARM CortexTM-A8的內核和TMS320C64+TM DSP內核,屬于高性能的OMAP35x架構系列產(chǎn)品,滿(mǎn)足了系統設計的各種功能特性要求。

2)語(yǔ)音編解碼芯片選擇

機器人選擇一款合適的語(yǔ)音處理芯片是非常重要的??紤]到系統中用到了各種電源,并需要對電源進(jìn)行管理,因此選擇TI公司配套的TPS 65930芯片來(lái)作為系統語(yǔ)音識別部分的音頻編解碼處理功能的硬件平臺是非常合適的。該芯片是一個(gè)集成了電源管理、ADC、嵌入式電源控制(EPC)、全功能的音頻編解碼器于一體的芯片,滿(mǎn)足了系統所有電源管理和音頻編解碼的需要,為設計的PCB板節省了空間,同時(shí)減少了多電源硬件設計的負責布線(xiàn)煩惱。

3)電路設計

本文的設計是用在移動(dòng)機器人上的,因而需要語(yǔ)音的輸入、識別處理及語(yǔ)音輸出的功能。對于語(yǔ)音的輸入采集,本文使用聲音傳感器麥克風(fēng)及外圍電路來(lái)實(shí)現。對于語(yǔ)音輸出部分,使用功率放大器結合喇叭來(lái)使用。設計語(yǔ)音部分原理圖如圖3所示。

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”
圖3 語(yǔ)音輸入原理圖
 
[page]  
1.2 軟件設計

HTK(Hidden Markov Model Toolkit)是一套專(zhuān)門(mén)的建立和處理隱馬可夫模型(HMMs)的實(shí)驗工具包,由英國劍橋大學(xué)工程系(Cambridge University Engineering Department,CUED)開(kāi)發(fā)的,主要應用于語(yǔ)音識別領(lǐng)域,也可以應用于語(yǔ)音合成、字符識別和DNA排序等研究領(lǐng)域。HTK經(jīng)過(guò)劍橋大學(xué)、Entropic公司及Microsoft公司的不斷增強和改進(jìn),使其在語(yǔ)音識別領(lǐng)域處于世界領(lǐng)先水平。

基于HTK的語(yǔ)言識別時(shí),識別結果適用只能顯示在DOS或終端上,而且不利于將結果保存、移植或者二次開(kāi)發(fā)利用。在本語(yǔ)音識別系統中使用了HTK接口工具ATK(AnApplication Toolkit for HTK)。ATK是由英國劍橋大學(xué)開(kāi)發(fā)的開(kāi)源語(yǔ)音識別工具,是對HTK的C++多線(xiàn)程封裝,跟HTK一樣,它支持Linux和Windows,它包括HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASour ce、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog模塊部件。

基于A(yíng)TK的語(yǔ)音識別軟件應用系統的由語(yǔ)音信號采集模塊、基于DMA的雙向高速RAM存取模塊、ATK語(yǔ)音識別模塊、系統管理模塊、語(yǔ)音輸出模塊等模塊組成,如圖4所示。

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”
圖4 系統軟件設計結構圖

在軟件設計中,系統管理模塊主要負責系統的總體管理調度,是應用系統的調度中心;語(yǔ)音信號采集模塊主要負責控制數據采集芯片TPS 65930;基于DMA的雙向RAM存取模塊主要負責實(shí)現DMA驅動(dòng)及雙向RAM的讀寫(xiě)存取,使用了通道1來(lái)實(shí)現高速地把語(yǔ)音信號采集到的數據存儲到RAM上,并使用通道2實(shí)現高速地把RAM的數據取出來(lái),用于語(yǔ)音的識別;語(yǔ)音輸出模塊主要負責把相應的音頻數據送到TPS65930,并控制TPS6 5930對接收到的音頻解碼輸出到功放電路,實(shí)現語(yǔ)音輸出的功能。軟件的設計流程圖如圖5所示。

家庭監護機器人有突破!語(yǔ)音識別系統“箭在弦上”
圖5 軟件設計流程

2 語(yǔ)音識別系統實(shí)驗及結果

文中設計的語(yǔ)音識別系統如圖6所示。在實(shí)驗中總共進(jìn)行了3輪話(huà)語(yǔ)測試,每輪300句話(huà)語(yǔ)測試,其中150句為家庭監護機器人需要識別的話(huà)語(yǔ),150句話(huà)語(yǔ)為機器人不予置理的無(wú)關(guān)話(huà)語(yǔ)。本系統只設置10個(gè)需要識別的話(huà)語(yǔ),由15名學(xué)生分別讀音進(jìn)行測試。同時(shí)對無(wú)關(guān)話(huà)語(yǔ)也是由該15名學(xué)生,每人10句分別隨機讀音測試。從顯示結果可以看出,第1輪中,先測試的150句無(wú)關(guān)話(huà)語(yǔ)中,能正確識別出無(wú)關(guān)話(huà)語(yǔ)數為150句,識別出無(wú)關(guān)話(huà)語(yǔ)率為100%,但對需識別的話(huà)語(yǔ)中,正確識別出148句,2句識別出錯,識別率為98.67%;在第2輪中,同樣先測試的150句無(wú)關(guān)話(huà)語(yǔ)中,能正確識別出無(wú)關(guān)話(huà)語(yǔ)數為150句,識別出為無(wú)關(guān)話(huà)語(yǔ)率為100%,但對需識別的話(huà)語(yǔ)中,正確識別出142句,8句識別出錯,識別率為94.67%;在第3輪中,同樣先測試的150句無(wú)關(guān)話(huà)語(yǔ)中,能正確識別出無(wú)關(guān)話(huà)語(yǔ)數為150句,識別出無(wú)關(guān)話(huà)語(yǔ)率為100%,但對需識別的話(huà)語(yǔ)中,正確識別出146句,識別率為97.33%.在3輪測試中,系統都能實(shí)時(shí)響應所有語(yǔ)句,未出現漏句現象。并且在實(shí)驗測試的過(guò)程中,系統的響應速度都非???,感觀(guān)上沒(méi)有時(shí)間延遲,與真人交流速度相當。

從實(shí)驗測試結果可看出,對于識別10個(gè)需要識別的話(huà)語(yǔ)的識別率高達94.67%以上,具有較高的識別率,因而該語(yǔ)音識別系統較好達到了家庭監護機器人使用的要求。

相關(guān)閱讀:

專(zhuān)家親授:基于DSP原理的漢子語(yǔ)音識別系統的實(shí)現
技術(shù)達人:ARM的非特定人語(yǔ)音識別系統的設計
智能手機的超性能語(yǔ)音識別技術(shù)

要采購工具么,點(diǎn)這里了解一下價(jià)格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页
<s id="eoqoe"><xmp id="eoqoe">
<button id="eoqoe"><strong id="eoqoe"></strong></button>
<s id="eoqoe"><xmp id="eoqoe">
<button id="eoqoe"><strong id="eoqoe"></strong></button>
<wbr id="eoqoe"></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>
<wbr id="eoqoe"><label id="eoqoe"></label></wbr>
<button id="eoqoe"></button>
<wbr id="eoqoe"></wbr>