美AAAAAA级午夜福利视频_技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計-互連技術(shù)-電子元件技術(shù)網(wǎng)

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><label id="eoqoe"></label></wbr>

你的位置：首頁(yè) > 互連技術(shù) > 正文

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

發(fā)布時(shí)間：2014-01-24 責任編輯：mikeliu

【導讀】語(yǔ)音交互是人類(lèi)交流和交換信息中最便捷的手段和最重要的媒體，長(cháng)久以來(lái)，人們都希望找尋一種新的途徑解決人類(lèi)與機器的交互方式，希望機器設備能夠“聽(tīng)”懂人類(lèi)的語(yǔ)音信息進(jìn)行交互，識別其含義并響應、從而做出相應動(dòng)作，這樣的交互方式更能被使用者接受，取代原有的鍵盤(pán)、按鈕、開(kāi)關(guān)等傳統交互方式，基于非特定人的語(yǔ)音識別技術(shù)已然成為人機交互新方式的一個(gè)重要發(fā)展方向和研究熱點(diǎn)。

語(yǔ)音信號的識別涉及眾多學(xué)科知識體系，與計算機、語(yǔ)言學(xué)、通信、數理統計、信號處理和人工智能等學(xué)科都有著(zhù)密切的關(guān)系，由于語(yǔ)音信號具有信息量大、不確定性、動(dòng)態(tài)性和連續性的特點(diǎn)，在語(yǔ)音信號的預處理、特征提取等階段處理數據量非常大，對軟件的處理算法和硬件的處理能力都有較高的要求，傳統使用PC機或者工控機等高處理性能的平臺實(shí)現語(yǔ)音信號識別，但硬軟件開(kāi)發(fā)造價(jià)無(wú)疑是阻礙普及的重要因素，本系統采用ARM Cortex M3 內核ST 公司的32 位高性能單片機STM32F103C8T6結合LD3320語(yǔ)音識別芯片，通過(guò)構建SD卡文件系統實(shí)現非特定人語(yǔ)音識別關(guān)鍵詞動(dòng)態(tài)編輯功能，適用于嵌入式語(yǔ)音識別場(chǎng)合。系統電路簡(jiǎn)單，性?xún)r(jià)比高，識別距離和識別精度都可以滿(mǎn)足嵌入式應用。

1 非特定人語(yǔ)音識別技術(shù)原理

非特定人語(yǔ)音識別技術(shù)研究的最終目的是讓計算機等設備能夠“聽(tīng)懂”人類(lèi)語(yǔ)音，提取出語(yǔ)音中所包含的特定信息，成為人機通信和交互最便捷的手段。由于語(yǔ)音信號本身具有不確定性、動(dòng)態(tài)性和連續性，這就為準確量化和處理該信號帶來(lái)非常大的困難，每個(gè)人的語(yǔ)音要建立不同的語(yǔ)音樣本也為識別的普及帶來(lái)瓶頸約束。目前的語(yǔ)音識別是先建立特征庫然后將待識別的信號經(jīng)處理與特征庫比對得到相似結果判定輸出。從本質(zhì)上屬于基于統計模式的基本理論，分語(yǔ)言模型訓練、識別分析兩個(gè)大階段構成和實(shí)現，如圖1所示。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

聲學(xué)訓練階段通常是離線(xiàn)完成的，由語(yǔ)言學(xué)家對預先收集好的海量語(yǔ)音樣本、語(yǔ)言數據庫、噪聲數據進(jìn)行信號處理和知識挖掘，通過(guò)語(yǔ)音信號處理理論及相應數學(xué)算法模型建立語(yǔ)音識別系統所需要的“聲學(xué)模型”和“語(yǔ)言模型”.

識別分析階段通常是在線(xiàn)完成的，對用戶(hù)實(shí)時(shí)的語(yǔ)音進(jìn)行自動(dòng)識別。識別過(guò)程通常又可以分為“前端”和“后端”兩大模塊：“前端”模塊主要的作用是進(jìn)行端點(diǎn)檢測、降噪、特征提取等;“后端”模塊的作用是利用訓練好的“聲學(xué)模型”和“語(yǔ)言模型”對用戶(hù)說(shuō)話(huà)的特征向量進(jìn)行統計模式識別，得到其包含的文字信息，此外，后端模塊還存在一個(gè)“自適應”的反饋模塊，可以對用戶(hù)的語(yǔ)音進(jìn)行自學(xué)習，從而對“聲學(xué)模型”和“語(yǔ)音模型”進(jìn)行必要的“校正”,進(jìn)一步提高識別的準確率。

2 系統設計的整體結構

本系統以STM32F103C8T6 微控制器為控制核心，搭配微控制器最小核心電路、LD3320語(yǔ)音識別電路、SD卡電路、電源電路、用戶(hù)按鍵輸入電路、串口數據輸出電路、狀態(tài)指示電路等綜合組成。該系統體積小巧，可以作為嵌入式組件單元融入用戶(hù)電路或者板卡中，上電后STM32F108C8T6內部程序進(jìn)行程序初始化、SD 卡文件系統初始化、LD3320初始化、隨后等待識別音頻接收，識別完成后輸出響應信息或者解碼音頻，系統整體結構如圖2所示，最終實(shí)現積木式功能組件的全部功能。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

[page]

3 系統硬件電路設計

3.1 微控制核心方案選型及電路

系統采用ARM Cortex M3內核ST公司的32位高性能單片機STM32F103C8T6 為控制核心，該芯片可以達到72 MHz的工作頻率，內置高速存儲器(64 KB的閃存和20 KB的SRAM)，擁有豐富的I/O口資源和鏈接到兩條APB 總線(xiàn)的外設。包括了12 b 的ADC、通用16 b 的定時(shí)器、還包括I2C、SPI、USART、USB、CAN等總線(xiàn)或串行通信接口，片內資源和擴展接口都十分豐富，該微控制核心是專(zhuān)門(mén)設計于滿(mǎn)足高穩定性、低功耗、實(shí)時(shí)性、高性?xún)r(jià)比的嵌入式產(chǎn)品應用。該內核芯片可以滿(mǎn)足非特定人語(yǔ)音識別的功能要求，利用相關(guān)電路構成STM32F103C8T6 的最小系統，在硬件PCB 中還集成了功能引針輸出接口、SD卡接口、USB下載調試電路，用戶(hù)按鍵、電源電路等，核心系統電路圖如圖3所示，配合其他外圍擴展達到功能要求。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

3.2 非特定人語(yǔ)音識別方案選型及電路

本系統中選用IC Route公司生產(chǎn)的LD3320非特定人語(yǔ)音識別芯片，該芯片是非特定人語(yǔ)音識別的專(zhuān)用芯片，內部已經(jīng)集成了語(yǔ)音識別處理器和一些信號調制電路，擁有高性能的A/D轉換器、D/A轉換器、麥克風(fēng)音頻信號輸入接口、音頻解碼輸出接口等，用戶(hù)只需要用軟件編輯好待識別的關(guān)鍵詞列表，LD3320最大可以支持50 條關(guān)鍵詞句，把這些列別以字符的形式傳送到芯片中，就可以對待識別的語(yǔ)音信號進(jìn)行近似度分析，識別后輸出結果。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

LD3320 整體工作電路如圖4 所示，總體上可以把電路圖分為8個(gè)部分，分別是LD3320基礎外圍電路、電源電路、外部晶體振蕩器電路、麥克風(fēng)信號處理電路、去耦合濾波電路、解碼音頻去直流成分電路、功能引針輸出電路、狀態(tài)信號指示電路。語(yǔ)音識別單元對于電源供電電路的要求較高，電路中注重對供電純凈度的要求，由系統中的LDO芯片LM1117-3.3 V為語(yǔ)音識別系統供電，加上電感、電容為供電進(jìn)行濾波，RSTB為L(cháng)D3320復位引腳，連接到主控制器進(jìn)行復位控制。LD3320支持并行數據通信和串行數據通信，在本系統設計中考慮對主控I/O 資源的占用問(wèn)題，故而選用串行通信方式對LD3320 進(jìn)行數據傳送和控制，LD3320 的MD 引腳通過(guò)上拉電阻鉗位為高電平。SPI總線(xiàn)的SDI、SDO、SDCK和SCS引腳連接到主控芯片對應引腳。INTB為中斷信號引腳，遇到識別結果輸出或者是內部音頻文件解碼完成等狀態(tài)，該引腳會(huì )對應輸出電平狀態(tài)通知主控。MBS引腳作為麥克風(fēng)偏置電壓輸入，連接了RC電路，保證產(chǎn)生一個(gè)浮動(dòng)電壓供給麥克風(fēng)信號。

4 系統軟件功能設計

4.1 語(yǔ)音識別軟件設計

系統主控上電后首先進(jìn)行各項初始化，包括LD3320 需要的8M 時(shí)鐘信號，由STM32 初始化后輸出8M 頻率供給LD3320使用，初始化STM32內部時(shí)鐘、SD卡文件系統、SPI相關(guān)寄存器、SDIO數據初始化、中斷設置等等。經(jīng)過(guò)初始化后SD 卡文件系統會(huì )在SD 卡中尋找system.ini配置文件，將里面的字段進(jìn)行拆分后提取，送給LD3320相關(guān)寄存器，隨后把關(guān)鍵字句列表和長(cháng)度信息傳送給LD3320并啟動(dòng)識別過(guò)程，當識別成功后串口會(huì )發(fā)出響應的返回值參數，并且按照用戶(hù)需求可以指定需要解碼的音頻文件，經(jīng)過(guò)LD3320進(jìn)行MP3文件解碼輸出，程序流程圖如圖5所示。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

[page]

主控程序初始化代碼如下：

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

4.2 SD卡文件系統軟件設計

在實(shí)際應用中，修改主控制單片機程序較為復雜，本系統將識別關(guān)鍵語(yǔ)句寫(xiě)在一個(gè)命名為system.ini文件中，將此文件拷貝到SD卡中，SD卡需要實(shí)現格式化，只能出現一個(gè)。ini 文件，其他的文件均為XXX.mp3 文件，SD 的片選信號CS、數據輸入信號DI、數據輸出信號DO、時(shí)鐘信號SCLK 在硬件上已經(jīng)與STM32的SPI接口相連接，系統上電后會(huì )初始化SD卡文件系統，發(fā)送至少74個(gè)時(shí)鐘以上確保SD卡片選正常后將SD卡復位等待8個(gè)時(shí)鐘周期進(jìn)入SPI讀寫(xiě)模式，通過(guò)STM32內部編寫(xiě)好的文件系統程序找尋“配置文件”即system.ini文件，讀取關(guān)鍵詞識別列表內容，在系統軟件編程中，采用3個(gè)字段進(jìn)行功能約定，字段功能約定配置如下：

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

[page]

5 性能測試與分析

為保證系統對非特定人的語(yǔ)音識別效果、環(huán)境底噪影響、語(yǔ)音識別過(guò)程響應時(shí)間、非特定人聲音樣本識別成功率等參數達標，本文針對各項參數指定了測試方案，實(shí)驗環(huán)境分為安靜環(huán)境(如家居環(huán)境)和相對嘈雜的環(huán)境(如課堂環(huán)境)進(jìn)行了實(shí)測，指定3名發(fā)音人作為3個(gè)不同的聲音識別樣本，選定了短句識別語(yǔ)句、中長(cháng)句識別語(yǔ)句，長(cháng)句識別語(yǔ)句各2條進(jìn)行樣本測試(約定3字以下為短句，3~5字為中長(cháng)句，5字以上為長(cháng)句)，每種測試語(yǔ)句結合不同發(fā)音人重復20次結果進(jìn)行統計，在安靜環(huán)境下測試短句識別準確率為93.37%、中長(cháng)句識別準確率為91.67%、長(cháng)句識別準確率為90.23%.在嘈雜環(huán)境下測試短句識別準確率為87.25%、中長(cháng)句識別準確率為84.36%、長(cháng)句識別準確率為81.12%.從實(shí)驗數據上分析，制約識別準確率的原因是多方面的，與發(fā)音人本身聲音質(zhì)量、環(huán)境底噪、識別語(yǔ)句近似度、識別語(yǔ)句長(cháng)度均有關(guān)系，單從數據上不難得到總體識別率應該是在81%以上，可以滿(mǎn)足應用需求，系統實(shí)物圖如圖6所示，硬件結構小巧，功耗低、性?xún)r(jià)比高，因此具備市場(chǎng)應用前景和市場(chǎng)需求。

技術(shù)達人：ARM的非特定人語(yǔ)音識別系統的設計

6 結語(yǔ)

普及語(yǔ)音識別技術(shù)是當前研究和發(fā)展的新趨勢，特別是對于非特定人的語(yǔ)音識別是語(yǔ)音信號領(lǐng)域處理的熱點(diǎn)和難點(diǎn)，本方案利用了STM32F103C8T6與LD3320結合，配合各種外圍電路完成了非特定人語(yǔ)音識別的嵌入式平臺，在平臺中通過(guò)硬軟件構建，在不更改主控制芯片程序的前提下，用戶(hù)可以通過(guò)更改SD 卡內配置文件的方法隨意設定識別關(guān)鍵語(yǔ)句，經(jīng)過(guò)不同發(fā)音人和環(huán)境的實(shí)測，該系統在嘈雜環(huán)境中的識別準確率可達81%,在安靜環(huán)境中的識別準確率可達90%以上，本系統可以方便的嵌入用戶(hù)系統或者板卡中，積木式搭建靈活實(shí)用，因而具有廣泛的市場(chǎng)需求和應用前景。

相關(guān)閱讀：
非特定人車(chē)載音響語(yǔ)音控制系統的設計
語(yǔ)音識別技術(shù)系統結構
語(yǔ)音合成&語(yǔ)音識別技術(shù)-打造能聽(tīng)會(huì )說(shuō)的智能家電

要采購麥克風(fēng)么，點(diǎn)這里了解一下價(jià)格!

上一篇：資深網(wǎng)友總結選取LED驅動(dòng)電源七大技巧

下一篇：技術(shù)妙文：反激式電源中常見(jiàn)噪聲來(lái)源及相關(guān)解決

特別推薦

技術(shù)文章更多>>

技術(shù)白皮書(shū)下載更多>>

熱門(mén)搜索

友情鏈接(QQ：317243736)

我愛(ài)方案網(wǎng) ICGOO元器件商城創(chuàng )芯在線(xiàn)檢測芯片查詢(xún) 天天IC網(wǎng) 電子產(chǎn)品世界無(wú)線(xiàn)通信模塊控制工程網(wǎng) 電子開(kāi)發(fā)網(wǎng) 電子技術(shù)應用與非網(wǎng) 世紀電源網(wǎng) 21ic電子技術(shù)資料下載電源網(wǎng) 電子發(fā)燒友網(wǎng) 中電網(wǎng) 中國工業(yè)電器網(wǎng) 連接器礦山設備網(wǎng) 工博士智慧農業(yè) 工業(yè)路由器天工網(wǎng) 乾坤芯電子元器件采購網(wǎng) 亞馬遜KOL 聚合物鋰電池工業(yè)自動(dòng)化設備企業(yè)查詢(xún) 工業(yè)路由器元器件商城連接器 USB中文網(wǎng) 今日招標網(wǎng) 塑料機械網(wǎng) 農業(yè)機械中國IT產(chǎn)經(jīng)新聞網(wǎng) 高低溫試驗箱

?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><label id="eoqoe"></label></wbr>