基于A(yíng)RM的實(shí)時(shí)語(yǔ)音識別系統在家庭監護機器人的實(shí)現

作者：時(shí)間：2013-05-29 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

語(yǔ)音是人類(lèi)最常用的交流方式，也是人類(lèi)和計算機交流最渴望的方式。因此用語(yǔ)音同計算機交流也成為了最近研究的熱點(diǎn)，計算機對語(yǔ)音的理解是計算機科學(xué)中的一個(gè)引人人勝的、富有挑戰性的課題。

進(jìn)入90年代，隨著(zhù)多媒體時(shí)代的來(lái)臨，迫切要求語(yǔ)音識別系統從實(shí)驗室走向實(shí)用。許多發(fā)達國家如美國、日本、韓國以及IBM、Apple、ATT、NTT等著(zhù)名公司都為語(yǔ)音識別系統的實(shí)用化開(kāi)發(fā)研究投以巨資。IBM公司于1997年開(kāi)發(fā)出漢語(yǔ)ViaVoice語(yǔ)音識別系統，次年又開(kāi)發(fā)出可以識別上海話(huà)、廣東話(huà)和四川話(huà)等地方口音的語(yǔ)音識別系統ViaVoice’98。目前市場(chǎng)上已經(jīng)出現了語(yǔ)音識別電話(huà)、語(yǔ)音識別記事本等產(chǎn)品，如美國VPTC公司的Voice Organizer和法國的Parrot等。

我國語(yǔ)音識別研究工作開(kāi)始的較晚，但近年來(lái)發(fā)展得很快，一直緊跟國際水平，國家也很重視，并把大詞匯量語(yǔ)音識別的研究列入“8 63”計劃，由中科院聲學(xué)所、自動(dòng)化所、清華大學(xué)電子工程系及北京大學(xué)等單位研究開(kāi)發(fā)，取得了高水平的科研成果，如中科院自動(dòng)化所研制的非特定人、連續語(yǔ)音聽(tīng)寫(xiě)系統和漢語(yǔ)語(yǔ)音人機對話(huà)系統，其字準確率或系統響應率可達90％以上。鑒于中國未來(lái)龐大的市場(chǎng)，國外也非常重視漢語(yǔ)語(yǔ)音識別的研究。美國、新加坡等地聚集了一批來(lái)自大陸、臺灣、香港等地的學(xué)者，研究成果已達到相當高水平。

1 系統設計

文中是家庭監護機器人項目中的語(yǔ)音識別系統設計部分，設計目的是設計出一種可以識別語(yǔ)音的、協(xié)助監護家庭行動(dòng)不方便人員的機器人。為實(shí)現該語(yǔ)音識別系統，設計了語(yǔ)音識別系統總體結構框圖，如圖1所示。

1．1 硬件設計

文中所研究和設計的功能，都是應用在移動(dòng)機器人上的。因而系統的研究設計需要考慮到體積小、省電、便于移動(dòng)的特性，并需具有便于家庭用戶(hù)操作的友好顯示界面。對于語(yǔ)音識別部分，需要用到用于語(yǔ)音識別算法處理的處理器、語(yǔ)音采集電路和語(yǔ)音輸出電路，如圖2所示。其中語(yǔ)音識別算法運算的處理器主要負責算法的運算處理，相當于機器人的大腦；語(yǔ)音采集電路負責采集外部的聲音信號，相當于機器人的耳朵；語(yǔ)音輸出電路負責輸出話(huà)語(yǔ)聲音，相當于機器人的嘴巴。

1)語(yǔ)音識別算法處理器選擇

根據系統設計功能的要求，目前常用的語(yǔ)音識別芯片種類(lèi)一般有：?jiǎn)纹瑱C(MCU)、DSP和SoC(System on Circuit)?？紤]到普通單片機(MCU)資源的緊缺及運行速度較慢的缺點(diǎn)，因而在本系統設計將不考慮使用單片機(MCU)作為語(yǔ)音識別的處理器。DSP包含用作數字信號處理的專(zhuān)用部件，運算能力強、精度高，但目前DSP的價(jià)格比較高，同時(shí)考慮到本系統的特性，需要選擇一種既有較強的運算能力，合適于語(yǔ)音識別的功能，并且能實(shí)現較好的用戶(hù)操作界面，并帶有文件系統(用于識別地圖)的功能，因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530，它具有雙內核ARM CortexTM-A8的內核和TMS320C64+TM DSP內核，屬于高性能的OMAP35x架構系列產(chǎn)品，滿(mǎn)足了系統設計的各種功能特性要求。

c++相關(guān)文章:c++教程

上一頁(yè) 1 2 3 下一頁(yè)

新聞中心

基于A(yíng)RM的實(shí)時(shí)語(yǔ)音識別系統在家庭監護機器人的實(shí)現

評論

相關(guān)推薦

技術(shù)專(zhuān)區