基于DSP嵌入式說(shuō)話(huà)人識別系統的設計

作者：時(shí)間：2012-03-21 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

0 引言

本文引用地址：http://dyxdggzs.com/article/257627.htm

說(shuō)話(huà)人身份識別屬于生物認證技術(shù)的一種，是一項根據語(yǔ)音中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數來(lái)自動(dòng)識別說(shuō)話(huà)人身份的技術(shù)。近年來(lái)，說(shuō)話(huà)人身份識別以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到矚目，在信息安全等領(lǐng)域的應用逐漸增大，并成為人們日常生活和工作中重要且普及的安全驗證方式。目前，說(shuō)話(huà)人身份識別在理論上和實(shí)驗室條件下已經(jīng)達到了比較高的識別精度，并開(kāi)始走向實(shí)際應用階段。ATT、歐洲電信聯(lián)盟、ITT、Keyware、T-NETIX，Motorola和Vi-sa等公司相繼開(kāi)展了相關(guān)實(shí)用化研究，國內這方面研究主要在中科聲學(xué)所，中科院自動(dòng)化所，清華大學(xué)等研究所和大學(xué)中進(jìn)行。

基于嵌入式的說(shuō)話(huà)人身份識別系統具有高精度，適時(shí)性好，低功耗，低費用，體積小等優(yōu)勢，逐漸成為說(shuō)話(huà)人身份識別面向實(shí)際應用的新熱點(diǎn)。而隨著(zhù)DSP新技術(shù)的發(fā)展，DSP芯片無(wú)論在處理速度、精度、功耗或者體積等方面都取得了突破性的進(jìn)展。DSP也越來(lái)越多的應用于說(shuō)話(huà)人身份識別。但目前這方面研究主要局限于小數據量、與PC機配套使用上，沒(méi)有太大的實(shí)用價(jià)值。在此介紹一種基于TMS320C6713 DSP芯片設計的嵌入式，10個(gè)人范圍的說(shuō)話(huà)人身份識別系統。該系統可以自舉運行，并可靈活的選擇訓練、識別或者更換訓練者、識別者，識別率達98％以上。

1 系統的架構及硬件構成

系統總體實(shí)現流程如圖1所示。系統主要分為訓練和識別兩部分，系統初始化后由操作者控制訓練或識別。訓練目的是提取說(shuō)話(huà)人模型參數并將其存儲在FLASH ROM中。識別目的是讀取待識別者語(yǔ)音信息并將獲得的模型參數與訓練的模型參數比較，從而獲得識別結果。

1．1 系統的主要硬件構成

系統硬件構成如圖2所示，主要包含語(yǔ)音采集模塊、數據處理模塊(DSP)、程序數據存儲及自舉FLASH模塊、數據存儲器RAM模塊、系統時(shí)序邏輯控制CPLD模塊、JTAG接口模塊。

語(yǔ)音采集模塊主要由TLV320AIC23音頻編解碼器來(lái)完成，該芯片是TI公司的一款高性能的立體聲音頻Codec芯片，內置放大器，輸入／輸出增益可編程設置。模數，數／模轉換集成在一塊芯片中。采樣率8～96 kHz可編程實(shí)現。另外還具有低功耗，連接電路簡(jiǎn)單，性?xún)r(jià)比高的特點(diǎn)。

語(yǔ)音處理DSP采用TI公司的TMS320C6713芯片，該芯片實(shí)現浮點(diǎn)運算，最高時(shí)鐘頻率225 MHz，使用該芯片外部存儲器接口可實(shí)現對外部存儲器(SDRAM)數據傳輸和程序存儲器(FLASH ROM)進(jìn)行程序讀寫(xiě)；依靠JTAG接口電路通過(guò)仿真器進(jìn)行仿真調試，實(shí)現與主機數據交換；通過(guò)片內外設McBSP完成串行數據的接收和發(fā)送，實(shí)現對音頻處理模塊的控制等工作。

FLASH ROM最大可提供512 KB空間，通常為前256 KB可用。SDRAM最大容量為16 MB，為該系統提供較大的數據存儲空間。CPLD為存儲器的擴展實(shí)現邏輯編碼。電源為T(mén)PS54310芯片，可為系統提供3．3 V和1．26 V兩種電壓。

linux操作系統文章專(zhuān)題:linux操作系統詳解（linux不再難懂）

上一頁(yè) 1 2 3 4 5 下一頁(yè)

新聞中心

基于DSP嵌入式說(shuō)話(huà)人識別系統的設計

評論

相關(guān)推薦

技術(shù)專(zhuān)區