<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > LD3320嵌入式語(yǔ)音識別系統應用

LD3320嵌入式語(yǔ)音識別系統應用

作者：時(shí)間：2016-09-12 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

1 概述

本文引用地址：http://dyxdggzs.com/article/201609/303656.htm

語(yǔ)音交互系統是比較人性化的人機操作界面，它需要語(yǔ)音識別系統的支持。LD3320就是這樣一款語(yǔ)音識別芯片。介紹了該芯片的工作原理及應用，給出了LD3320與微處理器的硬件接口電路及軟件程序。隨著(zhù)高檔MCU的不斷出現，以MCU為核心的嵌入式語(yǔ)音交互系統會(huì )有非常好的應用前景。

2 特定人語(yǔ)音識別技術(shù)及原理

特定人語(yǔ)音識別(ASR,Auto Speech RecognitiON)技術(shù)是基于關(guān)鍵詞語(yǔ)列表的識別技術(shù)，它是對大量的語(yǔ)音數據(相當于對數千人采集的數萬(wàn)小時(shí)的有效聲音數據)經(jīng)語(yǔ)言學(xué)家語(yǔ)音模型分析，建立數學(xué)模型，并經(jīng)過(guò)反復訓練提取基元語(yǔ)音的細節特征，以及提取各基元間的特征差異，得到在統計概率最優(yōu)化意義上的各個(gè)基元語(yǔ)音特征，最后才由資深工程師將算法以及語(yǔ)音模型轉換成硬件芯片并應用在嵌入式系統中。

ASR技術(shù)每次識別的過(guò)程就是把用戶(hù)說(shuō)出的語(yǔ)音內容，通過(guò)頻譜轉換為語(yǔ)音特征，再將這個(gè)轉換后的語(yǔ)音特征和關(guān)鍵詞語(yǔ)列表中的條目一一進(jìn)行匹配，最優(yōu)匹配的一條即作為識別結果。比如ASR技術(shù)在語(yǔ)音控制的手機應用中，這個(gè)關(guān)鍵詞語(yǔ)列表的內容就是電話(huà)本中的人名、手機的菜單命令或手機存儲卡中的歌曲名字。不論這個(gè)列表的條目?jì)热菔鞘裁?，只需要用?hù)設置相關(guān)的寄存器，就可以把相應的待識別條目?jì)热菀宰址问絺鬟f給識別引擎。

由此可見(jiàn)，語(yǔ)音識別芯片完成的工作就是：把MIC(麥克風(fēng))輸入的聲音進(jìn)行頻譜分析后提取語(yǔ)音特征，再和關(guān)鍵詞語(yǔ)列表中的關(guān)鍵詞語(yǔ)進(jìn)行對比匹配，最后找出得分最高的關(guān)鍵詞語(yǔ)作為識別結果輸出。

通?；贏(yíng)SR技術(shù)的語(yǔ)音識別芯片能在兩種情況下給出識別結果：

①外部送入預定時(shí)間的語(yǔ)音數據(比如5 s的語(yǔ)音數據)，芯片對這些語(yǔ)音數據運算分析后，給出識別結果。

②外部送入語(yǔ)音數據流，語(yǔ)音識別芯片通過(guò)端點(diǎn)檢測(VAD,Voice Activity Detection)技術(shù)檢測出用戶(hù)停止說(shuō)話(huà)，把用戶(hù)開(kāi)始說(shuō)話(huà)到停止說(shuō)話(huà)之間的語(yǔ)音數據進(jìn)行運算分析后，給出識別結果。

對于第一種情況，可以理解為設定了一個(gè)定時(shí)錄音(如5 s的語(yǔ)音數據)，芯片在5 s后會(huì )停止把聲音送入識別引擎，并且根據已送入引擎的語(yǔ)音數據計算出識別結果。

對于第二種情況，需要了解VAD的工作原理：VAD技術(shù)是在一段語(yǔ)音數據流中，判斷出哪個(gè)時(shí)間點(diǎn)是人聲音的開(kāi)始，哪個(gè)時(shí)間點(diǎn)是人聲音的結束。判斷的依據是，在背景聲音的基礎上有了語(yǔ)音發(fā)音，則視為聲音的開(kāi)始。而后，檢測到一段持續時(shí)間的背景音(比如600 ms)，則視為人聲說(shuō)話(huà)結束。通過(guò)VAD判斷出人聲說(shuō)話(huà)的區域后，語(yǔ)音識別芯片會(huì )把這期間的聲音數據進(jìn)行識別處理，計算出識別結果。

除了以上兩種情況外，語(yǔ)音識別算法無(wú)法主動(dòng)地判斷出是否識別出了一個(gè)結果。這是因為，在計算過(guò)程中的任何時(shí)刻，語(yǔ)音識別器都會(huì )對已送人識別芯片的聲音數據進(jìn)行分析，并根據匹配程度為識別列表中的關(guān)鍵詞語(yǔ)進(jìn)行打分，最匹配的打分最高。但是，由于識別算法不知道用戶(hù)后面是否還繼續說(shuō)話(huà)，所以無(wú)法主動(dòng)地判斷已經(jīng)識別出的結果。

3 語(yǔ)音識別芯片LD3320的工作原理

3.1 語(yǔ)音識別系統原理結構

LD3320語(yǔ)音識別芯片采用的就是ASR技術(shù)，圖1就是由LD3320和單片機(或嵌入式系統)組成的語(yǔ)音識別系統原理框圖。圖中給出了LD3320的內部原理結構，本文中選用的MCU是STC10L08XE單片機。

圖1 語(yǔ)音識別系統原理框圖

語(yǔ)音識別芯片LD3320是ICRoute公司的產(chǎn)品，它采用ASR技術(shù)，提供了一種脫離按鍵、鍵盤(pán)、鼠標、觸摸屏等GUI操作方式且基于語(yǔ)音的用戶(hù)界面VUI(Voice User Interface)，使得用戶(hù)對該系統的操作更簡(jiǎn)單、快速和自然。

用戶(hù)只需要把識別的關(guān)鍵詞語(yǔ)以字符串的形式傳送進(jìn)芯片，即可以在下次識別中立即生效。比如，用戶(hù)在51等主控MCU的編程中，簡(jiǎn)單地通過(guò)設置芯片的寄存器，把諸如你好這樣的識別關(guān)鍵詞語(yǔ)的內容動(dòng)態(tài)地傳入芯片中，芯片就可以識別所設定的關(guān)鍵詞語(yǔ)了。每個(gè)關(guān)鍵詞語(yǔ)可以是單字、詞組、短句或者任何的中文發(fā)音的組合?；贚D3320的語(yǔ)音識別系統可以隨著(zhù)使用流程，在運行時(shí)動(dòng)態(tài)地更改關(guān)鍵詞語(yǔ)列表的內容，這樣可以用一個(gè)系統支持多種不同的場(chǎng)景，同時(shí)也不需要用戶(hù)作任何的錄音訓練。

3.2 LD3320的用戶(hù)使用模式

LD3320有兩種用戶(hù)使用模式，即觸發(fā)識別模式和循環(huán)識別模式.用戶(hù)可以通過(guò)編程，設置兩種不同的用戶(hù)使用模式。

觸發(fā)識別模式：系統的主控MCU在接收到外界一個(gè)觸發(fā)后(比如用戶(hù)按動(dòng)某個(gè)按鍵)，啟動(dòng)LD3320芯片的一個(gè)定時(shí)識別過(guò)程(比如5 s)，要求用戶(hù)在這個(gè)定時(shí)過(guò)程中說(shuō)出要識別的語(yǔ)音關(guān)鍵詞語(yǔ)。這個(gè)過(guò)程結束后，需要用戶(hù)再次觸發(fā)才能再次啟動(dòng)一個(gè)識別過(guò)程。

循環(huán)識別模式：系統的主控MCU反復啟動(dòng)識別過(guò)程。如果沒(méi)有人說(shuō)話(huà)就沒(méi)有識別結果，則每次識別過(guò)程的定時(shí)到時(shí)后再啟動(dòng)一個(gè)識別過(guò)程;如果有識別結果，則根據識別作相應處理后(比如播放某個(gè)聲音作為回答)再啟動(dòng)一個(gè)識別過(guò)程。

4 語(yǔ)音識別系統軟硬件設計

4.1 硬件系統設計

由圖l可知，由LD3320組成的語(yǔ)音識別系統硬件有單片機(或嵌入式系統)及LD33202.圖2和圖3分別是由單片機STC10L08XE構成的主控芯片和由LD3320A構成的語(yǔ)音識別主系統。

圖2 STC10L08XE構成的主控芯片

圖3 LD3320A構成的語(yǔ)音識別主系統

4.2 軟件系統設計

語(yǔ)音識別的操作順序是：先進(jìn)行語(yǔ)音識別的初始化，然后寫(xiě)入識別列表，系統即開(kāi)始進(jìn)行語(yǔ)音識別，并準備好中斷響應函數，打開(kāi)中斷允許位。這里如果不用中斷方式，也可以通過(guò)查詢(xún)方式工作。在開(kāi)始識別后，讀取寄存器B2H的值，如果為21H就表示有識別結果產(chǎn)生。

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： LD3320 語(yǔ)音識別 應用

評論

相關(guān)推薦

2002年嵌入式系統及其應用研討會(huì )暨多國產(chǎn)品展示會(huì )

jackwang | 2002-05-16

LM386典型應用電路

設計方案 LM386 典型應用電路 | 2009-07-06

微軟197億美元完成對Nuance的收購目標不止在于語(yǔ)音識別市場(chǎng)

微軟 Nuance 收購語(yǔ)音識別 | 2022-03-10

蘋(píng)果讓步：允許媒體類(lèi)應用繞過(guò)應用商店進(jìn)行第三方支付

手機與無(wú)線(xiàn)通信蘋(píng)果應用商店 | 2021-09-03

大聯(lián)大品佳集團推出基于MediaTek產(chǎn)品的亞馬遜智能物聯(lián)網(wǎng)語(yǔ)音識別方案

物聯(lián)網(wǎng)與傳感器大聯(lián)大品佳 MediaTek 亞馬遜語(yǔ)音識別 | 2022-09-08

基于LD3320的助老助殘智能語(yǔ)音機器人

視頻信息技術(shù)大賽單片機 LD3320 語(yǔ)音機器人 | 2012-12-26

瞬態(tài)電壓抑制二極管應用指南

資源下載 TVS器件瞬態(tài)電壓抑制二極管應用 | 2007-02-16

在農業(yè)經(jīng)濟結構調整中應用信息技術(shù)的實(shí)踐與認識

hpnet | 2002-05-25

人工智能在動(dòng)畫(huà)角色行為設計中的應用

智能計算 202307 人工智能動(dòng)畫(huà)角色行為設計應用 | 2023-07-29

JavaScript語(yǔ)音識別庫-Julius

視頻 JavaScript 語(yǔ)音識別 Julius | 2015-07-07

基于Infineon SoC藍牙CYW20835之智能遙控器方案

物聯(lián)網(wǎng)與傳感器英飛凌藍牙 BT 遙控器紅外信號傳感器語(yǔ)音識別 2.4g 語(yǔ)音遙控 cyw20835 | 2023-08-02

美光高性能內存與存儲，推動(dòng) AI 豐富殘障人士生活體驗

網(wǎng)絡(luò )與存儲語(yǔ)音識別生成式AI 機器學(xué)習內存 | 2023-12-07

實(shí)時(shí)數據庫系統及其特征(老站轉)

amine | 2002-05-27

AVR中文電子書(shū)-第七章AVR單片機的應用

資源下載 ATMEL 公司 AVR 單片機應用 | 2007-02-16

集成運放F007基本應用電路

設計方案集成運放基本應用電路 | 2009-07-06

人工智能技術(shù)在嵌入式開(kāi)發(fā)中的應用

嵌入式系統 202307 人工智能技術(shù) 嵌入式應用 | 2023-07-31

4 調用 Google 語(yǔ)音識別

視頻 Android Wear 圖靈機器人 Google 語(yǔ)音識別 | 2015-07-07

光電隔離器應用實(shí)例

設計方案光電隔離應用實(shí)例 | 2009-07-06

新一代語(yǔ)音識別：可徹底改變車(chē)內體驗的技術(shù)

汽車(chē)電子語(yǔ)音識別生物識別人工智能 | 2024-07-18

LoRa專(zhuān)著(zhù)問(wèn)世，促進(jìn)LoRa遍地開(kāi)花

手機與無(wú)線(xiàn)通信 LoRa 應用 | 2021-08-09

步進(jìn)電機小知識

資源下載步進(jìn)電機電機驅動(dòng) 應用 | 2007-12-16

μC/OS的應用和擴展

amine | 2002-05-23

TA7240AP應用電路

設計方案 TA7240AP 應用電路 | 2009-07-06

語(yǔ)音模組重啟及聲音輸出異常淺析

消費電子 202106 智能家居語(yǔ)音識別可靠性 | 2021-07-12

LM324四運放的應用

資源下載四運放集成電路 LM324 應用 | 2007-02-16

MCS-51單片機主要應用特性

資源下載單片機 MCS-51 應用 | 2007-02-16

DSP虛擬I2C總線(xiàn)軟件包的設計及應用實(shí)例

hpnet | 2002-05-17

智能語(yǔ)音翻譯機

視頻信息技術(shù)大賽單片機 STC15F2K61S2 語(yǔ)音芯片 LD3320 | 2013-01-14

達林頓管的典型應用電路

設計方案達林頓典型應用電路 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>