新型語(yǔ)音識別電路AP7003及其應用
摘要:介紹了新型、低成本語(yǔ)音識別電路AP7003的性能、引腳、指令等內容,并給出了應用電路原理圖及詳細的應用方法。
本文引用地址:http://dyxdggzs.com/article/226453.htm關(guān)鍵詞:語(yǔ)音識別 鍵盤(pán)控制 CPU控制 存儲體
1 AP7003簡(jiǎn)介
AP7003是一款新型、低成本語(yǔ)音識別專(zhuān)用集成電路,內置有麥克風(fēng)放大器、A/D轉換器、語(yǔ)音處理器和I/O控制器,經(jīng)預處理后可識別12組不同的字詞,每組1.5秒時(shí)長(cháng),可連詞或單詞識別。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號,且最有高度的I/O可編程性,使用簡(jiǎn)單方便,可廣泛應用于玩具、識別轉控、自動(dòng)答錄等領(lǐng)域。
AP7003的功能框圖如圖1所示。其主要特性如下:
·內置麥克風(fēng)放大器;
·內置A/D轉換器;
·DIP40雙列直插式封裝;
·識別12組1.5秒時(shí)長(cháng)字詞;
·I/O口具有2個(gè)普通輸入、4個(gè)觸發(fā)輸入、2個(gè)輸出口(分別有4個(gè)和12個(gè)輸出)、2個(gè)LED驅動(dòng);
·指令優(yōu)化以方便用戶(hù)使用;
·2.4V-4.5V工作電壓,且具備低功耗模式。
2 AP7003功能說(shuō)明
AP7003具有兩種工作模式,即錄音模式和識別模式。在使用識別模式之前,應先將目標錄入芯片內。AP7003內有12狐假虎威存儲體用于存儲12組不同的字句,每個(gè)存儲體可存儲1.5秒時(shí)長(cháng)的字詞,可通過(guò)鍵盤(pán)或按程序編制的順序選擇存儲體錄入及存放目標詞。語(yǔ)音可通過(guò)外部麥克風(fēng)或其它媒體錄入芯片內,經(jīng)內部處理后以不同的數字持片信號保存于存儲體中。
目標詞錄入芯片內后即可將工作模式轉換到識別模式,工作時(shí)芯片將當前語(yǔ)音與事先已錄入存儲體的目標詞語(yǔ)音相比較,如果有語(yǔ)音特征相匹配,則在芯片的相應輸出端口輸出高電平或低電平。需要時(shí)間以將芯片編程為省電模式以節省電能,當有按鍵信號時(shí)芯片將被喚醒。
AP7003采用DIP40封裝,引腳功能如表1所示,其典型應用電路如圖2所示。
表1 AP7003引腳功能說(shuō)明
引腳號 | 引腳名稱(chēng) | 功能說(shuō)明 |
1 2 3 4 8~5 12~9 13 14 15 17、18 19 20 21 22 23 24 26 27 28 29~40 16、25 | PORES GNDD LED1 LED2 POB1~POB4 PIT1~PIT4 VDDD CAPV OSC1 PIM1、PIM2 TEST POSL GNDA TREF A2OUT A1IN A1OUT MICP VDDA POA1~POA12 NC | 清除A輸出口(POA)輸出狀態(tài),高有效) 數字地 驅動(dòng)LED,低有效,可編程用于指示語(yǔ)音錄音的狀態(tài) 驅動(dòng)LED,低有效,可編程用于指示語(yǔ)音識別的結果 B輸出口,可編程用于鍵盤(pán)驅動(dòng) 低脈沖觸發(fā)輸入,內部有上拉電阻,可編程用于鍵盤(pán)輸入 數字電源 通過(guò)電容接地,對內部電壓進(jìn)行濾波 振蕩頻率控制,通過(guò)56kΩ電阻接地 普通輸入引腳,可編程用于芯片工作模式控制:PIM1=1時(shí),芯片具有識別功能;PIM2=1時(shí),A端口可以輸出。反之不能進(jìn)行識別或A端口不能輸出 測試端,芯片出廠(chǎng)時(shí)測試用 對A輸出口有效電平進(jìn)行選擇:高時(shí)A口高有效;低時(shí)A口低有效 模擬地 語(yǔ)音輸入門(mén)限控制端 第二級放大器輸出端 第一級放大器負輸入端 第一級放大器輸出端 電子麥克風(fēng)電源供應端 模擬電源 A輸出口,可編程用于語(yǔ)音錄入/語(yǔ)音識別對的存儲體指示 未用引腳 |
3 AP7003-01的應用
AP7003-01可通過(guò)串行口與微控制器連接,應用圖如圖3所示。AP7003-01共有22個(gè)輸入指令和15個(gè)輸出指令,如表2所示。AP7003-01工作時(shí)序及時(shí)間定義如圖4所示。
表2 AP70001指令與代碼
輸 入 | 輸 出 | ||||||
指令 | 代碼 | 指令 | 代碼 | 指令 | 代碼 | 指令 | 代碼 |
Store Word1 Store Word2 Store Word3 Store Word4 Store Word5 Store Word6 Store Word7 Store Word8 Store Word9 Store Word10 Store Word11 | 01H | Store Word12 Store Flag Clear Word Set R_Level 1 Set R_Level 2 Set R_Level 3 Set R_Level 4 Set R_Mode 1 Set R_Mode 2 Clear Outputs Shut Down | 0CH | Match Word1 Match Word2 Match Word3 Match Word4 Match Word5 Match Word6 Match Word7 Match Word8 Match Word9 Match Word10 Match Word11 | 01H | Match Word12 Done No Match Word Data In Error | 0CH |
系統上電后必須先給AP7003-01發(fā)清除指令Clear Word以清除12個(gè)存儲體內的內容,然后發(fā)出一個(gè)存儲指令(Store Word1~Store Word12之一)將目標詞錄入芯片相應的存儲體內。當LED1有效時(shí),表示芯片準備好錄入目標詞。通過(guò)指令Set R_Mode1或Set R_Mode2可選擇兩種識別模式:Set R_Mode1為單詞識別模式,該模式下識別操作完成后,芯片進(jìn)入省電狀態(tài)以等待表的指令;Set R_Mode2為連詞識別模式,該模式下識別操作完成后芯片返回語(yǔ)音錄入狀態(tài)。
進(jìn)入語(yǔ)音識別狀態(tài)前必須通過(guò)指令Set R_Level1~Set R_Level4設置識別時(shí)要示訴匹配度,Set R_Level4要求匹配程序最高,而Set R_Level1最低,可以根據經(jīng)驗設定為中間某一個(gè)值。跟在一個(gè)Store Word1~12指令之后的Store Flag指令將前面錄入的語(yǔ)音存入指定的存儲體以作為目標詞。Clear Outputs指令用于清除A端口輸出狀態(tài)(POA1~POA12).Shut Down指令將芯片轉入關(guān)閉模式以節省電能。
當數據格式或時(shí)序出現在串行數據(SERIAL DATA)輸入口PIT3、PIT2、PIT1時(shí),芯片將發(fā)送錯誤代碼到串行數據輸出口POB4,同時(shí)將數據、時(shí)鐘發(fā)送到串行數據輸出口POB2、POB3。
指令Stroe Word1~12、Store Flag、Clear Word、Set R_Level1~4和Clear Outputs執行完成后,芯片將輸出一個(gè)Done代碼。芯片每次執行完語(yǔ)音識別后,輸出一個(gè)匹配指示代碼(Match Word1~Match Word12或NO Match)。當有一個(gè)語(yǔ)音匹配時(shí),LED2有效,如果PIM2被拉高(端口A(yíng)使能),則端口相應的引腳變?yōu)橛行?。如果PIM1引腳被拉底,芯片的語(yǔ)音識別功能被禁止。
4 AP7003-02的應用
AP7..3-02可以單獨使用,無(wú)需控制器,適合于用鍵盤(pán)直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤(pán)操作模式,如圖5所示。各鍵及其功能見(jiàn)表3(a)、(b)。
上電后POB1~POB4均被置成低電平。當有鍵按下后,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤(pán)掃描信號,掃描信號為16ms低脈沖加64ms間隔,且循環(huán)進(jìn)行,按鍵信號從PIT1~PIT4輸入芯片。鍵盤(pán)陣列如表3(c)所示。
在識別模式初始狀態(tài),只有LED1是有效的。識別完成后,如果沒(méi)有詞相匹配,LED1閃爍3秒鐘后回到識別模式初始狀態(tài);如果有詞相匹配,LED2有效,與匹配詞所在存儲體相對應的POA輸出端口也有效。如果芯片被設置成自動(dòng)模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識別模式初始狀態(tài)。當PIM2=0時(shí),如果連接8分鐘沒(méi)有語(yǔ)音輸入芯片,將自動(dòng)進(jìn)入省電模式。
5 應注意的問(wèn)題
(1)語(yǔ)音識別電路對外部麥克風(fēng)(MIC)的分貝值有一定的要求。使用經(jīng)驗表明,本語(yǔ)音識別電路中選用56dB的麥克風(fēng)可達到最佳效果。
(2)語(yǔ)音識別前設置的匹配度是一個(gè)影響識別率高低的重要因素,在實(shí)驗過(guò)程中需要根據使用環(huán)境、使用要求等情況多次實(shí)驗才能確定最佳值。
(3)AP7003的工作電壓為2.4V~4.5V。對于3V的應用系統,可直接使用;如果您的應用系統是5V工作電壓,建議通過(guò)一個(gè)二極管給AP7003供電,以保證系統長(cháng)期穩定可靠地工作,也有利于降低系統功耗。
表3(a)AP7003-02鍵盤(pán)模式
Mode Key NO. | 8Key(PIM1=0) | 12Key(PIM1=1) |
1 | Store Word Word Up Word Down Set R_Level 1 Set R_Level 2 Set R_Level 3 Clear Output Shut Down N.A. N.A. N.A. N.A. Store Word Clear Word | Store Word1 Store Word2 Store Word3 Store Word4 Store Word5 Store Word6 Store Word7 Store Word8 Set R_Level 1 Set R_Level 2 Clear Output Shut Down N.A. Clear Word |
表3(b)AP7003-02按鍵功能
鍵 名 | 功 能 說(shuō) 明 |
Clear Word Store Word Store Word1~8 Word Up Word Down Set R_Level1~3 Clear Output Shut Down | 清除12個(gè)存儲體內容,之后進(jìn)入存儲目標詞1(Store SWord1)狀態(tài) 選擇當前存儲體存儲錄入的語(yǔ)音 選擇12個(gè)存儲體中的一個(gè)以存儲錄入的語(yǔ)音 選擇后個(gè)存儲體以存儲錄入的語(yǔ)音;存儲體12的“后一個(gè)”是存儲體1 選擇前一個(gè)存儲體以存儲錄入的語(yǔ)音;存儲體1的“前一個(gè)”仍是存儲1 設置語(yǔ)音識別的匹配度,之后進(jìn)入語(yǔ)音識別初始狀態(tài) 清除POA1~POA12和LED2狀態(tài),之后進(jìn)入語(yǔ)音識別初始狀態(tài) 將芯片轉入省電模式 |
表3(c) AP7003-02鍵盤(pán)陣列
POB1 | POB2 | POB3 | POB4 | |
PIT1 | KEY1 | KEY2 | KEY3 | KEY4 |
PIT2 | KEY5 | KEY6 | KEY7 | KEY8 |
PIT3 | KEY9 | KEY10 | KEY11 | KEY12 |
應用表明,AP7003使用簡(jiǎn)單方便,具有較高的識別率,一般可達80%以上,是一款較好的語(yǔ)音識別芯片。
評論