語(yǔ)音識別電路設計圖集錦 —電路圖天天讀(71)
TOP1 語(yǔ)音識別控制家用電器系統電路
本文引用地址:http://dyxdggzs.com/article/201710/369387.htm語(yǔ)音識別技術(shù)是近年來(lái)十分活躍的研究領(lǐng)域。語(yǔ)音識別系統的實(shí)用化研究是語(yǔ)音識別研究的一個(gè)主要方向。以玩具市場(chǎng)為例,具有高科技含量的電子玩具、智能玩具發(fā)展迅猛,電子互動(dòng)式、智能化玩具已經(jīng)成為玩具行業(yè)發(fā)展的主流。我國是玩具生產(chǎn)和出口大國,但在高科技玩具的發(fā)展方面和國外的差距很大,因此,及時(shí)投入精力廣泛開(kāi)展這方面的研究,無(wú)論對技術(shù)創(chuàng )新應用,還是社會(huì )經(jīng)濟發(fā)展,都有巨大的現實(shí)意義。與機器進(jìn)行語(yǔ)音交流,讓機器明白你說(shuō)什么,這是人們長(cháng)期以來(lái)夢(mèng)寐以求的事情。語(yǔ)音識別技術(shù)就是讓機器通過(guò)識別和理解過(guò)程把語(yǔ)音信號轉變?yōu)橄鄳奈谋净蛎畹母呒夹g(shù)。近二十年來(lái),語(yǔ)音識別技術(shù)取得顯著(zhù)進(jìn)步,開(kāi)始從實(shí)驗室走向市場(chǎng)。語(yǔ)音識別功能大大增加了玩具使用的樂(lè )趣,并使玩具體現出一定的智能性,因此成為大部分電子玩具、智能玩具設計中使用的關(guān)鍵技術(shù)。
語(yǔ)音模塊
語(yǔ)音輸出電路如圖所示,其中VDDH為參考電壓,VSS是系統的模擬地。音頻信號由SPCE061A 的DAC引腳輸出送到電路的J4端,通過(guò)音量電位器R9的調節端送到集成音頻功率放大器SPY0030,經(jīng)音頻放大后,音頻信號從SPY0030輸出經(jīng) J2 端口外接揚聲器播放聲音。 SPCE061A內置2路10位精度的DAC,只需要外接功放電路即可完成語(yǔ)音的播放。圖中的SPY0030是凌陽(yáng)的一款音頻放大芯片,可以工作在 2.4~6V范圍內,最大輸出功率可達700mW。 J5 都是語(yǔ)音輸出接口,;是兩針的插針外接喇叭,由DAC 輸出引腳經(jīng)語(yǔ)音集成。
放大器SPY0030 放大,然后輸出。SPY0030 是音頻功率放大器。因為聲音是不同振幅和不同頻率的波,即交流信號電流,三極管的集電極電流永遠是基極電流的β倍,β是三極管的交流放大倍數,應用這一點(diǎn),若將小信號注入基極,則集電極流過(guò)的電流會(huì )等于基極電流的β倍,然后將這個(gè)信號用隔直電容隔離出來(lái),就得到了電流(或電壓)是原先的β倍的大信號,這現象稱(chēng)為三極管的放大作用。經(jīng)過(guò)電流與電壓的共同放大,就完成了功率放大。R14為可調電阻,當調節阻值大小事,即調節了基極的輸入信號,最終影響的就是輸出信號即語(yǔ)音輸出音量的大小。SPY0030的放大倍數固定為20倍。
語(yǔ)音輸入電路如圖所示,其中VMC提供傳聲器的電源,AVSS1是系統的模擬地,VCM為參考電壓,1腳和2腳分別是傳聲器X1的正極、負極的輸入引腳,連接SPCE061A的MICP、NICN管腳上。當對著(zhù)傳聲器講話(huà)時(shí),1腳和2腳將隨著(zhù)傳聲器輸入的聲音產(chǎn)生變化的波形,并在SPCE061A的兩個(gè)端口處形成兩路反相的波形,送到SPCE061A 控制器內部的運算放大器進(jìn)行音頻放大,經(jīng)過(guò)放大的音頻信號,通過(guò)ADC轉化器轉化為數字量,保存到相應的寄存器中。 SPCE061A的A/D轉換器有8個(gè)通道,其中有1個(gè)通道是MIC-NI輸入,它專(zhuān)門(mén)用于對語(yǔ)音信號進(jìn)行采樣。語(yǔ)音信號經(jīng)過(guò)MCI轉換成電信號,然后輸入至SPCE061A內部前置放大器。由于人們說(shuō)話(huà)時(shí),麥克風(fēng)距離嘴邊的距離不同,語(yǔ)音信號的能量將會(huì )有很大的差異,此時(shí),如果芯片的的輸入信號太大或是太小都將影響識別的精度。而SPCE06lA內部就帶有自動(dòng)增益控制電路AGC能隨時(shí)跟蹤、監視前置放大器輸出的音頻信號電平,當輸入信號增大時(shí)AGC電路自動(dòng)減小放大器的增益;當輸入信號減小時(shí),AGC電路自動(dòng)增大放大器的增益,從而以補償太小或是太大的信號,以便使進(jìn)入戶(hù)A/D的信號保持在最佳電平,又可使削波減至最小。 SPCE061A芯片中已經(jīng)集成了音頻輸入專(zhuān)用ADC以及AGC放大電路,因為此芯片外部的電路比較簡(jiǎn)單。
MICP和MICN將隨著(zhù)MIC產(chǎn)生的波形變化,并在兩個(gè)端口處形成兩路反相波形,在經(jīng)過(guò)兩級運放放大,把放大的語(yǔ)音信號交給ADC轉換為數字量,這時(shí)就可以通過(guò)單片機編程對這些數據進(jìn)行處理,進(jìn)行語(yǔ)音處理識別等功能。 正如我們在前面介紹的61 板具有強大的語(yǔ)音處理功能,如圖3-8所示,X1 是語(yǔ)音的MIC 輸入端,帶自動(dòng)增益(AGC)控制。
SPR4096外擴Flash模塊
在本系統中,當我們對系統進(jìn)行訓練、識別、操作時(shí),有一些語(yǔ)音提示,由于SPCE061A內部只有32k字的flash空間,除了一部分空間作為程序的存儲之后,剩下的用來(lái)存儲語(yǔ)音數據時(shí)遠遠不夠的,于是系統外擴了flash。SPR4096與SPCE061A的連接方式為:SCK與SPCE061A的 IOB0接,SDA與SPCE061A的IOB1口接。SPR4096按串行接口模式工作,要把CF2~CF0均接高電平。CF7為低電平時(shí)選中 FLASH,高電平時(shí)選中SRAM。 SPR4096是一個(gè)高性能的4M-bit(512&TImes;8-bit)FLASH,分為256個(gè)扇區。每個(gè)扇區2Kbyte。SPR4096還內置了以個(gè) 4K&TImes;8bit的SRAM。在進(jìn)行FLASH的編程/擦除時(shí),可以并發(fā)執行SRAM的讀/寫(xiě)。SPR4096內置了一個(gè)總線(xiàn)存儲器接口和一個(gè)串行接口,它允許單片機通過(guò)8-bit并行模式或者1-bit的串行模式訪(fǎng)問(wèn)FLASH/SRAM存儲區。 SPR4096串行接口的工作頻率可達到5MHz。SPR4096有兩個(gè)電源輸入端VDDI和VDDQ。VDDI是給內部FLASH和控制邏輯供電的;VDDQ是專(zhuān)門(mén)為I/O供電的。
供電電壓VDDQ:2.25V~3.6V。SPR4096最大讀電流為2mA,最大編程/擦除電流為6 mA 。SPR4096模塊包括總線(xiàn)存儲接口,串行接口,SRAM,編程與擦除控制器和一個(gè)4M的FLASH。選擇串行接口時(shí),SCLK作為時(shí)鐘信號線(xiàn),SDA 作為1-bit的數據線(xiàn)。如果接收到FLASH的讀指令或者SRAM的讀/寫(xiě)指令,串口會(huì )把這些指令傳給編程和擦除控制器,讓編程和擦除控制器去完成相應操作。 串行接口模式的選中是通過(guò)CF2~CF0來(lái)實(shí)現的。當CF2~CF0均接高電平時(shí),選中的就是串行接口模式,在串行接口模式下,CF7為低電平時(shí)選中 FLASH,高電平時(shí)選中SRAM。該芯片有SIF(Serial Interface)和BMI(Busmenory Interface)兩種工作方式,但DIP24只支持SIF方式。
全球電子測量技術(shù)與市場(chǎng)領(lǐng)導者——是德科技(原安捷倫電子測量事業(yè)部)UXM新品體驗會(huì )將于近期拉開(kāi)帷幕,歡迎各位業(yè)內人士踴躍參加,您的到來(lái),將是KEYSIGHT的最大榮幸!報名地址請點(diǎn)擊以下圖片進(jìn)入:
TOP2 語(yǔ)音識別機器人系統電路
系統電源電路設計
SPCE061A采用低電壓供電方式,這可以大大降低芯片的功率損耗。其中,SPCE06lA的電源分兩種,即內核電源(VDD)和I/O口電源(VDDH)。I/O口電源采用5V電壓,而內核電源則為3.3V或者更低。降低芯片內核電壓的目的主要還是降低芯片的功耗,同時(shí)也可以降低芯片的工作溫度,延長(cháng)芯片使用壽命。盡管這種語(yǔ)音芯片的工作電壓范圍很大,但是為了使芯片內核運行更加穩定,同時(shí)又保證I/O口及外部擴展部件的工作電壓要求,電源電路采用芯片7805和SPY0029分別提供5V和3.3V電壓完成對整個(gè)系統供電。 7805芯片電路中正常工作是,輸入、輸出電壓差為2~3V。電路中靠近引腳處接入電容C40、C41用來(lái)實(shí)現頻率補償,防止穩壓器產(chǎn)生高頻自激震蕩和抑制電路引入的高頻干擾,C39是電解電容,以減小穩壓電源輸出端由輸入電源引入的低頻干擾。
6是保護二級管,當輸入端短路時(shí),給輸出電容器C39一個(gè)放電通路,防止C39兩端電壓作用于調整管的be結,造成調整管be結擊穿而損壞。
控制與結果顯示電路
鍵盤(pán)模組可直接用排線(xiàn)與61單片機I/O口相連。1*8KEY 的8 列分別定義為COL1~COL8,1 行定義為ROW1。如圖3-11所示。 按鍵分別和SPCE061A的IOA0~IOA7相連,他們的作用分別為1個(gè)系統開(kāi)關(guān)鍵,1個(gè)系統復位鍵,1個(gè)單個(gè)命令訓練按鍵,1個(gè)所有語(yǔ)句循環(huán)訓練按鍵,剩余4個(gè)初步設定為L(cháng)CD功能控制按鍵。每個(gè)按鍵的按下與抬起都會(huì )送給IOA口一個(gè)電壓值,當按鍵按下使相應的IOA口得到一個(gè)高電壓。相反,則為低電壓。單片機則根據IO口的電壓值進(jìn)行相應的操作。
LED模組
利用LED顯示來(lái)測試是否達到控制電器目標。利用數碼管顯示數字的不同來(lái)模擬驗證是否能達到對家用電器的控制。 LED和LCD電路作為系統的顯示部分,以顯示當前的系統狀況及識別結果以便檢驗實(shí)驗結果和提示用戶(hù)進(jìn)行下一步操作。LCD部分在實(shí)驗階段可不接入。 計劃采用內置SPLC0501點(diǎn)陣式圖形液晶顯示模塊由液晶驅動(dòng)控制器SPLC501、LCD顯示器和外部設備的接口等幾部分組成,液晶驅動(dòng)控制器 SPLC501集行、列驅動(dòng)器、顯示數據存儲器(DDRAM,Display Data RAM)和控制器與一體,廣泛用于小規模液晶顯示模塊。內置SPLC501點(diǎn)陣式圖形液晶顯示模塊的管腳排列和SPEC061A接線(xiàn)方法如圖所示。
雖然實(shí)現了語(yǔ)音控制家用電器,但是總的來(lái)說(shuō)系統界面不是很友好。為此,我們可以充分利用計算機和通信技術(shù),并用VB等軟件開(kāi)發(fā)友好的管理界面,將數據和其他信息通過(guò)計算機統一進(jìn)行管理和控制。
語(yǔ)音識別機器人系統電路設計
目前制造業(yè)市場(chǎng)上,工業(yè)機器人具有相當大的市場(chǎng)潛力,要使工業(yè)機器人真正應用于生產(chǎn)線(xiàn)上的各個(gè)方面,滿(mǎn)足人們日益增長(cháng)的需求,就離不開(kāi)高性能的語(yǔ)音識別控制系統。隨著(zhù)計算機軟硬件技術(shù)、半導體技術(shù)、電子技術(shù)、通訊技術(shù)等的飛速發(fā)展人類(lèi)已經(jīng)進(jìn)入后PC時(shí)代。語(yǔ)音識別技術(shù)得到了迅猛發(fā)展, 支持語(yǔ)音識別的各種產(chǎn)品紛紛面世。人類(lèi)實(shí)現了語(yǔ)音命令控制空調、電視、燈光、自動(dòng)窗簾等的使用,讓人們的生活“隨音所欲”,更加舒適,更加便捷?;诹桕?yáng) 16位SPCE061A單片機設計了一個(gè)具有語(yǔ)音識別功能的機器人。在經(jīng)過(guò)訓練后使機器人對訓練人的命令做出應答,完成跳兩首舞曲、走步、轉向、轉頭、發(fā)射飛盤(pán)等動(dòng)作。
語(yǔ)音識別可劃分為訓練和識別兩個(gè)過(guò)程。在第一階段,語(yǔ)音識別系統對人類(lèi)的 語(yǔ)言進(jìn)行學(xué)習,把學(xué)習內容組成語(yǔ)音庫存儲起來(lái),在第二階段就可以把當前輸入的語(yǔ)音在語(yǔ)音庫中查找相應的詞義或語(yǔ)義。凌陽(yáng)16位SPCE061A單片機內嵌 32K字閃存,2K字SRAM,內置10位ADC、DAC,有多達14個(gè)的中斷源。它的CPU內核采用16位具有DSP功能的微處理器芯片, 而且CPU可最高工作在49MHz的主頻下,能夠非常容易地、快速地處理復雜的數字信號,因此與其他類(lèi)型的單片機相比,在數字語(yǔ)音處理方面 SPCE061A更具有優(yōu)勢?;赟PCE061A設計了一個(gè)具有語(yǔ)音識別功能的機器人。經(jīng)過(guò)訓練,訓練人可使用各種命令讓機器人完成許多有趣的動(dòng)作,使得人機交互更具智能化。
SPCE061A最小系統
SPCE061A最小系統中,含有SPCE061A芯片外圍的基本模塊,其主要由晶體輸入模塊(OSC)、鎖相環(huán)外圍電路(PLL)、復位電路(RESET)、指示燈(LED)等組成,參看圖 4-1。在OSC32O、OSC32I端口接上晶體振蕩器和諧振電容,在VCOIN端口接上相對應的電容和電阻后即可工作。在其他不用的VDD端口和 GND端口也不能懸空應該接上0.1uF的耦合電容以提高抗干擾能力。 圖 4-1 SPCE061A最小系統。
TOP3 機器人硬件驅動(dòng)電路
電源輸入端口是61板的能源供應中心,整塊板子的電源都是由此提供進(jìn)去,可采用電池或穩壓電源提供5V輸入,并且必須至少保證電流在50mA以上,否則會(huì )造成系統無(wú)法倍頻和下載出錯。SPCE061A的內核供電為3.3V,由于I/O端口可接3.3V也可以接5V,所以在電源模塊中有一個(gè)端口電平選擇跳線(xiàn)J5用于選擇端口電壓,電源模塊參看圖,如下:
由于此系統需要的端口高電平為5V,所以圖當中的J5跳線(xiàn)需要跳到1和2上。
放音電路設計
將HM628128A中存儲的語(yǔ)音數據順序取出,解碼后,以8kHz的速率進(jìn)行D/A轉換輸出,語(yǔ)音數據經(jīng)電容濾波恢復成原始語(yǔ)音波形,最后用三極管驅動(dòng)揚聲器放音。SPCE061A音頻輸出共有兩個(gè)DAC通道,DAC1和DAC2輸出的模擬電信號通過(guò)DAC1和DAC2引腳輸出。DAC的輸出范圍是 0x0000~0xFFFF。DAC1和DAC2的輸出數據應寫(xiě)入P_DAC1和P_DAC2單元。上電復位以后,兩個(gè)DAC均被自動(dòng)打開(kāi),此時(shí)會(huì )消耗少量的電流(幾個(gè)毫安)。如若不需要,盡量關(guān)閉DAC輸出(將P_DAC_Ctrl單元的第一位置為1)。而且DAC的直流電壓必須保持平穩地變化,否則可能由于電壓的突變引起揚聲器產(chǎn)生雜音。為減緩電壓的變化幅度,從而輸出高質(zhì)量的音頻數據可以采用ramp up/down技術(shù)。其應用條件是:被喚醒/上電復位后首次使用DAC時(shí),上電復位功能應在被關(guān)閉/進(jìn)入睡眠狀態(tài)之前。 放音利用的是SPCE061A內部的DAC,電路參看圖 4-8。圖中的SPY0030是凌陽(yáng)公司的產(chǎn)品。和LM386相比,在工作電壓上,LM386需在4V以上,而SPY0030僅需2.4V(兩節電池)即可工作;在輸出功率上,LM386僅在100mW以上,而SPY0030可達700mW。
機器人硬件驅動(dòng)電路
機器人驅動(dòng)電路采用功率較大的三極管搭成H橋來(lái)驅動(dòng)電機從而實(shí)現電機的正向旋轉與電機的反向旋轉,本系統中使用H橋驅動(dòng)的電機包括兩個(gè)用于走路的電機與一個(gè)頭部轉向的電機。同時(shí)用了一個(gè)三極管驅動(dòng)單向旋轉的電機,如加速電機與發(fā)射電機。語(yǔ)音處理技術(shù)本身就是一門(mén)理論性強、實(shí)用面廣而且難度較大的綜合學(xué)科。而開(kāi)發(fā)出具有語(yǔ)音功能的單片機也是相當困難的。凌陽(yáng)unsp系列16位單片機,就是適應這種需求而設計的。凌陽(yáng)SPCE061A實(shí)現語(yǔ)音識別其獨特之處在于:硬件電路簡(jiǎn)單,因為SPCE061A是一款專(zhuān)門(mén)為語(yǔ)音信號處理設計的單片機,麥克風(fēng)和喇叭可以直接接入,接放大電路可不用外接。具有一套高效的指令系統,軟件編程容易,有相應的API函數,可直接調用。
TOP4 SPCE061A智能小車(chē)語(yǔ)音識別電路
本文利用凌陽(yáng)單片機設計一個(gè)具有語(yǔ)音識別功能的智能遙控小車(chē)。該設計將遙控車(chē)由傳統的手動(dòng)遙控改成了語(yǔ)音識別遙控,集成了先進(jìn)的語(yǔ)音識別技術(shù),加上小車(chē)的機動(dòng)靈活的特點(diǎn),使控制者可以通過(guò)語(yǔ)音控制小車(chē)實(shí)現預設動(dòng)作,從而釋放控制者的雙手,而且小車(chē)和控制者之間還具有一定的交互功能。所以此次研究具有較強的實(shí)用性和發(fā)展前景。
繼電器驅動(dòng)電路的設計
由于單片機I/O口提供的電流太小,不能直接驅動(dòng)繼電器工作。在這里采用8050NPN管來(lái)提供一個(gè)開(kāi)關(guān)電壓,實(shí)現I/O口對繼電器的驅動(dòng);用IN4007去掉繼電器斷開(kāi)時(shí)線(xiàn)圈產(chǎn)生的反向電流,保護8050NPN管不被損壞。繼電器驅動(dòng)電路如圖所示。
行駛狀態(tài)控制電路設計
如圖所示為行使狀態(tài)控制電路,整個(gè)小車(chē)的行駛狀態(tài)由兩個(gè)電機MOTOR A和MOTOR B來(lái)控制;MOTOR A控制小車(chē)的左邊兩個(gè)輪子,MOTOR B控制小車(chē)右邊兩個(gè)輪子。具體控制如所示。
麥克錄音輸入及AGC電路
麥克風(fēng)電路如圖所示。凌陽(yáng)的SPCE061A是16位單片機,具有DSP功能,有很強的信息處理能力,最高時(shí)鐘可達到49M,具備運算速度高的優(yōu)勢等等,這為語(yǔ)音的播放、錄放、合成及辨識提供了條件。本系統接入MIC電路如下圖所示,MIC為錄制語(yǔ)音辨識命令服務(wù)。麥克錄音輸入及AGC電路。
語(yǔ)音播報電路
音頻部分的原理圖如下所示,在下圖中可以看到兩個(gè)跳線(xiàn),其作用在于可以測量DAC的輸出波形;另外拔掉跳線(xiàn),可以斷開(kāi)DAC到喇 叭放大的通路,使得DAC通道處于開(kāi)路狀態(tài)。這樣便于用DAC做其他用途,用戶(hù)可以用過(guò)這個(gè)跳線(xiàn)來(lái)加入自己的外圍電路。
本設計綜合應用了SPCE061A豐富的硬件資源,成功的實(shí)現了語(yǔ)音控制功能。下面簡(jiǎn)單的介紹一下實(shí)際應用中的一些資源優(yōu)勢:在硬件方面,較高的執行速度、內置的硬件乘法器、ADC和DAC功能、內置的AGC自動(dòng)增益環(huán)節,這些為語(yǔ)音處理提供了強大基礎。在軟件方面,標準的C語(yǔ)言編程,豐富的語(yǔ)音資源函數為編程提供了很大的方便。 該設計方案結構簡(jiǎn)單,以單芯片實(shí)現了語(yǔ)音播放與識別以及電機控制功能,相當于“語(yǔ)音識別芯片+普通單片機”的功能。但是比“語(yǔ)音識別芯片+普通單片機”方案實(shí)現起來(lái)要簡(jiǎn)單很多,而且成本也會(huì )降低很多。
TOP5 AVR單片機語(yǔ)音識別電路模塊
基于A(yíng)VR單片機的語(yǔ)音識別系統設計,系統以AVR單片機為控制核心,實(shí)現對人的語(yǔ)音的識別控制。系統采用的主控芯片為Atreel公司的 ATMEGAl28,語(yǔ)音識別功能采用ICR oute公司的單芯片LD3320。LD3320內部集成語(yǔ)音識別算法,無(wú)需外部FLASH,RAM資源,可以很好地完成非特定人的語(yǔ)音識別任務(wù)。同時(shí)該芯片內部集成了MP3播放功能,支持MPEG等格式,可實(shí)現語(yǔ)音提示或MP3歌曲的播放功能。由于內部含有16位A/D、D/A轉換器和功放電路,所以不需要外接功放電路就可以產(chǎn)生清晰的聲音。該系統已經(jīng)預留好各種接口,具有良好的擴展性。
LD3320語(yǔ)音識別電路
LD3320芯片是一款“語(yǔ)音識別”專(zhuān)用芯片。該芯片集成了語(yǔ)音識別處理器和一些外部電路,包括A/D、D/A轉換器、麥克風(fēng)接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產(chǎn)品中即可以實(shí)現語(yǔ)音識別、聲控、人機對話(huà)功能。圖3為L(cháng)D3320電路原理圖,與MCU通信采用SPI總線(xiàn)方式,時(shí)鐘不能超過(guò)1.5MHz。
麥克風(fēng)工作電路如圖所示,音頻輸出只需將揚聲器連接到SPOP和SPON即可。使用SPI總線(xiàn)方式時(shí),LD3320的MD要設為高電平,SPIS設為低電平。SPI總線(xiàn)的引腳有SDI,SDO,SDCK以及SCS。INTB為中斷端口,當有識別結果或MP3數據不足時(shí),會(huì )觸發(fā)中斷,通知MCU處理。 RSTB引腳是LD3320復位端,低電平有效。LED1,LED2作為上電指示燈。
嵌入式語(yǔ)音識別處理ISD-SR3000應用電路
由ISD-SR3000構成的語(yǔ)音識別系統由電路如圖2所示。以下分別介紹電路中各部分的功能。
時(shí)鐘電路
SR3000內含片內振蕩器,但應用時(shí)也可通過(guò)X1和X2/CLKIN端的外接晶振或外部時(shí)鐘源來(lái)產(chǎn)生時(shí)鐘信號。外部時(shí)鐘源信號應通過(guò)X2/CLKIN端輸入。要注意的是,外部時(shí)鐘源電平與CLKIN的輸入電平要相符(3.3V或5V)。
外接晶振可通過(guò)X1和X2/CLKIN端與芯片內的振蕩電路相連。為減少寄生電容和電感對振蕩頻率的影響,外接的晶振和電容應盡量靠近X1和X2 /CLKIN端。ISD-SR3000可工作在3.3V±10%和5V±10%兩種電壓,不同電壓的接線(xiàn)方式不同。圖3是采用3.3V電源時(shí)的接線(xiàn)圖,圖 4為采用5V電源時(shí)的接線(xiàn)圖。SD-SR3000具有低功耗模式,在低功耗模式時(shí)的電流消耗僅12mA,此時(shí)芯片中的一些功能模塊處于未激活狀態(tài),因而不能進(jìn)行語(yǔ)音識別。低功耗模式時(shí)的引腳CS0和CS1必須置1,這時(shí),MWCLK、MWDIN信號將保持在Vss+0.5V,而RESET、MWCS信號則將保持在Vcc- 0.5V。
TOP6 揭秘DSP和HMM的語(yǔ)音識別系統電路
存儲器接口
ISD-SR3000利用擴展的Flash(閃存)和RO來(lái)存儲聲音標簽、詞匯、提示符和音質(zhì)模型。建議選用16M以上存儲容量的擴展Flash存儲器,如Am29LA160D等。外接64kB的SRAM可實(shí)現HMM算法。表2給出了擴展地址線(xiàn)的接口信號。
ISD-SR3000可為模擬和數字電話(huà)提供一個(gè)支持主和從CODEC接口模式的CODEC接口,該接口具有8位和16位的信道寬度,能支持可變和固定格式的通信協(xié)議。在主模式下,可利用SR3000來(lái)控制CODEC的運行以滿(mǎn)足模擬電話(huà)和獨立標準的應用;在從模式下,CODEC接口由外接信號控制,此模式可用于數字電話(huà),如ISDN或DECT線(xiàn)等。CODEC接口使用的5個(gè)信號分別為CDIN、CODUT、CCLK、CFS0和CSF1。其中 CDIN、CDOUT、CCLK和CFS0被連接到第一個(gè)CODEC。CDIN、CDOUT、CCLK和CFS1被連接到第二個(gè)CODEC接口。數據通過(guò) CDOUT輸出端傳送給CODEC接口,并通過(guò)CDIN輸入端從CODEC讀出。CCLK和CFS0端在主模式下為輸出狀態(tài),而在從模式下為輸入狀態(tài)。 CFS1是一個(gè)輸出端。
揭秘DSP和HMM的語(yǔ)音識別系統電路模塊設計
語(yǔ)音信號采集模塊主要包括語(yǔ)音信號的輸入輸出模擬通道、DSP和AD50的連接、DSP和AD50的周邊設備連接等。其中,DSP和AD50的周邊設備連接包括電源電路、時(shí)鐘電路、復位電路、存儲器擴展電路和去耦電路等,這些電路的連接可查看相關(guān)芯片資料。語(yǔ)音信號的前后端處理主要由輸入輸出模擬通道組成。這兩個(gè)電路的主要作用是將信號進(jìn)行處理,盡量減少輸入輸出引入的噪聲。同時(shí),還可以調整輸入輸出的放大系數,使語(yǔ)音信號適合各種不同的功放,得到最佳的語(yǔ)音效果。為了達到更好的效果,AD50的模擬信號輸入采用差分輸入方式,即使用兩個(gè)運算放大器,將單端輸入信號轉換成差分輸入信號,電路連接如圖3.5所示。使用差分信號,信號一J下一負同時(shí)進(jìn)入采集系統,如果此時(shí)有隨機噪聲出現,通過(guò)『F負信號的加減,可以有效消除部分噪聲。
AD50差分輸入電路
AD50的D/A輸出為差分信號,可以直接驅動(dòng)600歐姆的負載。
差分輸出電路
要使TLC320AD50正常工作,還需要進(jìn)行電源供電及去耦電路以及一些功能引腳包括幀同步延遲輸出、電壓下拉、輸出監控、參考電壓過(guò)濾輸出等的連接,具體連接如圖3.7所示。
TLC320AD50外圍電路
DSP通過(guò)多通道緩沖串口連接AD50。DSP最多可以使一個(gè)緩沖串口與3個(gè)AD50芯片連接。本系統采用DSP為主設備、AD50為從設備的連接方法。如圖3.8所示,AD50的時(shí)鐘信號MCLK由DSP的定時(shí)器0的輸出TOUT0提供,時(shí)鐘頻率可以通過(guò)設置定時(shí)器0來(lái)改變。AD50的移位時(shí)鐘輸出 SCLK連接到DSP的緩沖串口0的接收時(shí)鐘引腳CLKR0,幀同步信號FS連接到DSP緩沖串口0的FRXO。AD50的FC引腳連接到DSP的通用 I/O引腳XF,用于控制二次串行通信。圖3.8中DSP的DR0為輸入,其余均為輸出。
TOP7 程序存儲器電路
程序存儲器主要用于系統運行時(shí),將采集的數字語(yǔ)音信號暫時(shí)存儲在RAM中以備后續的處理。由于采集的數據不是太大,擴展32k的程序存儲器即可滿(mǎn)足要求。因此本系統只用到CY7C1021的低32k字空間,將DSP的地址線(xiàn)的低15位與CY7C1021的地址線(xiàn)引腳相連,而地址線(xiàn)的1卜18位通過(guò)一個(gè)數字邏輯電路后用于尋址CY7C1021的低32k字空間。電路原理圖如圖3.9所示。
Y7C1021主要電路原理圖
圖3.10是CY7C1021讀和寫(xiě)信號數字邏輯電路。圖中,DSP的DSP—R/W和DSP—MSTRB引腳通過(guò)或門(mén)后的輸出作為SRAM的寫(xiě)信號,DSP—R/W的非和DSP—MSTRB引腳通過(guò)或門(mén)后輸出作為SRAM的讀信號。
圖3.1l是CY7C1021的第16位地址引腳數字邏輯電路。圖中,DSP A15經(jīng)過(guò)一個(gè)非門(mén)作為二四譯碼器SN74LSl39AD的使能信號,DSP A16和DSP A17經(jīng)過(guò)譯碼器后輸出端Yl與Y2的非通過(guò)一個(gè)與門(mén)后的輸出作為SRAM的第16位地址線(xiàn)。因此,低32k的SRAM映射到DSP程序空間的0X1 8000__oXlFFFF。
數據存儲器電路
數據存儲器主要用于存儲編譯后的系統軟件的數據,用于語(yǔ)音識別系統板上電自舉。選用flash芯片,是因為flash芯片是電可擦可寫(xiě)芯片,可以在線(xiàn)對flash進(jìn)行操作,修改應用程序方便。地址緩沖器和數據緩沖器電路連接分別如圖3.12和3.13所示:
SN74LVTHl6244外圍電路
SN74LVTHl6245外圍電路原理圖
TOP8 LED顯示電路與外圍電路設計
SST39VFl60有1M*16bit的容量,但擴展數據存儲器只需64K空間足以,所以電路SST39VFl60的地址線(xiàn)的高4位接地。電路原理圖如圖3.14所示:
SST39VFl60外圍電路
LED顯示電路
LED顯示電路在此系統中用于顯示語(yǔ)音識別的結果,與輸入的語(yǔ)音比較可知系統識別率的高低。電路中用SN74LS373作為暫存器,通過(guò)DSP的I/O 端口選擇引腳IS和DSP的第17個(gè)地址引腳來(lái)控制SN74LS373的輸出使能端,用一個(gè)共陰極七段數碼管來(lái)顯示識別結果【241。電路圖如圖3.15 所示:
LED顯示電路原理圖
J-TAG電路
JTAG標準是IEEEl990年公布的1 149.1標準的又一稱(chēng)呼,是針對現代超大規模集成電路測試、檢驗困難而提出的、基于邊界掃描機制和標準測試存儲口的國際標準。JTAG標準公布以后,TI公司為其以后的DSP器件均設置符合國際標準的JTAG邏輯測試口,通過(guò)JTAG測試口訪(fǎng)問(wèn)和調試TI DSP芯片。電路設計中需要注意的問(wèn)題:當仿真器與DSP距離大于15.24cm時(shí),JTAG仿真頭與DSP之間的EMUO、EMUl、TMS、TDI引腳互聯(lián)時(shí)應通過(guò)上拉電阻接高電平,而TMS、TDI、TDO、TCK之問(wèn)互聯(lián)時(shí)還要加緩沖器,只在距離小于15.24cm時(shí)它們之間不用通過(guò)緩沖器連接。
JTAG在線(xiàn)仿真電路原理圖
電源電路
此系統中,有兩類(lèi)電壓,一類(lèi)是DSP芯片的內核電壓,為1.8V,另一類(lèi)是DSP的外圍電路供電電壓,為3.3V。為了能夠滿(mǎn)足雙電壓供電,本系統選用TPS767D318電源芯片供電。根據芯片推薦電路搭建電路原理圖如圖3.17所示:
系統電源供電電路原理圖
簡(jiǎn)述了與硬件相關(guān)的驅動(dòng)程序的設計,將硬件驅動(dòng)程序與語(yǔ)音識別程序綜合,編譯通過(guò)后載入目標板即對語(yǔ)音信號進(jìn)行識別。介紹了一個(gè)基于DSP的非特定人漢語(yǔ)孤立數字語(yǔ)音識別系統的設計過(guò)程,系統通過(guò)AD50芯片將模擬語(yǔ)音信號采集到DSP芯片中,再采用語(yǔ)音識別算法對采集到的信號進(jìn)行處理,并將識別的結果用LED輸出完成了整個(gè)系統設計。
TOP9 語(yǔ)音識別系統在家庭監護機器人應用電路
語(yǔ)音是人類(lèi)最常用的交流方式,也是人類(lèi)和計算機交流最渴望的方式。因此用語(yǔ)音同計算機交流也成為了最近研究的熱點(diǎn),計算機對語(yǔ)音的理解是計算機科學(xué)中的一個(gè)引人人勝的、富有挑戰性的課題。我國語(yǔ)音識別研究工作開(kāi)始的較晚,但近年來(lái)發(fā)展得很快,一直緊跟國際水平,國家也很重視,中科院自動(dòng)化所研制的非特定人、連續語(yǔ)音聽(tīng)寫(xiě)系統和漢語(yǔ)語(yǔ)音人機對話(huà)系統,其字準確率或系統響應率可達90%以上。鑒于中國未來(lái)龐大的市場(chǎng),國外也非常重視漢語(yǔ)語(yǔ)音識別的研究。
STM32嵌入式語(yǔ)音識別電路模塊設計
介紹了一種以ARM為核心的嵌入式語(yǔ)音識別模塊的設計與實(shí)現。模塊的核心處理單元選用ST公司的基于A(yíng)RM Cortex-M3內核的32位處理器STM32F103C8T6。本模塊以對話(huà)管理單元為中心,通過(guò)以L(fǎng)D3320芯片為核心的硬件單元實(shí)現語(yǔ)音識別功能,采用嵌入式操作系統μC/OS-II來(lái)實(shí)現統一的任務(wù)調度和外圍設備管理。經(jīng)過(guò)大量的實(shí)驗數據驗證,本文設計的語(yǔ)音識別模塊具有高實(shí)時(shí)性、高識別率、高穩定性的優(yōu)點(diǎn)。
語(yǔ)音識別電路
圖3為語(yǔ)音識別部分原理圖,參照了ICRoute發(fā)布的LD3320數據手冊進(jìn)行設計。LD3320的內部集成了快速穩定的優(yōu)化算法,不需外接Fla-sh、RAM,不需要用戶(hù)事先訓練和錄音而完成非特定人語(yǔ)音識別,識別準確率高。
圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數據段還是地址段;控制信號,復位信號以及中斷返回信號INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統穩定工作;和STM32F103C8T6采用同一個(gè)外部8 MHz時(shí)鐘;發(fā)光二極管D1、D2用于復位后的上電指示;MBS(引腳12)作為麥克風(fēng)偏置,接了一個(gè)RC電路,保證能輸出一個(gè)浮動(dòng)電壓給麥克風(fēng)。
智能語(yǔ)音識別云臺轉動(dòng)模塊電路設計
云臺轉動(dòng)電路
雙自由度云臺有4 個(gè)控制轉動(dòng)方向的端口, 分別是水平左轉、水平右轉、上升、下降, 需要24 V 的交流電來(lái)驅動(dòng), 而語(yǔ)音識別結果的二進(jìn)制序列經(jīng)過(guò)解碼后由單片機AT89S52 的I/O 口輸出, 其端口電平是0 ~5 V 的直流。為了能使單片機根據語(yǔ)音識別結果驅動(dòng)云臺轉動(dòng),在A(yíng)T89S52 和云臺之間放置一個(gè)電流放大器件ULN2003 。ULN2003 是大電流、高耐壓達林頓陣列, 包括7 個(gè)達林頓管, 在5 V 的工作電壓下, 能夠與TTL 和CMOS 電路直接相連, 這樣就可以直接處理原來(lái)需要標準邏輯緩沖器來(lái)處理的數據。將控制云臺轉動(dòng)方向的4 個(gè)端口D_Right 、D_Left 、D_Up 、D_Down 分別與繼電器K1、K2、K3、K4 相連, 單片機AT89S52 根據解碼后的語(yǔ)音識別結果控制繼電器的斷開(kāi)和閉合, 從而控制云臺轉動(dòng)的方向和角度。云臺轉動(dòng)電路圖如圖所示。
TOP10 語(yǔ)音識別播放電路
語(yǔ)音識別播放電路主要由語(yǔ)音芯片LD3320、STC10L08XE 單片機及其他外圍電路構成。語(yǔ)音芯片LD3320 內部固化有完整的非特定人語(yǔ)音識別特征庫和高效的非特定人語(yǔ)音識別搜索引擎模塊, 不需要事先訓練和錄音。只需要單片機把候選識別語(yǔ)句的拼音串傳入芯片內部, 通過(guò)芯片內部的DSP 算法, 找出最佳識別結果。同時(shí)此芯片還支持MP3 播放功能, 此時(shí)需要外接Flash 芯片, 用來(lái)存儲播放的聲音素材等數據。STC10L08XE 單片機讀取串行存儲芯片的MP3 數據, 依次送入LD3320 芯片內部就可以從芯片的相應引腳輸出聲音。STC10L08XE 單片機與語(yǔ)音芯片LD3320 之間采用并行的通信方式, 故在硬件上需要使用8 根數據線(xiàn)和4 個(gè)控制信號將語(yǔ)音芯片與單片機并行連接。
最小系統電路
最小系統電路圖如下圖所示,在OSC0,OSC1 口接晶振以及諧振電容,在鎖相環(huán)接入相應電容電阻,在電源端和接地端接上0.1UF 去耦電容,提高考干擾能力。
SPCE061A 語(yǔ)音識別模塊硬件結構
在SPCE061A 主控芯片對語(yǔ)音信號進(jìn)行A/D 轉換具有專(zhuān)門(mén)的轉換通道——聲音模-數轉換通道。并且SPCE061A 內部置有麥克風(fēng)放大電路和自動(dòng)增益控制部分。自動(dòng)增益控制部分可以自動(dòng)調節所收到的麥克風(fēng)音量,這樣使得該系統不會(huì )受到發(fā)送命令的人所處位置的限制。 SPCE061A 內部的麥克風(fēng)前置放大電路主要由輸入級、中間級、輸出級三部分組成,輸入級采用的是差分放大電路,它是麥克風(fēng)前置放大電路的主要組成部分,差分放大電路作為輸入級有很大的優(yōu)勢,能夠有效的抑制輸入端輸入的共模干擾,對于輸入的有效差分信號則不會(huì )產(chǎn)生任何干擾。本系統的語(yǔ)音識別信號輸入電路如下圖所示。 C23,C24 是作為退偶電容用,減少噪音信號對語(yǔ)音識別的干擾。
SPCE061A 的音頻輸出模塊硬件電路設計圖如下所示:
電源模塊電路設計分析
TOP11 RSC-4X系列語(yǔ)音識別集成應用電路
在本系統中SPCE061A 所需要用到的3.3V 電源,采用AMS1117 芯片產(chǎn)生。AMS1117 是一個(gè)正向低壓降穩壓器,AMS1117 有兩種:一種為固定輸出電壓,輸出的電壓值有:1.5V、1.8V、2.5V、2.85V、3.0V、3.3V;另一種為可調節輸出電壓。AMS1117 內部集成了過(guò)熱保護電路和過(guò)流保護電路。為了保護AMS1117 的穩定性,在輸出端要接一個(gè)至少22UF 的鉭電容由AMS1117 構成的3.3V 電壓產(chǎn)生電路圖。
由LM2576 構成的5V 電壓產(chǎn)生電路圖如下圖所示:
電機驅動(dòng)模塊硬件電路設計
L298 是專(zhuān)用驅動(dòng)集成電路,可以驅動(dòng)感性負載,例如:大功率直流電機和步進(jìn)電機等,可驅動(dòng)46V,2A 以下的電機。其輸入端可以直接與單片機連接,并且可以實(shí)現電機的正轉、反轉、加速和減速等控制。L298 有兩個(gè)電源,分別為邏輯電源和動(dòng)力電源,6V 為邏輯電源。12V 為動(dòng)力電源。電路圖如下所示:
總的來(lái)說(shuō),計還是比較簡(jiǎn)單的,對于語(yǔ)音識別技術(shù)更是有了全新的認識,完全掌握了SPCE061A的原理及其技術(shù)。還有,語(yǔ)音識別是一項很有應用前景的全新項目,可以應用于多種未來(lái)新新項目,應用范圍廣,可靠性高。是一個(gè)很有前途的創(chuàng )新項目!
RSC-4X系列語(yǔ)音識別集成應用電路設計
RSC-4x系列是新一代嵌入式語(yǔ)音識別處理器集成電路,它具有集成度高、外圍電路簡(jiǎn)單、功耗低、不怕掉電、使用方便等特點(diǎn)。一個(gè)完整的語(yǔ)音識別系統僅由RSC-4x系列芯片及少量外部元器件(揚聲器、麥克風(fēng)、音頻輸入/輸出電路、存儲器和電池或整流穩壓電源)等組成.R S C-4 x系列芯片適用7.0語(yǔ)音識別技術(shù)RSC-4x系列芯片通常采用48P/64P/100P-LQFP封裝。
工作原理:RSC-4x是一種交互式智能語(yǔ)音識別電路,通過(guò)執行內嵌的馬爾可夫鏈和神經(jīng)網(wǎng)絡(luò )去處理語(yǔ)音識別。說(shuō)話(huà)者需要在芯片的外部存儲器(如 sRAM、EEPROM、閃存等)存儲語(yǔ)音識別信息,識別過(guò)程中需要ROM去存儲要被識別的字.RSC-4x有如下幾個(gè)獨創(chuàng )的識別特性:
1、語(yǔ)音識別無(wú)須訓練。在一個(gè)活動(dòng)單元內可識別16個(gè)字(單元存儲的字由內部ROM和外部存儲器限制)。
2、連續接收每一個(gè)特殊的字。由于這個(gè)功能,所以此產(chǎn)品可以用在一般的場(chǎng)合和對一些特殊的字時(shí)需要安靜的環(huán)境。
3、字定點(diǎn)測量允許芯片一次可連續接收達5個(gè)SI或10個(gè)SD,在該字定點(diǎn)方式下,無(wú)須保持安靜的環(huán)境.RSC-4x系列可在芯片的sRAM中存儲6個(gè)sD字或在外部存儲器中存入更多的字。
RSC-4x利用巧妙的頻域規則提供高質(zhì)量語(yǔ)音合成,典型的數據率小于5k/s.語(yǔ)音合成需要片內或片外ROM去存儲所要合成的語(yǔ)音數據.RSC-4x 提供4種高質(zhì)量音樂(lè )/語(yǔ)音合成手段.RSC-4x獨到之處還有可使用計算機網(wǎng)絡(luò )系統產(chǎn)生具有128種音色、47種真實(shí)樂(lè )器聲的高檔音樂(lè ) MIDI.。RSC-4x可以在不同的采樣比率下對聲音進(jìn)行錄音和重播,采樣比取決于對語(yǔ)音時(shí)長(cháng)和音質(zhì)的要求,數據率在14k/s時(shí),一般就可以獲得較高音質(zhì)的效果.RSC-4x還可以消除靜差以提高聲音質(zhì)量和減少存儲容量。
評論