電視機智能聲控選臺系統設計與實(shí)現
標簽:遙控發(fā)射 MIC
本文引用地址:http://dyxdggzs.com/article/165167.htm隨著(zhù)電視頻道數目的日益增多,傳統的電視遙控方法弊端越來(lái)越明顯。它需要觀(guān)念記憶大量電視臺對音識別芯片TSG410設計了一個(gè)彩電智能聲控選臺系統,可以較好地解決記憶頻道這個(gè)難題。尤其對列疾朋友來(lái)講,更具有特殊的意義。
該系統不對彩電做任何改動(dòng)。在保留原有遙控功能的基礎上,實(shí)現語(yǔ)音控制選臺,主要功能有:
開(kāi)關(guān)電視:電視接通電源處于待命狀態(tài),操作者發(fā)出“開(kāi)機”命令,則打開(kāi)電視機;操作者發(fā)出“關(guān)機”命令,則關(guān)掉電視機;
;選臺功能:操作者想看XX電視臺的節目,只要發(fā)出“XX臺”的命令,電視機自動(dòng)跳轉到該臺。
識別主人功能:日防止識操作,該系統只能事先錄入命令樣本的操作者語(yǔ)音敏感,其他人發(fā)出的命令包括電視伴音均無(wú)效。
其它功能:具有電視音量、畫(huà)面亮度調節等適合語(yǔ)音控制的功能。
1 系統設計方案
我們最初考慮了兩種設計方案(見(jiàn)圖1和圖2),它們各有優(yōu)缺點(diǎn)。第一種電路不足之處是:電路稍復雜一點(diǎn),而且要對電視機的選臺控制電路做必要的改動(dòng)(當然這對電視機生產(chǎn)廠(chǎng)家是不成問(wèn)題的);其優(yōu)點(diǎn)是:只需一個(gè)無(wú)線(xiàn)話(huà)筒便可聲控選臺,且不必對準電視機,甚至在另一個(gè)房間也可實(shí)現遙控。第二種電路的優(yōu)點(diǎn)是:不必對電視機的選臺控制電路做任何的改動(dòng);缺點(diǎn)是:所有電路只能靠電池供電,芯片選擇要考慮耗電和工作電壓?jiǎn)?wèn)題。由于采用紅外遙控發(fā)射來(lái)控制電視,該系統須對準電視機才能正常工作。綜合考慮各方面因素,我們認日第二種設計方案切實(shí)可行。


2 各個(gè)功能模塊簡(jiǎn)介
2.1 語(yǔ)音命令提取單元
語(yǔ)音命令提供該單元(如圖2)在電視話(huà)音和其它噪音背景下,完成提取出操作者語(yǔ)音命令功能,其示意圖如圖3所示。

MIC選用駐極體送話(huà)器,它具有結構簡(jiǎn)單、重量輕、體積小、頻率響應寬、保真度好等優(yōu)點(diǎn),但靈敏度較低,必須再加放大器才行。由于輸出阻抗可高達10 8Ω數量級,所在必須進(jìn)行阻抗變換后才能與放大器配合使用。放大器采用差分放大電路,一個(gè)駐極體送話(huà)器面對送話(huà)者,其輸出接送放大器正向輸入端;另一個(gè)駐極體送話(huà)器背對送話(huà)者,其輸出接放大器負向輸入端。由于兩個(gè)送話(huà)器相對于電視機和其它噪聲源的位置基本一樣遠,可以近似認日通過(guò)二者輸入的干擾是一樣的。但考慮到送話(huà)器具有方向性,前者送入的操作者語(yǔ)音命令遠遠大于后者,適當選擇各電阻值可以抵消掉各種干擾。放大器采用運放(OPAmps)MAX495(單電源供電+2.7~+6V)。
2.2 語(yǔ)音識別單元
語(yǔ)音識別單元主要由TSG410和非易失性SRAM組成,大體構成如下圖4所示。

語(yǔ)音識別功能由專(zhuān)用語(yǔ)音芯片TSG410完成,TSG410是一種新穎功能齊全的語(yǔ)音識別集成電路。它采用CMOS大規模集成電路制作工藝制造,內含除SRAM以外語(yǔ)音識別所需的全部電路,如CPU、A/D轉換器、ROM、語(yǔ)音放大器、壓縮器、濾波器、振蕩器及接口電路等。TSG410具有雙列直插和貼片兩種封裝方式,可工作在CPU控制和人工控制兩種模式下。語(yǔ)音識別的響應時(shí)間典型值日300ms,最長(cháng)不超過(guò)600ms。
識別容量大,最多可識別40個(gè)字段,且分段方式靈活。為了CPU管理方便,將40個(gè)字段分成四組,編號為1~4,每組10個(gè)段。這樣,第一個(gè)字段編號為10,第二個(gè)為11,第三個(gè)為12…依次類(lèi)推,第40個(gè)字段編號為49。在操作顯示時(shí),十位數顯示組號,個(gè)位數顯示序號。因此,建立語(yǔ)音樣本時(shí),應注意顯示數字和電視機選擇頻率之間的換算關(guān)系,以免語(yǔ)音命令和控制結果對應不起來(lái)。各段功能分配如表1所示。

TSG410的每個(gè)字段時(shí)間長(cháng)度可以在0.9s和1.92s之間選擇。按正常人的講話(huà)速度,每秒吐字2~4個(gè),如選擇0.9s,則每個(gè)命令字段以1~3個(gè)字為宜,選擇1.92s則最大容量為8個(gè)漢字,但可識別的字段數減少為20個(gè)。我們選擇膠一種分段方式,語(yǔ)音命令以3個(gè)字以下為宜。因此,電視選臺命令采用“地方”命名原則,如:山東、上海等,中央臺可直接叫“一臺”、“二臺”,依次類(lèi)推。語(yǔ)音命令差別越大越不容易出現錯誤識別。系統要正常工作,必須首先建立語(yǔ)音樣本,為防止語(yǔ)音樣本因為掉電丟失,SRAM選用內帶掉電保護電池的非易失性SRAM,即NVSRAM(non-volatile SRAM),如HK1125,掉電后其數據可保存10年以上,用法同普通RAM。
一般情況下,留有30個(gè)預選頻道是足夠用的。實(shí)際上,既可以采用多片TSG410進(jìn)行頻道數和允許操作者人數擴展方式滿(mǎn)足各種需要,也可以采用讓TSG410工作在CPU控制方式的辦法。此時(shí)識別容量不受40字段限制,但需增加單片機(如8031)作控制用。
2.3 控制面板
為了能輸入字段號,以便建立語(yǔ)音樣本,RSG410配置了外接鍵盤(pán)掃描電路。行、列信號的輸入、輸出口由芯片的S1~S3、K1~K3擔當。這樣一個(gè)三列、四行的鍵盤(pán)共有12個(gè)按鍵,其中十個(gè)定義為:0~9數字鍵,一個(gè)定義為:語(yǔ)音樣本建立鍵(TRN),一個(gè)定義為:語(yǔ)音樣本清除鍵(CLR)。由于控制面板只在建立語(yǔ)音樣本時(shí)使用,為防止誤操作,應將12個(gè)按鍵用塑料外亮封起來(lái)。
2.4 操作指示電路
采用兩片數碼管和譯碼驅動(dòng)電路CC4558組成操作指示電路。在本系統中,操作指示電路作用是:建立語(yǔ)音命令樣本時(shí),用于顯示存入的字段號;語(yǔ)音命令識別時(shí)用于顯示識別結果及芯片識別結果的處理報告。
評論