<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 消費電子 > 設計應用 > 帶語(yǔ)音識別功能的消費電子產(chǎn)品的系統設計

帶語(yǔ)音識別功能的消費電子產(chǎn)品的系統設計

作者: 時(shí)間:2008-04-22 來(lái)源:網(wǎng)絡(luò ) 收藏
過(guò)去,的應用一直局限于基于PC的、電話(huà)服務(wù)器、高端手機和PDA。但近年來(lái),技術(shù)的進(jìn)步已使得低成本的處理器在電子領(lǐng)域得到應用。

現在的處理器集成了更多,它們的精確度也更高,并有更好的開(kāi)發(fā)工具支持,這使得在中添加語(yǔ)音I/O變得相對容易。在用語(yǔ)音控制家庭環(huán)境照明便是一個(gè)具有市場(chǎng)潛力的應用。

語(yǔ)音識別的類(lèi)型

語(yǔ)音識別(有時(shí)也被稱(chēng)為聲音識別或VR)技術(shù)可分成三大類(lèi):與說(shuō)話(huà)人無(wú)關(guān)(SI)的識別技術(shù)、與說(shuō)話(huà)人相關(guān)(SD)的識別技術(shù)和語(yǔ)音確認(SV)技術(shù)。每種技術(shù)都有各自的優(yōu)點(diǎn),適用于不同的應用。采用SI技術(shù)的產(chǎn)品要求無(wú)需對使用者進(jìn)行培訓便可使用的語(yǔ)音指令。

例如,與說(shuō)話(huà)人無(wú)關(guān)(SI)的識別技術(shù)通常最適合用于照明控制器。就像我們用名字來(lái)引起他人的注意一樣,用一個(gè)被稱(chēng)為“觸發(fā)(trigger)”的SI指令來(lái)激活照明控制器也是一個(gè)不錯的方法。照明控制器被激活后,它可以接受多個(gè)指令。

集成了語(yǔ)音識別的產(chǎn)品通常需要一種方法,以讓使用者知道它們已經(jīng)聽(tīng)到指令并準備接受下一個(gè)指示。也就是說(shuō),它們必須讓使用者知道該產(chǎn)品已在控制流程之中。由于控制流程十分簡(jiǎn)單,照明控制器將用一個(gè)短音作為應答,這可縮短使用者與控制器的交互時(shí)間,而且如果發(fā)生誤啟動(dòng)也不會(huì )導致太大問(wèn)題。

由于語(yǔ)音是人類(lèi)的天生交流方式,所以語(yǔ)音識別可以增加產(chǎn)品的易用性,此外它還延伸了使用者的物理控制范圍。例如,一個(gè)語(yǔ)音控制的照明開(kāi)關(guān)即可提供此類(lèi)價(jià)值?;蛟S使用者正坐著(zhù)看電視,而照明開(kāi)關(guān)不在伸手可及的范圍內,或者環(huán)境太暗,看不到照明開(kāi)關(guān),此時(shí)借助一個(gè)簡(jiǎn)單的語(yǔ)音指令就能方便地解決這些難題。

點(diǎn)擊放大
圖1:一個(gè)典型的具語(yǔ)音識別功能的電燈控制器將采用本流程圖中顯示的步驟進(jìn)行操作。

考慮

因為語(yǔ)音識別建立在概率函數的基礎上,所以者必須在接受指令(包含在識別指令集合中)和拒絕指令(不包含在識別指令集合中)的重要性之間做出折衷。例如,如果該產(chǎn)品必須反應非常靈敏,且偶爾發(fā)生誤接受(誤啟動(dòng))也不會(huì )釀成大問(wèn)題,則應用開(kāi)發(fā)者可能傾向于接受指令更重要些。而其它一些應用則不允許誤啟動(dòng),如聲控烤箱或照明控制器。

背景噪聲是語(yǔ)音識別的克星。檢測和識別均要求信噪比(SNR)在合理的范圍之內(約為3:1或更高)。如果應用條件允許,最好使用定向麥克風(fēng)或近講麥克風(fēng)來(lái)降低噪聲。

成本也是一個(gè)考慮因素。當最終使用者購買(mǎi)產(chǎn)品時(shí),產(chǎn)品價(jià)格已經(jīng)是原始制造成本的4到5倍。幸運的是,目前市場(chǎng)上提供的高集成度語(yǔ)音處理器包含了所必需的麥克風(fēng)前置放大器、模數轉換器(ADC)、數字濾波器、內核處理器、數模轉換器(DAC)和數學(xué)運算引擎。

這些處理器同樣捆綁了從文本輸入到與說(shuō)話(huà)人無(wú)關(guān)(T2SI)的識別及合成技術(shù)。這些芯片也可充當各種消費產(chǎn)品功能的主控制器,而且其價(jià)位對消費來(lái)說(shuō)頗具競爭力。這使得產(chǎn)品在增加語(yǔ)音功能的同時(shí),只增加很少成本,或不增加成本。

照明控制器的原理

這些優(yōu)異的性能使VR照明控制器非常具有吸引力,同時(shí)還有助于解決該應用中的語(yǔ)音識別挑戰。在家庭環(huán)境中,遠距離識別一個(gè)指令意味著(zhù)要排除人說(shuō)話(huà)、電視、音樂(lè )、碗碟碰撞和撞門(mén)等背景噪聲的影響。此外,這類(lèi)應用也必須能適應不同性別的成人和孩子。

語(yǔ)音識別輸出的信號完整性只跟經(jīng)過(guò)處理的信號一樣,因此適當的麥克風(fēng)電路設計是最基本的。麥克風(fēng)電路的設計應使得麥克風(fēng)、偏置電阻和前置放大級的組合電路可以充分利用ADC的輸出位數,即盡可能利用ADC的輸出位數來(lái)達到最佳分辨率,并且不飽和。另外,設計還應考慮到人們輕聲或大聲說(shuō)話(huà)時(shí)的可能功率范圍,以及照明控制器可能被使用的距離范圍(通常最大約為10英尺)。

最好把照明控制器設置成避免誤啟動(dòng),(在嘈雜的環(huán)境中,使用者有時(shí)可能不得不重復發(fā)出指令),利用Quick T2SI工具的設置可實(shí)現這點(diǎn)。保持指令集的規模盡可能小,對盡量減少錯誤指令帶來(lái)的誤操作十分重要,特別是在嘈雜的環(huán)境(如在家中)。為使指令之間的差異最大,T2SI指令在聲音和長(cháng)度方面應盡可能地不同。

最后,照明控制器的邏輯流程必須簡(jiǎn)單、自然,方便使用。為避免使用者混淆,應盡可能減少從引起照明控制器的注意到進(jìn)入活躍指令集狀態(tài)的控制步驟?;钴S指令集應一直包含觸發(fā)字的復本,因而使使用者可以在任何時(shí)候重建自己在該流程中的位置。觸發(fā)字應該很易于地與照明控制功能關(guān)聯(lián)起來(lái),而活躍指令必須是照明控制最常用的。圖1對設計將要用到的流程進(jìn)行了說(shuō)明。

點(diǎn)擊放大
圖2:Sensory公司的VR stamp是一個(gè)低成本的模塊,可通過(guò)加入語(yǔ)音識別所必需的基本功能和組件來(lái)簡(jiǎn)化設計。

硬件設計

為簡(jiǎn)化照明控制器的開(kāi)發(fā),本例中使用了Sensory公司的VR Stamp。VR Stamp是一個(gè)包含Sensory RSC-4128微處理器、音頻電路分立電容和麥克風(fēng)前置放大器、3.58MHz晶振、復位電路及用于存儲程序代碼的128KB閃存的低成本模塊。

VR Stamp還帶有128KB的串行EEPROM存儲器,但在照明控制器應用中沒(méi)有用到它(見(jiàn)圖2)。VR Stamp工具套件包括VR Stamp、集成開(kāi)發(fā)環(huán)境(IDE)、Quick T2SI、FluentChip庫(具有各種語(yǔ)音識別和合成功能,包括T2SI)、VR Stamp編程板和支持文件。

在這個(gè)由語(yǔ)音激活的照明控制器電路中,VR Stamp模塊接受使用者發(fā)出的語(yǔ)音指令,然后提供控制信號來(lái)打/關(guān)燈,并通過(guò)設置占空比來(lái)調節想要的電燈亮度(圖3)。

該電路由120V、60Hz的交流線(xiàn)電源供電。變壓器(T1)和二極管橋(D1)完成從交流到直流的轉換和整流。RSC-4128工作在2.4到3.6V的范圍內。穩壓器(U1)向VR Stamp模塊提供穩定的3.3V電源。3300Ω的電阻(R1)將交流線(xiàn)性電流降低到幾個(gè)毫安,以使RSC-4128能夠檢測電壓何時(shí)出現過(guò)零點(diǎn)。

內部二極管的作用是防止芯片因輸入電壓過(guò)高而損壞。兩端交流開(kāi)關(guān)元件/三端雙向可控硅開(kāi)關(guān)元件對(U2/Q2)在輸出端(P2)控制交流線(xiàn)電流。為濾除VDD上的低頻紋波,必須使用100µF的電容(C3),因為不穩定的VDD將會(huì )耦合到音頻電路中,并將降低語(yǔ)音識別的精確度。

用于語(yǔ)音識別輸入的麥克風(fēng)(MK1)和用于聲音輸出的揚聲器(LS1),實(shí)現該應用的功能模塊。這是一個(gè)被來(lái)用為電燈供電的經(jīng)典電路。通過(guò)延遲啟動(dòng),該電路還可以減弱燈的亮度。本設計實(shí)現了4個(gè)照明開(kāi)關(guān)亮度級別,其中“最亮”和“關(guān)燈”分別采用100%和0%的占空比, “中等亮”和“暗”分別采用大約50%和10%的占空比。

在設計帶有語(yǔ)音識別功能的PCB時(shí),設計者應該記住兩個(gè)設計原則:

1.保持模擬電源和模擬地的穩定 應利用穩壓器使電源信號和地信號盡可能保持穩定。應合理設計PCB布局和走線(xiàn),以使所有的模擬電源和模擬地信號與數字地分開(kāi)。模擬電源和模擬地應分別連接到主電源和主接地上 (對于本應用為穩壓器)。這種連接方式通常被稱(chēng)為“星形接地”。把穩壓器放在盡可能接近VR Stamp的MIC _ RET引腳的地方,并對所有電源和地信號使用粗的電線(xiàn)和PCB走線(xiàn)。

2. 麥克風(fēng)連線(xiàn)盡量短,并帶屏蔽保護 使PCB上所有模擬走線(xiàn)盡可能短是一種好的設計方法。特別是,從麥克風(fēng)的正輸入端到VR Stamp的主音頻信號路徑應該盡可能短。高阻抗音頻信號的振幅僅為幾毫伏的峰峰值。為避免來(lái)自數字噪聲和電磁干擾(EMI)的天線(xiàn)效應,必須使用屏蔽線(xiàn)纜連接麥克風(fēng)與該電路。

VR Stamp被設計用來(lái)利用廉價(jià)的全向駐極體麥克風(fēng)提供出色的識別性能。本應用中選用了松下公司的WM-64PKT,但也可以使用許多其它制造商和其它型號的產(chǎn)品。雖然駐極體麥克風(fēng)要求一個(gè)外部電源驅動(dòng)內部FET緩沖器,但被偏置后,它們也可作為電流源使用。此外,偏置電流控制整個(gè)麥克風(fēng)的靈敏度。在這個(gè)調光開(kāi)關(guān)中,采用了靈敏度為-44dB的麥克風(fēng)。如果采用不同靈敏度的麥克風(fēng),則應按下面的公式修改麥克風(fēng)的偏置電阻(R4):

其中Sensitivity是你想要的麥克風(fēng)靈敏度(在麥克風(fēng)規格中以-dB為單位),R是麥克風(fēng)阻抗,RS是對獲得給定靈敏度所需的麥克風(fēng)偏置電阻(R4)。

麥克風(fēng)的布局也是VR設計成功的關(guān)鍵因素,應記住三個(gè)重要的設計原則。

1. 埋入式安裝 麥克風(fēng)元件應放在盡可能接近安裝面的地方,而且應充分固定在塑料殼體上。在麥克風(fēng)元件和塑料殼體之間不能有任何空隙。

2. 無(wú)障礙物且孔足夠大 為避免影響識別效果,須保證在麥克風(fēng)元件前面的區域內沒(méi)有任何障礙物。麥克風(fēng)前面的外殼的開(kāi)孔直徑至少為5mm。如果必需在麥克風(fēng)前加上塑料表面,應使之盡可能薄,如果可以的話(huà),最好不超過(guò)0.7mm。

3. 隔離 為避免因操作或震動(dòng)產(chǎn)品而產(chǎn)生的聽(tīng)覺(jué)噪聲被麥克風(fēng)“獲取”,麥克風(fēng)與殼體之間應該進(jìn)行隔音。

點(diǎn)擊放大
圖3:由語(yǔ)音激活的照明控制電路中的VR stamp模塊接收使用者口頭指令,提供開(kāi)/關(guān)燈控制信號,并設置燈的亮度。

軟件設計

Sensory公司的VR Stamp可以運行利用FluentChip技術(shù)固件工具和庫所開(kāi)發(fā)的程序。FluentChip程序是利用VR Stamp工具套件所包含的IDE工具所創(chuàng )建和管理的。一個(gè)程序包含一個(gè)或多個(gè)代碼模塊(可以使用匯編語(yǔ)言或C語(yǔ)言編寫(xiě))及其它程序資源,包括面向T2SI識別指令集和SX語(yǔ)音提示的目標數據文件。

T2SI觸發(fā)及指令集是采用Quick T2SI(一個(gè)基于Windows的SI識別指令集創(chuàng )建工具)創(chuàng )建的。為使用這個(gè)基于圖形使用者界面(GUI)的工具,設計者只需把待識別的字或短語(yǔ)鍵入到文本框中,按下“Build”按鈕,一個(gè)定制的SI集合就創(chuàng )建好了。注意的是,應把觸發(fā)字輸入到觸發(fā)字文本框中,把指令輸入到指令文本框中。

可以利用PC對這些字和短語(yǔ)進(jìn)行測試,也可以把它們下載到VR Stamp中進(jìn)行測試。如果一些字難以識別或易于產(chǎn)生混淆,設計者應調節識別字和短語(yǔ)的發(fā)音,并馬上重新測試。Quick T2SI工具也可創(chuàng )建可以鏈接到任何T2SI應用的目標文件。

應把Quick T2SI工具中的“Out of Vocabulary Sensitivity”項設置成“Reject More”或“Reject Most”以減少誤啟動(dòng)。應該對T2SI字進(jìn)行了仔細選擇,以便VR能很容易地區分它們,而且這些字對使用者來(lái)說(shuō)是很自然的。例如,“on”和“off”就不應列入T2SI字,因為兩者的發(fā)音太相似,很易于引起混淆。

如“power”等較長(cháng)的字是更好的選擇。此外,可以把這個(gè)單獨的字用作開(kāi)/關(guān)燈的開(kāi)關(guān)。而其它的指令詞,“dimmer low”、“dimmer medium”、“dimmer high”和“l(fā)ight switch”都足夠長(cháng),差別很大,不太可能引起混淆。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>