<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 業(yè)界動(dòng)態(tài) > 將意圖轉化為行動(dòng):走進(jìn)嵌入式語(yǔ)音控制的新時(shí)代

將意圖轉化為行動(dòng):走進(jìn)嵌入式語(yǔ)音控制的新時(shí)代

作者:Chris Welsh 時(shí)間:2023-12-01 來(lái)源:電子產(chǎn)品世界 收藏


本文引用地址:http://dyxdggzs.com/article/202312/453493.htm

1701412925643310.png

發(fā)布新一代智能語(yǔ)音技術(shù)組合的語(yǔ)音識別引擎。在這篇博文中,我們將探討開(kāi)發(fā)人員在設計中面臨的挑戰、我們新的Speech to Intent引擎,以及您如何在應用中使用它。

聽(tīng)到您的聲音:嵌入式系統中語(yǔ)音命令的挑戰

隨著(zhù)亞馬遜、谷歌和蘋(píng)果等公司推出了具有革命性意義的智能揚聲器,的設備已經(jīng)成為了當下的熱門(mén)趨勢,而這種技術(shù)其實(shí)已經(jīng)存在了很多年。通過(guò)這些智能揚聲器,終端用戶(hù)第一次體驗到了語(yǔ)音優(yōu)先設備的便捷性、實(shí)用性和直觀(guān)性。語(yǔ)音是這些設備的用戶(hù)界面(UI),也是它們最重要或唯一的交互方式。借助云端的自然語(yǔ)言理解技術(shù),智能揚聲器可以讓語(yǔ)音優(yōu)先設備的終端用戶(hù)用自然語(yǔ)言與智能設備進(jìn)行溝通,無(wú)論是請求、查詢(xún)還是命令,都可以得到理解和響應。

為了實(shí)現自然語(yǔ)言處理,設計人員和終端用戶(hù)需要面對一些挑戰,比如要求有穩定、可靠的網(wǎng)絡(luò )連接,以及要承受始終在線(xiàn)、始終聆聽(tīng)的設備的高耗電,更別提這種聯(lián)網(wǎng)設備可能帶來(lái)的隱私風(fēng)險了。

針對嵌入式設計中的語(yǔ)音引擎難題,推出了其智能語(yǔ)音技術(shù)(VIT)產(chǎn)品組合的最新產(chǎn)品VIT Speech to Intent引擎。進(jìn)一步了解VIT S2I。

本地語(yǔ)音控制與基于云的語(yǔ)音控制比較

為了讓設備具備語(yǔ)音控制功能,工程師通常有三種選擇:本地處理、在云端處理或兩者的組合,我們稱(chēng)之為“混合處理”。通過(guò)本地語(yǔ)音控制,終端設備在邊緣本地處理所有語(yǔ)音,而無(wú)需連接到云端或遠程服務(wù)器進(jìn)行二次處理?;谠频奶幚砭褪抢迷贫说挠嬎隳芰?lái)處理語(yǔ)音音頻,然后把云端生成的響應通過(guò)網(wǎng)絡(luò )傳回設備。在混合處理的情況下,通常會(huì )使用本地喚醒詞引擎來(lái)喚醒設備(如“Hey ”),然后將該喚醒詞之后的所有語(yǔ)音命令流式傳輸到云端或遠程服務(wù)器進(jìn)行處理。

本地處理具有低延遲、低功耗和獨立于網(wǎng)絡(luò )等優(yōu)點(diǎn),但它通常只支持需要精確措辭的基本關(guān)鍵詞和命令。例如,開(kāi)燈可能需要準確的短語(yǔ)“Hey,(喚醒詞),開(kāi)燈(語(yǔ)音命令)”,并且不能有任何變化。

對于云端處理和混合系統,云服務(wù)的使用增加了延遲,但提供了能夠運行極其復雜的算法的優(yōu)勢,包括自然語(yǔ)言理解模型。重溫剛才說(shuō)的開(kāi)燈示例,使用任何詞語(yǔ)組合,系統都可以理解所要求操作的環(huán)境,例如“這里很黑,請開(kāi)燈”。

如前所述,基于云的自然語(yǔ)言處理的一個(gè)主要缺點(diǎn)是安全和隱私問(wèn)題。簡(jiǎn)單地說(shuō),這種方式的原理是把語(yǔ)音音頻流通過(guò)網(wǎng)絡(luò )傳送到遠程服務(wù)器進(jìn)行處理,但是這也可能導致系統誤啟動(dòng)并把無(wú)關(guān)的音頻流傳輸到云端。這些音頻流可能包括個(gè)人對話(huà)、憑證或其他敏感信息。

智能語(yǔ)音技術(shù)(VIT) Speech to Intent (S2I)引擎介紹

針對嵌入式設計中的語(yǔ)音引擎難題,恩智浦推出了其智能語(yǔ)音技術(shù)(VIT)產(chǎn)品組合的最新產(chǎn)品VIT Speech to Intent引擎。S2I引擎是VIT產(chǎn)品組合的高端產(chǎn)品,其中還包括免費的喚醒詞引擎(WWE)和語(yǔ)音命令引擎(VCE)。

與依賴(lài)遠程云服務(wù)的系統不同,VIT S2I能夠在本地確定自然語(yǔ)言的意圖。這一功能要歸功于恩智浦針對嵌入式系統設計的神經(jīng)網(wǎng)絡(luò )算法和機器學(xué)習模型的最新開(kāi)發(fā)成果。因此,要實(shí)現“開(kāi)燈”的目的,可以用很多不同的方式來(lái)表達,比如“開(kāi)燈”、“太暗了”和“你能讓光線(xiàn)更亮嗎”等。

這種Speech to Intent功能使用戶(hù)能夠更自然地與嵌入式系統進(jìn)行交互,同時(shí)降低了系統延遲和云連接系統的功耗。此外,消除云服務(wù)也有助于提高安全性和隱私,因為所有語(yǔ)音都在設備上本地處理。此外,如果搭配恩智浦喚醒詞引擎,可以開(kāi)發(fā)超低功耗設計,只有在聽(tīng)到特定的喚醒詞后,才會(huì )啟動(dòng)VIT S2I引擎來(lái)處理語(yǔ)音命令。

支持VIT S2I的恩智浦器件包括:Arm?Cortex?-M:i.MX RT跨界MCU和RW61x MCU,以及Cortex A i.MX 8M Mini、i.MX 8MPlus和i.MX 9x應用處理器。VIT S2I目前支持英語(yǔ)、普通話(huà)和韓語(yǔ),將于2023年底推出。用于創(chuàng )建自定義命令和訓練模型的在線(xiàn)開(kāi)發(fā)工具計劃于2024年發(fā)布。

image.png

VIT Speech to Intent框圖

VIT Speech to Intent如何為您的下一個(gè)設計增加語(yǔ)音功能

物聯(lián)網(wǎng)領(lǐng)域日新月異,VIT S2I能夠適應各種應用場(chǎng)景,無(wú)論是家居自動(dòng)化、可穿戴電子產(chǎn)品,還是汽車(chē)遠程信息處理和樓宇門(mén)禁等,都能發(fā)揮其優(yōu)勢。消費者喜歡用自然語(yǔ)言來(lái)免手動(dòng)控制設備的基本功能,消除邊緣語(yǔ)音處理的云服務(wù)不僅減少了系統延遲,還減少了隱私和安全問(wèn)題。

對于那些需要使用語(yǔ)音優(yōu)先用戶(hù)界面的設備,VIT S2I系統是一個(gè)不可或缺的部分,它可以應用在智能恒溫器、智能電器、家居自動(dòng)化、燈光控制、遮陽(yáng)控制等領(lǐng)域。VIT S2I也適用于可穿戴設備和健身設備,一些用例包括設置提醒、控制藍牙設備和監測健康狀況。

使用恩智浦的VIT產(chǎn)品組合增強您的應用

如如果您想要使用恩智浦智能語(yǔ)音技術(shù)組合進(jìn)行開(kāi)發(fā),歡迎使用我們免費的VIT喚醒詞和語(yǔ)音命令引擎,通過(guò)MCUXpresso SDK和在線(xiàn)模型工具即可獲得。這些引擎可以讓您方便地定制喚醒詞和基本的語(yǔ)音控制,適用于那些不涉及自然語(yǔ)言理解的快速原型制作和開(kāi)發(fā)周期。如果您的應用需要更多自然語(yǔ)言理解功能,請聯(lián)系當地的恩智浦代表,開(kāi)始使用VIT Speech to Intent。

進(jìn)一步了解恩智浦的語(yǔ)音處理產(chǎn)品組合,并觀(guān)看我們的VIT Speech to Intent演示。

作者:

image.png

Chris Welsh

邊緣處理業(yè)務(wù)部物聯(lián)網(wǎng)語(yǔ)音和音頻業(yè)務(wù)發(fā)展總監

Chris作為Retune DSP公司的合伙人,于2021公司并購時(shí)加入恩智浦。Chris專(zhuān)注于通過(guò)差異化的語(yǔ)音軟件技術(shù)和服務(wù)為客戶(hù)創(chuàng )造價(jià)值。Chris為恩智浦帶來(lái)了超過(guò)25年的嵌入式語(yǔ)音和音頻業(yè)務(wù)經(jīng)驗,他曾經(jīng)在A(yíng)T&T、朗訊科技、MWM聲學(xué)、哈曼國際和Retune DSP等公司擔任工程師、商務(wù)拓展、創(chuàng )始人、總經(jīng)理和高管等職務(wù)。Chris擁有普渡大學(xué)機械工程學(xué)學(xué)士學(xué)位和賓夕法尼亞州立大學(xué)聲學(xué)碩士學(xué)位。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>