基于 RTL8723DS +A113 開(kāi)發(fā)的智能音箱模塊設計方案
一、前言
本文引用地址:http://dyxdggzs.com/article/202208/436895.htmAI智能音箱是人工智能與傳統音箱結合的產(chǎn)物。其基本原理是用戶(hù)使用自然語(yǔ)言與機器(即音箱)交流,音箱通過(guò)識別用戶(hù)的語(yǔ)音指令完成相應任務(wù),如點(diǎn)播音樂(lè )、收聽(tīng)新聞、設置日程、查詢(xún)信息等。當今AI智能音箱,已被認為是物聯(lián)網(wǎng)時(shí)代的入口,在去年成為了各大廠(chǎng)商爭相投入的風(fēng)口。因它不僅僅是一臺單純的音樂(lè )播放器,在其背后支撐的 AI 技術(shù)才是整個(gè)產(chǎn)品的核心,也是各大公司覬覦物聯(lián)網(wǎng)入口的最根本原因。經(jīng)歷了2017年的爆發(fā)式增長(cháng),到現在A(yíng)I智能音箱已經(jīng)成為最熱門(mén)的硬件產(chǎn)品之一,因此各種客制化的產(chǎn)品如雨后春筍般的噴涌而出。
二、基于“RTL8723DS +A113”開(kāi)發(fā)的智能音箱模塊設計
鑒于市場(chǎng)的蓬勃發(fā)展,我們審時(shí)度勢,推出基于“RTL8723DS +A113”開(kāi)發(fā)的智能音箱模塊設計,更加方便工程師的應用需求,注意 Amlogic/A113 開(kāi)發(fā)手冊目前只面向 Rokid 開(kāi)發(fā)者提供。如未注冊成為Rokid 開(kāi)發(fā)者,請先至 Rokid 官網(wǎng)注冊成為開(kāi)發(fā)者,具體請訪(fǎng)問(wèn)https://developer.rokid.com/。
1)開(kāi)發(fā)板套件基本參數介紹
1.1. Rokid語(yǔ)音整體方案 通過(guò)接入Rokid智能語(yǔ)音服務(wù),您可以為配有麥克風(fēng)和揚聲器的聯(lián)網(wǎng)硬件設備添加語(yǔ)音交互體驗,使得您的手機、電視、音箱等智能設備輕松擁有語(yǔ)音交互的能力。
· Rokid語(yǔ)音整體方案,融合了從前端硬件的遠場(chǎng)拾音、降噪、回聲消除等技術(shù),到語(yǔ)音識別、語(yǔ)義理解、自然語(yǔ)言合成等AI技術(shù)和iot物聯(lián)網(wǎng)技術(shù),提供硬件到軟件全鏈路解決方案,助力開(kāi)發(fā)者快速實(shí)現產(chǎn)品的智能化。
· Rokid語(yǔ)音整體方案,還針對行業(yè)或者特定場(chǎng)景,提供行業(yè)和場(chǎng)景解決方案,包括傳統制造行業(yè),運營(yíng)商以及互聯(lián)網(wǎng)行業(yè)和智能音箱解決方案、兒童故事機解決方案、智能電視解決方案
同時(shí),平臺還提供了包括內容類(lèi)、工具類(lèi)和互動(dòng)類(lèi)等不同類(lèi)型的垂直語(yǔ)音技能。您的設備接入Rokid后,即可使用眾多豐富有趣的 Rokid 公有技能,您也可以為自己的設備創(chuàng )建個(gè)性化的私有技能。
1.2. 接入方案類(lèi)型
· 全鏈路通用方案:包括前端語(yǔ)音激活/降噪以及 Rokid 語(yǔ)音識別服務(wù)和語(yǔ)音合成服務(wù)的相關(guān)能力。
· 基礎語(yǔ)音模塊:基礎語(yǔ)語(yǔ)音服務(wù)的輸出,包括語(yǔ)音識別服務(wù)和語(yǔ)音合成服務(wù)。
· 全開(kāi)源方案:YODAOS系統,可根據廠(chǎng)商或者個(gè)人開(kāi)發(fā)者的需求,靈活修改,也歡迎開(kāi)發(fā)者一起建設。
· CPU: Amlogic A113X A53x4 up to 1.5Ghz
· Memory: 256MB DDR3 + 512MB Nand Flash
· Mic Array: PDM mic x 4 Audio:line out 3.5mm
· Network:802.11 a/b/g/n/ac
· Bluetooth: BT 4.1/BLE LED: RGB
· LED x 12
· DC in:USB-Type C 5V
? 方案方塊圖
? 原理方框圖
? 核心技術(shù)優(yōu)勢
1,支持實(shí)時(shí)快速、精確的云端識別和遠場(chǎng)拾音, 5米距離識別準確率高達>92%。
2,識別輸出支持流式格式,能夠實(shí)時(shí)地得到當前識別的結果,根據字段判斷是否返回最終結果。
3,為保證用戶(hù)口音和生僻字、方言的識別,針對用戶(hù)粒度配置誤識別較高的糾錯指令,通過(guò)app端的人工干預,進(jìn)行識別的糾正。
4,支持通用領(lǐng)域識別和垂直領(lǐng)域定制識別,定期增加領(lǐng)域數據,快速迭代,持續提升識別率。
? 方案規格
· 模組尺寸小,滿(mǎn)足小尺寸應用場(chǎng)景
· 工作溫度-20℃+70℃;
· 工作電壓3.8V-4.2V,建議4V供電;
· 支持數字音頻和模擬音頻,支持HR,FR,EFR,AMR語(yǔ)音編碼;
· 支持802.11 b/g/n 2.4GHz
· 支持HT20/HT40模式
· 支持低功耗信標監聽(tīng)模式,低功耗接收模式,低功耗掛起模式
· 支持SWD調試端口訪(fǎng)問(wèn)保護和禁止模式
· Wi-Fi和BT共用同一天線(xiàn)
· 支持串口本地升級和遠程固件升級(FOTA)
評論