<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 聆思CSK6大模型多模態(tài)語(yǔ)音交互開(kāi)源SDK介紹

聆思CSK6大模型多模態(tài)語(yǔ)音交互開(kāi)源SDK介紹

發(fā)布人:ListenAI 時(shí)間:2024-06-13 來(lái)源:工程師 發(fā)布文章

聆思CSK6大模型多模態(tài)SDK除了支持語(yǔ)音交互之外,還支持圖像方面的交互,包括對圖像的識別以及圖片生成。用戶(hù)可以通過(guò)語(yǔ)音交互、攝像頭拍照作為交互入口,實(shí)現與大模型的多模態(tài)交互。


SDK主要包含以下功能:

●語(yǔ)音交互:支持按鍵錄音或喚醒后通過(guò)語(yǔ)音與大模型進(jìn)行對話(huà)

●拍照識圖:支持通過(guò)攝像頭拍攝圖像并上傳給大模型進(jìn)行識別,支持依據識圖內容進(jìn)行提問(wèn)

●圖片生成:支持通過(guò)語(yǔ)音交互描述畫(huà)面內容,令大模型生成圖片并顯示至套件屏幕上



語(yǔ)音交互模式支持的語(yǔ)音交互模式

多模態(tài)SDK支持三種交互方式,其特點(diǎn)如下:

模式

喚醒方式

交互方式

按鍵交互

按下屏幕麥克風(fēng)圖標或開(kāi)發(fā)板K3按鍵

按住按鍵說(shuō)話(huà),松開(kāi)提交

語(yǔ)音喚醒(單輪)

喚醒詞 “小美小美”

聽(tīng)到提示音 “在呢” 后進(jìn)行提問(wèn),每次提問(wèn)均需要喚醒

語(yǔ)音喚醒(多輪)

喚醒詞 “小美小美”

聽(tīng)到提示音 “在呢” 后進(jìn)行提問(wèn),可持續對話(huà),當超過(guò)20秒無(wú)語(yǔ)音輸入時(shí)自動(dòng)結束本次交互


語(yǔ)音交互模式的切換

在待機頁(yè)面,下滑可調出下滑菜單,點(diǎn)擊下滑菜單中的 設置圖標,可進(jìn)行配置頁(yè)面:

選中對應的模式后,點(diǎn)擊左上角即可回到待機頁(yè)面并生效。


按鍵交互模式

設置成按鍵交互(按鍵喚醒)模式下,按住屏幕上的麥克風(fēng)按鈕或開(kāi)發(fā)板上的K3按鍵,即進(jìn)入錄音狀態(tài),松開(kāi)按鍵則結束錄音并提交。


語(yǔ)音喚醒模式

當設置為語(yǔ)音喚醒(單輪)語(yǔ)音喚醒(多輪),可通過(guò)喚醒詞 —— “小美小美” 對設備進(jìn)行喚醒,當聽(tīng)到 “在呢” 的提示音后,即可正常進(jìn)行語(yǔ)音輸入。

退出對話(huà)

在使用過(guò)程中,點(diǎn)擊左上角結束本輪對話(huà)回到待機頁(yè)面,此操作會(huì )同步清除本次對話(huà)的上下文信息。



拍照識圖

在待機頁(yè),點(diǎn)擊拍照按鈕即可進(jìn)入取景頁(yè)面,對準要拍照的物體,點(diǎn)擊右側中間的拍照鍵完成抓拍,確認畫(huà)面抓拍正常后(無(wú)晃動(dòng)模糊的情況),點(diǎn)擊右側的 √ 進(jìn)行提交識別:


文生圖

在設備進(jìn)入語(yǔ)音交互狀態(tài)后,可以通過(guò)帶有繪畫(huà)意圖的提示詞讓大模型進(jìn)行作畫(huà),比如:

●“畫(huà)一只熊貓”

●“畫(huà)一個(gè)人正在使用電腦”

SDK資源下載

語(yǔ)音視覺(jué)大模型開(kāi)發(fā)板 SDK:https://cloud.listenai.com/CSKG962172/duomotai_ap/-/tree/master/

DEMO固件下載:https://docs2.listenai.com/x/UzjbjIAxw



*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。




相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>