<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 消費電子 > 設計應用 > 基于智能語(yǔ)音識別的云電視系統設計

基于智能語(yǔ)音識別的云電視系統設計

作者: 時(shí)間:2017-10-22 來(lái)源:網(wǎng)絡(luò ) 收藏

  為了提高智能電視的可操作性,文章提出了一種基于智能語(yǔ)音設別的系統設計方案。該系統在傳統的智能電視上加入語(yǔ)音輸入和云端網(wǎng)絡(luò )技術(shù),對語(yǔ)音智能處理之后達到操作電視的作用,可以通過(guò)語(yǔ)音輸入自動(dòng)查找或者使用電視功能,提高了智能電視的可操作性,讓智能電視使用更方便,適合更多的使用人群。

本文引用地址:http://dyxdggzs.com/article/201710/367685.htm

  當前,隨著(zhù)計算機和互聯(lián)網(wǎng)技術(shù)的高速發(fā)展、3c融合的趨勢以及電視機的數字化發(fā)展,作為家庭娛樂(lè )核心家電的電視機已經(jīng)開(kāi)始向智能化多媒體網(wǎng)絡(luò )電視方向發(fā)展。智能網(wǎng)絡(luò )電視機是一臺多功能的網(wǎng)絡(luò )終端,用戶(hù)可以通過(guò)該網(wǎng)絡(luò )終端得到諸多信息和服務(wù),然而伴隨應用功能的增加,其操作也隨之變得復雜。面對智能電視的功能復雜、操作難問(wèn)題,僅僅是將電視機的紙質(zhì)說(shuō)明書(shū)或者做成電子文檔以flash形式在電視機上進(jìn)行播放,并沒(méi)有詳細的指引用戶(hù)操作的導航功能,或者說(shuō)有詳細的說(shuō)明,電視面對的是任何消費者,很多功能的操作他們也不是很明白,甚至很多功能都找不到。在電子產(chǎn)品智能化的今天,智能語(yǔ)音設別是一個(gè)熱門(mén)話(huà)題,該技術(shù)的實(shí)現提高了電子產(chǎn)品的可操作性,為用戶(hù)帶來(lái)了更多的方便。所以設計一個(gè)基于智能語(yǔ)音設別的電視系統,用語(yǔ)音來(lái)實(shí)現快速導航到各個(gè)需要的功能、信息、服務(wù)等應用成為當務(wù)之急。

  本系統為基于智能語(yǔ)音設別的系統,將輸入的語(yǔ)音數據傳輸到電視機系統,系統把該模擬語(yǔ)音數據預處理,轉化為數字語(yǔ)音信號,根據各個(gè)模塊需求把數字語(yǔ)音數據發(fā)送到云端,云端經(jīng)過(guò)智能語(yǔ)義識別分析處理之后,返回具體的控制指令給電視予以處理。

  1.系統總體設計

  該電視系統結構圖如圖1所示,該系統分三個(gè)模塊設計,語(yǔ)音設別、電視系統處理、云端處理。在有網(wǎng)絡(luò )連接的情況下,通過(guò)麥克錄入語(yǔ)音,再通過(guò)語(yǔ)音模塊把錄入的語(yǔ)音轉化為特定的語(yǔ)音格式傳輸到云端的中央服務(wù)器,云端服務(wù)器把傳輸過(guò)去的的語(yǔ)音與許多表示特定字符的語(yǔ)音模型進(jìn)行比較,以提供輸入語(yǔ)音所包含特定字符的許多不同可能性。然后,云端服務(wù)器生成一個(gè)字符序列,根據基于字符的語(yǔ)言模型,這個(gè)字符序列表示了輸入語(yǔ)音中所包含已知特定字符的特定序列的不同可能性。然后字符序列通過(guò)網(wǎng)絡(luò )被傳輸到中央服務(wù)器,在這里,字符序列生成一個(gè)詞匯序列,根據詞匯表和基于詞匯的語(yǔ)言模型,這個(gè)詞匯序列表示了輸入語(yǔ)音中所包含已知特定字符的特定序列的不同可能性。然后,云端服務(wù)器根據詞匯表確定哪個(gè)特定詞匯序列與輸入語(yǔ)音最匹配,并將所確定的詞匯序列經(jīng)由網(wǎng)絡(luò )輸送回終端電視機系統,電視機系統再把得到的數據分模塊處理(電視機系統不同模塊有不同的功能)。該電視系統硬件使用MIPS構架CPU,配置Linux操作系統。語(yǔ)音通過(guò)MIC輸入,設計有兩路MIC接口,使用標準的網(wǎng)絡(luò )接口用于網(wǎng)絡(luò )通信。

  2.系統設計

  2.1 基礎知識

  語(yǔ)音設別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音設別,即AutomaTIc Speech RecogniTIon(ASR),其目標是將人類(lèi)語(yǔ)音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話(huà)人設別及說(shuō)話(huà)人確認不同,后者嘗試設別或確認發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內容。

  系統本質(zhì)上是一個(gè)模式識別系統。語(yǔ)音識別一般分兩個(gè)步驟,第一步是系統“學(xué)習”或“訓練”階段。這一階段的任務(wù)是建立識別基本單元的聲學(xué)模型以及進(jìn)行文法分析的語(yǔ)言模型等。第二步是“識別”或“測試”階段。根據識別系統的類(lèi)型選擇能夠滿(mǎn)足要求的一種識別方法,采用語(yǔ)音分析方法提取出這種識別方法所要求的語(yǔ)音特征參數,按照一定的準則和測度與系統模型進(jìn)行比較,通過(guò)判決得出識別結果。

  2.2 語(yǔ)音設別系統設計

  語(yǔ)音設別系統框圖如圖2所示。首先要把電視機麥克輸入的模擬語(yǔ)音信號進(jìn)行預處理,云端需要數字語(yǔ)音信號,這里預處理使用語(yǔ)音IC進(jìn)行處理,包括預濾波、采樣和量化、信號數字化、加窗、斷點(diǎn)檢測、預加重等。語(yǔ)音信號經(jīng)過(guò)預處理后,接下來(lái)重要的一環(huán)就是特征參數提取,其目的是從語(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。把特征提取的結果送到電視機操作系統中進(jìn)行判斷處理,分析是否需要將其傳送到云端服務(wù)器,云端服務(wù)器在對接收到的語(yǔ)音進(jìn)行智能分析處理之后傳回電視機終端,進(jìn)行相應的功能處理。

  2.3 云端服務(wù)器智能處理

  云端服務(wù)器處理主要針對數字化語(yǔ)音數據進(jìn)行分析處理,本系統的功能比較復雜,語(yǔ)音處理工作量非常大,該設計基于云計算的服務(wù)器來(lái)完成,在服務(wù)器端對語(yǔ)音進(jìn)行分析處理的同時(shí)還需要進(jìn)行智能設別,該智能設別主要針對本電視機系統的一些關(guān)鍵字及語(yǔ)音的語(yǔ)義分析,同時(shí)對于電視機的不同模塊進(jìn)行分別處理,來(lái)完成使用者所想的功能。使用云計算服務(wù)器可以減少電視機終端的硬件成本,增加處理速度,來(lái)達到對用戶(hù)命令的智能處理。

  2.3.1 電視機與云端的傳輸協(xié)議

  對于特定的電視機系統,每個(gè)模塊具有特定的關(guān)鍵字,在傳輸數據到云端的時(shí)候,需要傳輸模塊特征和相應的語(yǔ)音數據。

  2.3.2 語(yǔ)音訓練與識別的主要方法

  在云端接收到數據之后,需要對語(yǔ)音數據進(jìn)行設別。語(yǔ)音訓練與識別是一個(gè)模式訓練和識別的過(guò)程。模式訓練是指依照一定的規則,對大量訓練信息進(jìn)行處理,獲取能夠反映該信息本質(zhì)特征的模型參數,將從這些訓練信息中得到的模型參數組合成一個(gè)模式庫,而模式匹配則是指依據一定的規則規范,將輸入的未知模式與模式庫中的模式進(jìn)行匹配,從模式庫中尋找一個(gè)相似度最高,即最佳匹配的模式。這種訓練和匹配的方法有許多種,目前較常見(jiàn)的方法主要有動(dòng)態(tài)時(shí)間規整(DTW)、隱馬爾可夫鏈(HMM)模型、人工神經(jīng)網(wǎng)絡(luò )(ANN)等。

  2.3.3 隱馬爾可夫鏈模型

  本系統用隱馬爾可夫鏈(Hidden Markov Models,HMM)模型來(lái)對語(yǔ)音進(jìn)行訓練和識別,在隱馬爾可夫鏈模型中,它使用馬爾可夫鏈來(lái)模擬信號統計特性的變化,本質(zhì)上它是一個(gè)雙重隨機過(guò)程的概率模型。第一重隨機過(guò)程的概率模型是指由馬爾可夫鏈來(lái)表示狀態(tài)之間的轉移,另外一重隨機過(guò)程的概率模型是指每個(gè)狀態(tài)和多個(gè)觀(guān)測值之間的隨機對應關(guān)系。在實(shí)際問(wèn)題的應用中,HMM的雙重隨機過(guò)程觀(guān)察者不能直接看到狀態(tài),只能看到觀(guān)察值,且只有利用一個(gè)隨機過(guò)程去感知狀態(tài)的存在以及特征。本質(zhì)上說(shuō),人類(lèi)的語(yǔ)言過(guò)程也是一個(gè)雙重隨機過(guò)程。語(yǔ)音信號本身是一個(gè)能夠被觀(guān)測到的時(shí)變序列,是由人的大腦根據語(yǔ)法知識和言語(yǔ)的需要而發(fā)出的音素的參數流,這部分就相對于 HMM模型中不可觀(guān)測的各種狀態(tài)。HMM模型可以很好地模擬這個(gè)雙重隨機過(guò)程,并且很好地描述了語(yǔ)音信號的局部平穩性以及整體的非平穩性,是一種描述語(yǔ)音信號的理想模型。

  2.3.4 智能語(yǔ)音識別

  此處采用的關(guān)鍵字識別系統為基于連續語(yǔ)音識別(LVCSR)的關(guān)鍵詞識別系統,如圖3所示,使用這種結構適用于連續語(yǔ)音關(guān)鍵詞識別系統:語(yǔ)言經(jīng)過(guò)連續語(yǔ)音音節識別器后,產(chǎn)生相應的N-Best詞格或音節網(wǎng)格,然后使用關(guān)鍵詞搜索算法對網(wǎng)格進(jìn)行關(guān)鍵詞搜索。其過(guò)程可以大致分成三步:第一步,搜索語(yǔ)音基元,也就是說(shuō)通過(guò)這次搜索得到輸入語(yǔ)音對應的拼音序列。通過(guò)連續解碼,可以得到一個(gè)N- Best音節序列或者音節的網(wǎng)格。第二步,針對電視機終端功能模塊選擇不同的關(guān)鍵詞表。第三步,根據上一步得到的音節序列和關(guān)鍵詞詞表對照,進(jìn)行關(guān)鍵詞的搜索,得到假象命中(可能成為關(guān)鍵詞的詞)。第四步,根據其他知識源分析第三步得到的假想命中的置信度,給出關(guān)鍵詞識別的結果。第五步,對第四步輸出的關(guān)鍵字結果進(jìn)行智能處理,根據特定的電視機系統功能模塊給出最終的輸出結果。

  3.電視機智能語(yǔ)音識別處理軟件流程

  3.1 錄音檢測

  電視機智能語(yǔ)音識別處理流程圖如圖4,在需要使用語(yǔ)音設別時(shí),首先需要按下錄音鍵,這個(gè)時(shí)候系統會(huì )檢測網(wǎng)絡(luò )是否連接和麥克是否可以正常使用,如果其中有一項檢測失敗,系統不會(huì )做錄音工作,提示檢查網(wǎng)絡(luò )或者檢查麥克。

  3.2 錄音處理

  在設備檢測之后,進(jìn)行錄音,由于系統限制,錄音有時(shí)間限制,不能太長(cháng)。電視機終端把麥克錄下的語(yǔ)音進(jìn)行預處理和特征提取,然后再把語(yǔ)音和模塊特征一起傳輸到云端服務(wù)器,云端服務(wù)器再做細致的處理,處理之后再把數據傳回終端電視機。

  3.3 智能功能處理

  在電視機終端等待接收數據,在5秒之內沒(méi)有接收到數據,視為T(mén)Ime out,數據處理失敗。如果接收到數據后做相應的處理,在云端就有對各個(gè)模塊的關(guān)鍵字識別,將傳回的數據再針對相應的模塊做判斷處理。比如在主功能界面,如果語(yǔ)音輸入“shezhi”,系統將進(jìn)入設置界面?;蛘咴谟耙暯缑?,如果輸入“halibote”,系統會(huì )查找哈利波特這部影片。

  4.實(shí)驗應用

  由于電視系統在使用過(guò)程中情況比較復雜,通過(guò)語(yǔ)音設別的準確率也有一些差異。為了得到相對準確的數據,測試分幾種情況,一種是在電視系統沒(méi)有播放audio的時(shí)候和在播放audio的時(shí)候,另一種是輸入語(yǔ)音的長(cháng)度不一致的情況。

  4.1 測試嘈雜環(huán)境試驗

  這個(gè)測試分兩種情況,一種是沒(méi)有播放audio的時(shí)候(或者說(shuō)audio mute的時(shí)候),一種是在有播放audio的時(shí)候(由于audio播放時(shí)分貝不一樣,所以以各種嘈雜環(huán)境的綜合值為主),實(shí)驗結果見(jiàn)表1:

  4.2 測試改變輸入關(guān)鍵字長(cháng)度試驗

  本系統為智能語(yǔ)音設別,需要做智能分析,通過(guò)輸入語(yǔ)音來(lái)判斷系統的動(dòng)作,關(guān)鍵是在語(yǔ)音設別的準確性和智能識別處理上,而輸入關(guān)鍵字的長(cháng)度對系統的準確性判斷相當關(guān)鍵。本次實(shí)驗就是針對長(cháng)度不一致的輸入做分析,實(shí)驗結果見(jiàn)表2:

  從兩個(gè)測試來(lái)看,系統識別準確率相當高,實(shí)驗達到了預期的效果。關(guān)鍵是在特殊環(huán)境下進(jìn)行處理時(shí),本系統在識別之后還有關(guān)鍵字和智能處理,以達到更好的智能處理。

  5.結語(yǔ)

  該系統采用了高效的語(yǔ)音設別技術(shù)和穩定的MIPS硬件平臺為基礎,軟件設計上以L(fǎng)inux操作系統為基礎,在原有的智能電視系統上使用云計算處理語(yǔ)音數據,使之系統處理實(shí)時(shí)性更高。通過(guò)測試表明,該系統能非常準確地判斷語(yǔ)音輸入,數據處理速度快,系統穩定性高。此系統達到了在電視系統中使用智能語(yǔ)音設別的功能,這樣通過(guò)語(yǔ)音操作,大大提高了系統的可操作性,使之使用方便,更加智能化。



關(guān)鍵詞: 語(yǔ)音識別 云電視

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>