<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 基于短時(shí)能量和短時(shí)過(guò)零率的VAD算法及其FPGA實(shí)現

基于短時(shí)能量和短時(shí)過(guò)零率的VAD算法及其FPGA實(shí)現

作者:李昱 林志謀 黃云鷹 盧貴主 廈門(mén)大學(xué) 時(shí)間:2008-06-19 來(lái)源:電子設計應用 收藏

  語(yǔ)音激活檢測(Voice Activity Detection)是一種通過(guò)特定的判決準則判斷語(yǔ)音中出現的停頓和靜默間隔,檢測出有效語(yǔ)音部分的技術(shù)。運用這種技術(shù)可以在確保語(yǔ)音質(zhì)量的前提下,對不同類(lèi)別的語(yǔ)音段采用不同的比特數進(jìn)行編碼,從而降低語(yǔ)音的編碼速率。由于在雙工移動(dòng)通信系統中,一方只有35%的時(shí)間處于激活狀態(tài)[1],如何降低靜音期的編碼速率對于減少傳輸帶寬、功率以及容量具有積極的作用,因此技術(shù)在語(yǔ)音通信領(lǐng)域具有重要的使用價(jià)值。隨著(zhù)適合于變比特率語(yǔ)音編碼的CDMA和PRMA等多址技術(shù)的出現,應用于蜂窩的語(yǔ)音激活檢測的重要性也隨之提高[2]。

本文引用地址:http://dyxdggzs.com/article/84500.htm

  由于語(yǔ)音通信的特殊性,要求檢測過(guò)程能達到實(shí)時(shí)性的要求。而目前主流DSP芯片的并行度并不高,因此在實(shí)時(shí)處理的要求下,保證語(yǔ)音質(zhì)量和降低語(yǔ)音的編碼速率兩者難以兼顧。而現場(chǎng)可編程門(mén)陣列()由于其硬件具有可編程的靈活性,可以實(shí)現較高的并行度,從而可以在滿(mǎn)足實(shí)時(shí)性要求的前提下,很好地保證語(yǔ)音質(zhì)量并降低語(yǔ)音的編碼速率。

  1 算法及檢測流程

  1.1 算法簡(jiǎn)述

  語(yǔ)音激活檢測算法可以基于時(shí)域或頻域。本文采用的算法是時(shí)域分析的方法。算法對于輸入信號的檢測過(guò)程可分為檢測和檢測兩個(gè)部分。算法以檢測為主,檢測為輔。根據語(yǔ)音的統計特性,可以把語(yǔ)音段分為清音、濁音以及靜音(包括背景噪聲)三種。在本算法中,檢測可以較好地區分出濁音和靜音。對于清音,由于其能量較小,在短時(shí)能量檢測中會(huì )因為低于能量門(mén)限而被誤判為靜音;則可以從語(yǔ)音中區分出靜音和清音。將兩種檢測結合起來(lái),就可以檢測出語(yǔ)音段(清音和濁音)及靜音段。

  1.2 檢測流程

  檢測流程:對輸入信號先進(jìn)行高通濾波,減弱以噪聲為主的信號能量。接著(zhù)進(jìn)行窗長(cháng)為80個(gè)數據的加窗處理,然后計算該幀的平均能量,再利用短時(shí)能量進(jìn)行初判。若平均能量大于門(mén)限則判為語(yǔ)音幀,若平均能量小于門(mén)限則判為靜音幀。對于初判為靜音幀的幀再進(jìn)行VAD平滑,即參考前三幀的情況:如果前三幀中至少包含一幀非平滑過(guò)的語(yǔ)音幀,則將該幀平滑為語(yǔ)音幀,同時(shí)記錄下該幀為平滑所得的語(yǔ)音幀;反之,則判斷為靜音幀。如果平滑結果仍為靜音幀,且當前幀的過(guò)零率介于30~70之間時(shí),則改判為語(yǔ)音幀;反之則仍判為靜音幀[3]。VAD算法的檢測流程圖如圖1所示。

  此外,由于人耳的聽(tīng)覺(jué)具有掩蔽效應,因此有必要對短時(shí)能量門(mén)限進(jìn)行更新[3]。本算法所采用的門(mén)限更新方式是:如果連續檢測到三幀語(yǔ)音,為了更好地檢測到靜音,將短時(shí)能量門(mén)限提高3dB,但如果提高后的門(mén)限超過(guò)當前幀的平均能量減12dB,則不提高門(mén)限;如果連續檢測到三幀靜音,為了更好地檢測到語(yǔ)音,將短時(shí)能量門(mén)限降低3dB,但如果降低后的門(mén)限小于當前幀的平均能量加12dB,則不降低門(mén)限。此外,為了防止門(mén)限變得太高或降得太低, 還應把門(mén)限限制在GATE_MIN、GATE_MAX范圍內。

  2 系統實(shí)現及優(yōu)化

  本設計采用QuartusII以及ModelSim進(jìn)行開(kāi)發(fā)(ModelSim是Mentor Graphics公司的仿真軟件)。QuartusII是Altera公司的一套開(kāi)發(fā)/CPLD的EDA軟件,可以完成從設計輸入、功能仿真、綜合優(yōu)化、后仿真、引腳配置、布局布線(xiàn)到配置芯片的一系列/CPLD的開(kāi)發(fā)流程,并提供調用其他EDA工具,如ModelSim、Synplify/Synplify Pro、FPGA Complier的接口。

  本設計的輸入為16位PCM編碼的數字語(yǔ)音信號,輸出是每80個(gè)數據為一幀的語(yǔ)音信號的檢測結果,其中高電平表示語(yǔ)音,低電平表示靜音。根據所用算法的特點(diǎn),將本設計劃分成五個(gè)模塊:模塊、高通濾波模塊、平均能量模塊、判決模塊以及控制模塊。系統結構框圖如圖2所示。

  2.1 模塊

  輸入的語(yǔ)音信號的采樣率為8kHz,如果將8kHz作為系統的時(shí)鐘頻率,極大地削弱了FPGA芯片的速度優(yōu)勢。因此系統需要兩個(gè)時(shí)鐘,一個(gè)是頻率為8kHz的采樣時(shí)鐘,另一個(gè)為系統主時(shí)鐘。

  在FPGA設計中,多時(shí)鐘設計會(huì )帶來(lái)不穩定的隱患。為了提高系統的穩定性,本設計采用一個(gè)雙口的作時(shí)鐘隔離。FIFO模塊具有16位的數據輸入口及16位的數據輸出口、8kHz時(shí)鐘輸入口以及系統主時(shí)鐘輸入口。此外,由于FIFO的讀速度大于寫(xiě)速度,因此當FIFO為空時(shí),需要輸出一個(gè)empty信號。

  在高通濾波、平均能量計算、判決、控制這四個(gè)模塊中均可采用單時(shí)鐘設計,而且所使用的時(shí)鐘均為系統主時(shí)鐘。

  2.2 模塊

  對輸入信號進(jìn)行高通濾波的預處理。高通的傳輸函數采用CS-ACELP算法所使用的傳輸函數[4]:


上一頁(yè) 1 2 3 下一頁(yè)

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>