基于LabVIEW的語(yǔ)音分析平臺的實(shí)現
語(yǔ)音處理是目前信息學(xué)領(lǐng)域的研究熱點(diǎn)和難點(diǎn),其任務(wù)是研究如何利用信號處理技術(shù)研究語(yǔ) 音信號,使未來(lái)的計算機“能聽(tīng)會(huì )說(shuō)”。語(yǔ)音信號的處理是對語(yǔ)音信號進(jìn)行分析,只有通過(guò)分析得到的參數才能做進(jìn)一步的研究。語(yǔ)音分析涉及大量復雜的數學(xué)運 算,如果采用硬件方式實(shí)現,從價(jià)格和靈活性上都不可取。如果通過(guò)計算機軟硬件結合的方法采用主流的編程方式實(shí)現,則存在編程復雜,不易擴展和界面不友好等 問(wèn)題。
本文引用地址:http://dyxdggzs.com/article/193767.htm虛擬儀器是全新概念的最新一代測量?jì)x器,自1987年誕生以來(lái),以前所未有的速度迅猛發(fā)展。虛擬儀器與計算機軟硬件技術(shù)的發(fā)展 同步,他利用計算機強大的計算能力和豐富的軟硬件資源來(lái)組織儀器系統,從而實(shí)現實(shí)驗儀器系統的部分乃至全部的功能,并最終實(shí)現從傳統儀器向計算機的過(guò)渡。 虛擬儀器的測量功能可以由用戶(hù)根據需要自行設計軟件來(lái)定義或擴展,而非由廠(chǎng)家事先定義且固定不可變更。尤其是美國NI公司的圖形化虛擬儀器開(kāi)發(fā)平臺 LabVIEW,不僅編程簡(jiǎn)單功能完備,而且有多種專(zhuān)用軟件包和豐富的各種板卡可供選擇,這就為開(kāi)發(fā)一個(gè)符合要求且界面友好的語(yǔ)音分析平臺提供了便利。
1工作原理
語(yǔ)音信號一般被看作一種短時(shí)平穩的隨機信號,主要是對他進(jìn)行時(shí)域、頻域和倒譜域上的信號分析。
語(yǔ)音信號的時(shí)域分析是對信號從統計的意義上進(jìn)行分析,得到短時(shí)平均能量、過(guò)零率、自相關(guān)函數以及幅差函數等信號參數。根據語(yǔ)音理論,氣流激勵聲道產(chǎn)生語(yǔ) 音,語(yǔ)音信號是氣流與聲道的卷積,因此可以對信號進(jìn)行同態(tài)分析,將信號轉換到倒譜域,從而把聲道和激勵氣流信息分離,獲得信號的倒譜參數。
線(xiàn)性預測編碼分析是現代語(yǔ)音信號處理技術(shù)中最核心的技術(shù)之一,他基于全極點(diǎn)模型,其中心思想是利用若干過(guò)去的語(yǔ)音抽樣來(lái)逼近當前的語(yǔ)音抽樣,采用最小均 方誤差逼近的方法來(lái)估計模型的參數。矢量量化是一種最基本也是極其重要的信號壓縮算法,充分利用矢量中各分量間隱含的各種內在關(guān)系,比標量量化性能優(yōu)越, 在語(yǔ)音編碼、語(yǔ)音識別等方向的研究中扮演著(zhù)重要角色。
語(yǔ)音識別通常是指利用計算機識別語(yǔ)音信號所表示的內容,其目的是準確地理解語(yǔ)音所蘊含的含義。語(yǔ)音識別的研究緊密跟蹤識別領(lǐng)域的最新研究成果并基本與之保持同步。
語(yǔ)音信號分析,首先需要將語(yǔ)音信號采集到計算機并做預先處理,然后通過(guò)選擇實(shí)時(shí)或延遲的方式,實(shí)現上述各種類(lèi)型的參數分析,并將分析結果以圖形的方式輸出或保存,從而實(shí)現整個(gè)平臺的功能。
2系統構成
語(yǔ)音分析平臺由軟、硬件2部分組成,硬件部分的任務(wù)是通過(guò)麥克風(fēng)和聲卡將語(yǔ)音信號轉換為電信號,經(jīng)過(guò)A/D轉換,以數字信號的形式傳入計算機,同時(shí)具備能將語(yǔ)音波形文件通過(guò)聲卡外接耳機或音箱回放。系統框圖如圖1所示。
2.1硬件部分
硬件包括3個(gè)部分:拾音及信號調理電路,A/D轉換電路,PC機接口電路。由于聲卡已經(jīng)成為計算機的標準配置(集成或插卡形式),故采用聲卡、話(huà)筒的組合實(shí)現這部分功能,不但使用簡(jiǎn)便而且省去大量硬件設計工作。
2.2軟件部分
LabVIEW是美國NI公司推出的一種通用虛擬儀器開(kāi)發(fā)軟件,他包含豐富的功能函數庫和完備的總線(xiàn)設備驅動(dòng)程序。LabVIEW的一大特色是其基于圖 形的編程方式是采用數據流(dat astream)而非傳統的文本方式的編程方法。這種編程方式強調信號處理的實(shí)際過(guò)程,有利于簡(jiǎn)化編程,縮短開(kāi)發(fā)時(shí)間和降低開(kāi)發(fā)難度。
LabVIEW的編程包括前面板設計和后臺設計。前面板對應一臺儀器的面板,實(shí)現對儀表的控制和信號的表達功能。LabVIEW提供了一套豐富的控制模 板庫,用戶(hù)通過(guò)這些模板來(lái)設計面板的內容。后臺對應一臺儀器的內部工作部分,用于實(shí)現儀表對信號的采集處理等操作。對應的LabVIEW提供了一套功能模 板庫,用來(lái)幫助用戶(hù)實(shí)現程序改造、儀器控制數據分析等功能。主要的功能模塊如下:
采集與預處理完成語(yǔ)音信號的采集,然后對信號進(jìn)行消噪處理。
時(shí)域處理主要包括短時(shí)分析與預處理、短時(shí)能量、短時(shí)平均幅度和短時(shí)平均過(guò)零率、語(yǔ)音端點(diǎn)檢測、短時(shí)自相關(guān)函數、短時(shí)平均幅度差函數和基音周期估計等。
頻域處理主要包括基于短時(shí)傅里葉分析與重構、復倒譜和倒譜分析、聯(lián)合時(shí)頻分析。
預測與量化主要包括語(yǔ)音信號預測編碼分析和矢量量化。
語(yǔ)音識別主要包括特征表示與提取、譜失真測度、模板匹配技術(shù)、隱馬爾可夫模型技術(shù)、孤立詞及連接詞識別、大詞匯量連續語(yǔ)音識別和說(shuō)話(huà)人識別。
與Matlab軟件接口通過(guò)LabVIEW提供的Script Node子VI連接主流算法仿真分析軟件Matlab,充分發(fā)揮后者強大的數據處理能力。盡管LabVIEW中提供了一些信息處理功能函數,但是畢竟功能 有限,仍無(wú)法滿(mǎn)足用戶(hù)各種各樣的數值計算和分析的需求。而Matlab特別擅長(cháng)數值分析和處理,如果能夠在LabVIEW中調用他的話(huà),不失為一種較好的 解決方法。
軟件在實(shí)現過(guò)程中,充分利用LabVIEW軟件本身所提供的豐富的應用分析工具包如數字濾波器、頻域分析等工具模塊,避免大量的軟硬件開(kāi)發(fā)工作。
3結語(yǔ)
通過(guò)上述方法構建的語(yǔ)音分析平臺,界面豐富友好,操作使用方便,并且能不斷隨著(zhù)虛擬儀器技術(shù)和計算機軟硬件技術(shù)的進(jìn)步而升級。特別重要的是用戶(hù)可以在該平臺上開(kāi)發(fā)驗證新的語(yǔ)音信號分析處理算法。
參考文獻
[1]蔡蓮紅,黃德智,蔡銳.現代語(yǔ)音技術(shù)基礎與應用[M].北京:清華大學(xué)出版社,2003.
[2]易克初,田斌,付強.語(yǔ)音信號處理[M].北京:國防工業(yè)出版社,2000.
[3]劉君華,郭會(huì )軍.基于LabVIEW的虛擬儀器設計[M].北京:電子工業(yè)出版社,2002.
評論