語(yǔ)音識別技術(shù)的研究與發(fā)展
4.5 支持向量機(SVM)
支持向量機是應用統計學(xué)習理論的一種新的學(xué)習機模型,它采用結構風(fēng)險最小化原理(SRM),有效克服了傳統經(jīng)驗風(fēng)險最小化方法的缺點(diǎn),在解決小樣本、非線(xiàn)性及高維模式識別方面有許多優(yōu)越的性能[4]。其基本思想可以概括為:首先通過(guò)非線(xiàn)性變換將輸入空間變換到一個(gè)高維空間,然后在這個(gè)新空間中求取最優(yōu)線(xiàn)性分類(lèi)面,而這種非線(xiàn)性變換是通過(guò)定義適當的內積函數實(shí)現的。目前,統計學(xué)習理論和支持向量機也是國際上機器學(xué)習領(lǐng)域的研究熱點(diǎn)。
5 語(yǔ)音識別所面臨的問(wèn)題
盡管語(yǔ)音識別取得很大成功,但是距離真正的人機自由交流還有很大的距離。例如,目前計算機還需要對用戶(hù)做大量訓練才能更準確識別,用戶(hù)的語(yǔ)音識別率也并不是盡如人意。主要難題有以下幾個(gè)方面:
(1)識別系統的適應性差。主要體現在對環(huán)境依賴(lài)性強,特別在高噪音環(huán)境下語(yǔ)音識別性能還不理想。
(2)語(yǔ)音識別系統從實(shí)驗室演示系統到商品的轉化過(guò)程中,還有許多具體問(wèn)題需要解決。例如,識別速度、拒識等問(wèn)題,還有連續語(yǔ)音中去除不必要語(yǔ)氣詞如“呃”、“啊”等語(yǔ)音的技術(shù)細節問(wèn)題。
(3)語(yǔ)言學(xué)、生理學(xué)、心理學(xué)方面的研究成果已有不少,但如何把這些知識量化、建模并用于語(yǔ)音識別,還需要進(jìn)一步研究。
面對上面的困難,語(yǔ)音識別技術(shù)要做到真正成功,在任何環(huán)境中都能人機進(jìn)行自由地對話(huà),不僅需要語(yǔ)音識別基礎理論的突破,更需要大量的實(shí)際工作的積累。
6 語(yǔ)音識別技術(shù)的前景展望
語(yǔ)音作為當前通信系統中最自然的通信媒介,語(yǔ)音識別技術(shù)是非常重要的人機交互技術(shù)。隨著(zhù)計算機和語(yǔ)音處理技術(shù)的發(fā)展,語(yǔ)音識別系統的實(shí)用性將進(jìn)一步提高。應用語(yǔ)音的自動(dòng)理解和翻譯,可消除人類(lèi)相互交往的語(yǔ)言障礙。國外已有多種基于語(yǔ)音識別產(chǎn)品(如聲控撥號電話(huà)、語(yǔ)音記事本等)的應用,基于特定任務(wù)和環(huán)境的聽(tīng)寫(xiě)機也已經(jīng)進(jìn)入應用階段。這預示著(zhù)語(yǔ)音識別技術(shù)有著(zhù)非常廣泛的應用領(lǐng)域和市場(chǎng)前景。隨著(zhù)語(yǔ)音技術(shù)的進(jìn)步和通信技術(shù)的飛速發(fā)展,語(yǔ)音識別技術(shù)將為網(wǎng)上會(huì )議、商業(yè)管理、醫藥衛生、教育培訓等各個(gè)領(lǐng)域帶來(lái)極大的便利[5],其應用和經(jīng)濟、社會(huì )效益前景非常良好。
參考文獻
[1] 王炳錫,屈丹,彭煊.實(shí)用語(yǔ)音識別基礎[M].北京:國防工業(yè)出版社,2005.
[2] 劉么和,宋庭新.語(yǔ)音識別與控制應用技術(shù)[M].北京:科學(xué)出版社,2008.
[3] 詹新明,黃南山,楊燦.語(yǔ)音識別技術(shù)研究進(jìn)展[J].現代計算機,2008,291(9):43-45.
[4] 柳春.語(yǔ)音識別技術(shù)研究進(jìn)展[J].甘肅科技,2008,24(9):41-43.
[5] 高新濤,陳乖麗.語(yǔ)音識別技術(shù)的發(fā)展現狀及應用前景[J].甘肅科技縱橫,2007,36(4):13.
評論