Nuance語(yǔ)音識別技術(shù)
1.語(yǔ)音識別概述
本文引用地址:http://dyxdggzs.com/article/268339.htm語(yǔ)音識別技術(shù),Automatic Speech Recognition,簡(jiǎn)稱(chēng)ASR,是一種讓機器聽(tīng)懂人類(lèi)語(yǔ)言的技術(shù)。語(yǔ)言是人類(lèi)進(jìn)行信息交流的最主要、最長(cháng)用、最直接的方式。語(yǔ)音識別技術(shù)是實(shí)現人機對話(huà)的一項重大突破,在國外近年來(lái)發(fā)展十分迅速,其應用也逐步得到推廣。近幾年逐漸普及的IVR(自動(dòng)電話(huà)應答)處理了不少簡(jiǎn)單而又重復的咨詢(xún)工作,節省了不少人力,但這種按鍵式的語(yǔ)音自動(dòng)應答卻讓客戶(hù)花費很多時(shí)間按指引來(lái)完成簡(jiǎn)單的查詢(xún),令用戶(hù)倍感不便。
語(yǔ)音識別無(wú)疑可以解決該方面的問(wèn)題。語(yǔ)音識別系統的開(kāi)發(fā)成功,充分發(fā)揮了計算機技術(shù)和網(wǎng)絡(luò )技術(shù)的優(yōu)勢,采用先進(jìn)的人機對話(huà)方式,擺脫電話(huà)按鍵的束縛,人們只要象平常一樣對著(zhù)電話(huà)簡(jiǎn)單的說(shuō)出所需服務(wù)項目,即可輕松獲取自動(dòng)系統提供的所需信息。

語(yǔ)音識別系統結構
2.語(yǔ)音識別應用
Nuance公司是自然語(yǔ)音接口軟件的佼佼者。使用自然語(yǔ)音接口軟件,人們可以通過(guò)電話(huà)方便安全地獲取信息、服務(wù)并進(jìn)行交易。每天,千千萬(wàn)萬(wàn)的人通過(guò)撥打運行Nuance公司語(yǔ)音識別、語(yǔ)言理解和聲紋鑒別軟件的電話(huà),進(jìn)行出游預訂、股票交易、與其它通訊媒體、企業(yè)和互聯(lián)網(wǎng)系統進(jìn)行交往等活動(dòng)。NUANCE的應用:美國航空、Bell Atlantic、Charles Schwab、家庭購物網(wǎng)絡(luò )、Lloyds TSB、Sears、UPS.
3.NUANCE語(yǔ)音識別特點(diǎn)
(1)海量詞匯、獨立于講話(huà)者的健壯識別功能
Nuance系統能可靠地對多種語(yǔ)言進(jìn)行大詞匯量的識別,并可提供識別結果的置信度。該系統對商業(yè)上使用的大量詞匯提供最準確的語(yǔ)音識別技術(shù)。利用Nuance系統開(kāi)發(fā)的應用程序,在市場(chǎng)上具有最高的準確率。生產(chǎn)中的應用程序經(jīng)測試,準確性超過(guò)96%.
(2)基于主機的客戶(hù)/服務(wù)機結構
Nuance系統基于開(kāi)放式客戶(hù)/服務(wù)機結構,特別為大型應用程序所需的健壯性和可伸縮性而設計。呼叫者的講話(huà)由客戶(hù)端收集,而識別和鑒別處理的負載被平均分配到網(wǎng)絡(luò )上的多個(gè)分開(kāi)的服務(wù)器上。
(3)N-Best處理
對于有些應用程序,可能需要識別引擎產(chǎn)生可能的識別結果集,而不是一個(gè)最好的結果。Nuance系統的N-best識別處理方法便有這個(gè)功能,它提供了可能的識別結果列表,并按可能性從高到低排列。
(4)語(yǔ)法概率
Nuance系統允許對呼叫者所講的特定詞語(yǔ)或短語(yǔ)的在語(yǔ)法中的概率進(jìn)行指定。當被講的詞語(yǔ)或短語(yǔ)的概率可根據實(shí)際使用進(jìn)行估計時(shí),非常有用。對語(yǔ)法增加概率可提高識別的準確率和速度。
(5)降低噪音
當進(jìn)來(lái)的呼叫包含穩定的背景噪音時(shí),Nuance系統通過(guò)一種機制,使識別服務(wù)器更準確地進(jìn)行識別。識別服務(wù)器將進(jìn)來(lái)的話(huà)語(yǔ)進(jìn)行增強,以有效地將語(yǔ)氣、嗡嗡聲、哼叫聲、噓噓聲等噪聲過(guò)濾。如果相當數量的電話(huà)均含有穩定的背景噪聲,比如在汽車(chē)上免提打電話(huà)時(shí),這個(gè)機制效果較理想。
評論