3G 手機語(yǔ)音識別應用中DSP的選擇策略
除了DSP內核以外的其他要求
在選中最優(yōu)化的DSP后,要想獲得高性能的ASR用系統級芯片還需要增加一些功能,例如快速緩存或快速指令/數據存取以及實(shí)時(shí)操作系統(RTOS)才能使ASR系統真正完成實(shí)時(shí)性能。多任務(wù)RTOS能使系統同時(shí)運行多個(gè)應用如雙通道語(yǔ)音識別,因此能極大地提高系統性能。
復雜SoC應用(如信道處理系統)設計工程師能從使用高效的高級語(yǔ)言編譯器的DSP和SoC中獲益,因為這些編譯器允許設計工程師使用C或C++語(yǔ)言進(jìn)行編程。采用增強的片上仿真和調試功能還可以進(jìn)一步縮短設計時(shí)間。對于3G移動(dòng)手機應用中各層次的元器件與系統設計來(lái)說(shuō),除了實(shí)時(shí)性能和簡(jiǎn)化設計流程外,功率管理控制同樣非常重要。在設計SoC時(shí),選擇具有可調功率功能的內核將獲益非淺。例如當移動(dòng)用戶(hù)在說(shuō)話(huà)時(shí),DSP需要全速運行(如300MHz)。當未使用ASR功能時(shí),SoC電源管理電路可以逐步降低到較低的時(shí)鐘速度(如100MHz),從而有效地降低漏電和功耗。
由于A(yíng)SR系統對計算速度的需求會(huì )根據識別特征的差異產(chǎn)生很大變化,例如孤字識別或連續語(yǔ)音識別、詞匯量和跟講者無(wú)關(guān)的語(yǔ)音識別等,因此,能支持ASR功能的信道處理系統的復雜性變化也很大。
SoC非常適合于構造芯片的基礎架構,因此在以客戶(hù)/服務(wù)器系統為中心的設計中是非常理想的選擇,但SoC器件由于功能太強大,因此并不非常適合于用戶(hù)端以終端為中心的設計。然而,隨著(zhù)ASR系統的逐漸成熟以及3G手機支持越來(lái)越復雜的應用和復雜ASR,這類(lèi)功能強大的SoC也能成功地運用到用戶(hù)端。
在SoC上使用多個(gè)DSP能使系統在完成語(yǔ)音識別的同時(shí)更容易地執行其它任務(wù)。例如三個(gè)內核中的一個(gè)可以專(zhuān)門(mén)指定用來(lái)完成多信道的服務(wù)器端ASR,而其它二個(gè)內核用于執行像語(yǔ)音信道和互聯(lián)網(wǎng)數據處理這樣的任務(wù)。將來(lái)如果手機鍵盤(pán)不復存在的話(huà),ASR將成為用戶(hù)與手機之間的唯一接口,到時(shí)這一功能將占用大部分的工作時(shí)間。
采用多個(gè)DSP內核還能提供強大的計算能力,從而使執行非常復雜的ASR任務(wù)成為可能,如電子郵件聽(tīng)寫(xiě)中的連續語(yǔ)音識別、安全交易和VXML中的“口令+講者驗證”等。多個(gè)DSP再加上統一的大型片上存儲器可以極大地縮短跟講者無(wú)關(guān)的訓練過(guò)程,因為在統計型ASR中訓練過(guò)程的計算負載比識別處理過(guò)程的負載重得多。
本文小結
盡管3G手機要想贏(yíng)得市場(chǎng),人們對其功能和設計仍將拭目以待,但這些系統需要高性能的信號處理平臺以滿(mǎn)足多媒體任務(wù)需求是不容置疑的,而隨著(zhù)ASR系統的不斷普及,3G手機肯定需要具備運行多任務(wù)能力的多DSP SoC作為解決方案。
評論