支持向量機語(yǔ)音識別算法在OMAP5912上的移植
2.4.4 拷貝根文件系統
本文引用地址:http://dyxdggzs.com/article/269115.htm拷貝根文件系統到/data/rootfs2.6目錄下,這時(shí)就可以啟動(dòng)minicom,作為虛擬終端,可以通過(guò)它來(lái)操作開(kāi)發(fā)板。
2.5 修改開(kāi)發(fā)板啟動(dòng)項
bootargs參數設置Linux系統啟動(dòng)時(shí)掛載在NOR Flash上的JFFS2根文件系統。掛載宿主機上的網(wǎng)絡(luò )文件系統,則bootargs參數應設置
setenv bootargs=console=ttyS0,115200n8 noinitrd rw ip=192.168.0.158 root=/dev/nfs nfsroot=192.168.0.204:/data/rootfs2.6.nolock mem=62M
#sayenv保存設置后重啟u-boot,之后將順利進(jìn)入到開(kāi)發(fā)板,調試應用程序。
3 實(shí)驗及結果分析
基于VC++6.0編程實(shí)現一種多類(lèi)分類(lèi)SVMs算法,PC機環(huán)境為Ubuntu version 2.6.27,開(kāi)發(fā)板為Omap5912的ARM926ej-s,其環(huán)境為L(cháng)in-ux version 2.6.18;Boot Loader采用u-boot version 1.1.6;交叉編譯工具鏈arm-linux-gcc version3.4.1。
采用16個(gè)人分別對50個(gè)詞的孤立詞發(fā)音,在不同信噪比下(15、20、25、30 dB和無(wú)噪音)得到的語(yǔ)音數據作為樣本,采用由MFCC特征提取算法得到的特征參數作為識別網(wǎng)絡(luò )的輸入。語(yǔ)音信號采樣率為11.025 kHz,幀長(cháng)N=256點(diǎn),幀移M=128點(diǎn)。詞匯量分別為10、20、30、40和50個(gè)詞。訓練樣本由9人每人對每詞在15、20、25、30 dB、無(wú)噪音下發(fā)音3次得到.測試樣本由另外7人在相應SNR下對每詞發(fā)音3次得到。識別算法采用RBF核函數的SVM算法,采用交叉驗證和網(wǎng)格搜索法進(jìn)行核參數選擇并建立模型,對測試樣本進(jìn)行分類(lèi)識別。核函數參數取最優(yōu)為(c,y)=(32.0,O.000 122 070 312 5)。實(shí)驗結果見(jiàn)表l所示,識別率均在95%以上。表1中同時(shí)列出同樣條件下使用HMM識別網(wǎng)絡(luò )的識別結果。

HMM模型是典型的語(yǔ)音識別模型,它是目前語(yǔ)音識別效果最好的少數幾種方法之一。在相同特征參數下將SVM與HMM模型進(jìn)行對比,從實(shí)驗結果看出:1)SVM比HMM模型具有更高的識別率;2)比較相同信噪比和詞匯量下的測試精度,可發(fā)現HMM模型的測試精度有明顯下降,而SVM的測試結果下降較少,說(shuō)明SVM比HMM模型具有更強推廣性。
4 結束語(yǔ)
提出一種基于SVM的0MAP5912非特定人嵌入式語(yǔ)音識別系統的實(shí)現方法。在搭建的開(kāi)發(fā)環(huán)境下運用SVM算法巾的“一對一”方法進(jìn)行語(yǔ)音識別,獲得良好結果。通過(guò)實(shí)驗可以得出,對中小詞匯量采用MFCC特征參數,“一對一”SVM作為后端識別方法可以得到較好的識別結果,比傳統的HMM模型有明顯優(yōu)勢。同時(shí)SVM算法作為應用程序集成到0MAP5912嵌入式系統里,存儲量需求小,能夠滿(mǎn)足實(shí)用要求。
移動(dòng)電源相關(guān)文章:移動(dòng)電源是什么
評論