<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設計應用 > 基于Julius的機器人語(yǔ)音識別系統構建

基于Julius的機器人語(yǔ)音識別系統構建

作者: 時(shí)間:2011-08-19 來(lái)源:網(wǎng)絡(luò ) 收藏

2 框架
2.1 硬件結構
的機器狗控制中Atom Z510為訓練學(xué)習機大腦(1.1 GHz主頻的Intel Atom Z510嵌入式控制平臺),它主要完成的功能。PXA270控制器(Intel公司于2003年底推出的性能強勁的PXA27x系列嵌入式處理器,ARMv5E的XScale內核,最高頻率可達624MHz)作為機器狗本體上的核心智能控制器,接收Atom Z510后的結果,發(fā)出控制命令。ATmega128控制器(Atmel公司的8位系列單片機中的一種,運行頻率16 MHz)完成串行總線(xiàn)的數字舵機控制,完成對機器狗的前后腿以及尾巴等關(guān)節控制。機器狗硬件結構平臺如圖2所示。

本文引用地址:http://dyxdggzs.com/article/161552.htm

b.jpg


2.2 軟件結構
整個(gè)包括3個(gè)模塊:識別模塊、GUI人機界面、控制模塊。將識別的語(yǔ)音命令提交給GUI模塊,并在GUI上顯示;同時(shí)GUI將語(yǔ)音命令轉化為動(dòng)作控制命令并發(fā)給控制模塊;GUI還可以控制的啟動(dòng)和停止。其中機器人控制模塊主要在PXA270上,而語(yǔ)音識別和GUI是在A(yíng)tom Z510上。系統軟件模型如圖3所示。

c.jpg



3 語(yǔ)音識別系統
一個(gè)完整的語(yǔ)音識別系統一般包括3部分:聲學(xué)模型、語(yǔ)言模型和識別器。在本系統中只建立控制命令(動(dòng)詞)的識別語(yǔ)法,其他詞忽略,因此沒(méi)有語(yǔ)言模型;識別器采用Julius開(kāi)源平臺,此部分只用配置參數和相關(guān)文件。本文主要工作是聲學(xué)模型訓練和語(yǔ)音識別系統。
3.1 聲學(xué)模型訓練
聲學(xué)模型是識別系統的底層模型,是語(yǔ)音識別系統中最關(guān)鍵的一部分,它是每個(gè)聲學(xué)單元的聲學(xué)模型參數集合。本系統的聲學(xué)模型是使用HTK對采集的語(yǔ)音庫進(jìn)行多次迭代訓練后提取的,基于詞的聲學(xué)特征向量集。HTK(HMM Tools Kit)是由英國劍橋大學(xué)工程系的語(yǔ)音視覺(jué)和機器人技術(shù)工作組(Speech Vision and Robotics Group)開(kāi)發(fā),專(zhuān)門(mén)用于建立和處理HMM的實(shí)驗工具包,主要應用于語(yǔ)音識別領(lǐng)域,也可用于語(yǔ)音模型的測試和分析。其具體訓練步驟如下:
(1)數據準備
收集漢語(yǔ)標準普通話(huà)的語(yǔ)料庫,并將語(yǔ)料庫中的語(yǔ)音標記,創(chuàng )建語(yǔ)音識別單元元素列表文件。
(2)特征提取
本系統采用MFCC進(jìn)行語(yǔ)音的特征參數提取,訓練中將每一個(gè)語(yǔ)音文件用工具HCopy轉換成MFCC格式。
(3)HMM定義
在訓練HMM模型時(shí)要給出模型的初始框架,本系統中的HMM模型選擇同一個(gè)結構,如圖4所示。該模型包含4個(gè)活動(dòng)狀態(tài){S2,S3,S4,S5),開(kāi)始和結束(這里是S1.S6),是非發(fā)散狀態(tài)。觀(guān)察函數bi是帶對角矩陣的高斯分布,狀態(tài)的可能轉換由aij表示。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>