車(chē)上設備人機語(yǔ)音接口
隨著(zhù)社會(huì )信息化的不斷深入,車(chē)上設備及其功能不斷增加,駕駛中使用這些設備的頻率很高。由于駕駛員的視覺(jué)和手直接控制駕駛操作,傳統的基于視覺(jué)和手操作的人機接口訪(fǎng)問(wèn)方式,無(wú)法適應駕駛中對不斷增加的車(chē)上設備的訪(fǎng)問(wèn);不僅使用不方便,而且極大地影響安全性,并占用大量的車(chē)上空間。由于駕駛中使用類(lèi)似于手機等設備引發(fā)的事故不斷增加,很多地方禁止駕駛中使用這些設備。在對車(chē)上設備訪(fǎng)問(wèn)方式進(jìn)行評估中,由于語(yǔ)言訪(fǎng)問(wèn)方式不需要視覺(jué)和手的直接介入,安全性、使用方便性以及占用車(chē)上空間等指標遠高于其它方式,被認為是最有發(fā)展潛力的人機接口方式[1][2][3]。語(yǔ)言交流方式也是人類(lèi)最自然的交互方式,隨著(zhù)語(yǔ)音識別和語(yǔ)音合成等相關(guān)技術(shù)的不斷成熟,語(yǔ)言接口將不斷取代目前基于視覺(jué)和手操作的接口?;谡Z(yǔ)言的人機訪(fǎng)問(wèn)接口將是車(chē)上設備人機接口的發(fā)展方向。
隨著(zhù)車(chē)上電子設備與裝置不斷增多,傳統的連接方式已無(wú)法適應線(xiàn)束數量和連接復雜程度的增加,車(chē)上網(wǎng)絡(luò )技術(shù)越來(lái)越受到重視;普遍認為,所有車(chē)上電子裝置將通過(guò)車(chē)上網(wǎng)絡(luò )連接。車(chē)上網(wǎng)絡(luò )協(xié)議以及支撐器件的工業(yè)化和標準化也發(fā)展非???。在不久的將來(lái),所有車(chē)上電子裝置都將通過(guò)車(chē)上網(wǎng)絡(luò )連接。所以本系統與被訪(fǎng)問(wèn)的設備之間采用網(wǎng)絡(luò )連接方式。這有利于本系統與被訪(fǎng)問(wèn)設備的硬件連接和推廣應用。它與車(chē)上網(wǎng)絡(luò )之間通過(guò)標準網(wǎng)絡(luò )協(xié)議進(jìn)行通信。把語(yǔ)音接口納入到車(chē)上網(wǎng)絡(luò )體系中,也是連接語(yǔ)音接口與被訪(fǎng)問(wèn)設備的最有效方式。
車(chē)上語(yǔ)音接口的支撐技術(shù)是小詞匯量語(yǔ)音識別、語(yǔ)音合成和車(chē)上網(wǎng)絡(luò )技術(shù)。小詞匯量語(yǔ)音識別技術(shù)(尤其是孤立詞小詞匯量識別)已經(jīng)達到實(shí)用水平。采用隱馬爾可夫模型的小詞匯量識別可以在非特定人和高噪聲環(huán)境下可靠工作并達到很高的識別率[4]。對于大量的私人用轎車(chē),可以采用特定人識別方式,不僅可以達到更高的識別率,而且可以適應個(gè)人說(shuō)話(huà)口音等因素。車(chē)上網(wǎng)絡(luò )已經(jīng)有較成熟的系統,如CAN 總線(xiàn)、MOST 總線(xiàn)等。而且越來(lái)越多的車(chē)上設備和總成支持網(wǎng)絡(luò )連接方式。這些對與本文介紹的系統將來(lái)在車(chē)上的推廣應用提供了有利的支持。
這方面的技術(shù)是國際上汽車(chē)電子技術(shù)研究的一個(gè)新領(lǐng)域,被認為是將來(lái)車(chē)上人機接口的必然發(fā)展方向,在我國尚未開(kāi)展相關(guān)研究開(kāi)發(fā)工作。對這項技術(shù)進(jìn)行研究,并開(kāi)發(fā)具有自主知識產(chǎn)權的技術(shù)產(chǎn)品,對提高我國汽車(chē)整體技術(shù)水平,提高我國汽車(chē)信息與電子技術(shù)產(chǎn)品的市場(chǎng)競爭力,具有重要意義。將來(lái)在車(chē)上使用語(yǔ)音人機接口方式,已經(jīng)是一種共識,這項技術(shù)的市場(chǎng)潛力巨大。由于在車(chē)上應用語(yǔ)音接口方式的顯著(zhù)優(yōu)點(diǎn),和語(yǔ)音識別與合成技術(shù)已經(jīng)進(jìn)入實(shí)用階段,也就是足以支持這類(lèi)語(yǔ)音接口,國際上各大汽車(chē)公司和相應的配件廠(chǎng)家正展開(kāi)車(chē)上語(yǔ)言人機訪(fǎng)問(wèn)方式一系列相關(guān)技術(shù)的研究,并且取得了一些成果。BOSCH公司最近已經(jīng)開(kāi)發(fā)出了較為實(shí)用的車(chē)用語(yǔ)言操縱系統。SENSORY 等公司開(kāi)發(fā)了適用于車(chē)輛環(huán)境的語(yǔ)音處理器件。這些工作目前還處于開(kāi)發(fā)與完善階段,不久將進(jìn)入市場(chǎng);預計,首先在高檔車(chē)上使用,隨著(zhù)技術(shù)不斷成熟成本將下降很快,然后在其它類(lèi)型車(chē)上廣泛應用。
2 車(chē)上設備與裝置
這個(gè)語(yǔ)音接口訪(fǎng)問(wèn)的車(chē)上設備和功能主要包括通信裝置(如電話(huà))、車(chē)上計算機、車(chē)上媒體裝置(如音響設備、CD 播放機等)、車(chē)上輔助裝置(如空調、車(chē)門(mén)窗、后視鏡等)。語(yǔ)音接口訪(fǎng)問(wèn)的設備不包括駕駛操作中影響安全性的裝置和設備(如轉向、信號、制動(dòng)、加速踏板等)。這個(gè)接口與被訪(fǎng)問(wèn)設備之間按標準車(chē)上網(wǎng)絡(luò )協(xié)議進(jìn)行連接。
車(chē)上語(yǔ)音接口,一方面是一個(gè)駕駛員訪(fǎng)問(wèn)其他設備的界面,另一方面它也是一個(gè)車(chē)用設備。設計中必須遵循汽車(chē)環(huán)境要求的指標。在汽車(chē)環(huán)境下應用的設備必須滿(mǎn)足一些特定的要求,包括:
(1) 高可靠性;
(2) 低成本;
(3) 工作溫度范圍-40~125℃;
(4) 應用方便;
(5) 體積小,安裝靈活;
(6) 滿(mǎn)足環(huán)保和電磁兼容要求;
(7) 駕駛中應用時(shí),基本不分散駕駛員的視覺(jué)和手操縱的注意力;
(8) 在汽車(chē)可能出現的任何狀態(tài)下,它是安全的(不應引起有害后果)。
3 系統功能與操作方式
3.1 車(chē)上語(yǔ)音接口的功能
車(chē)上語(yǔ)音接口的主要功能包括:
(1) 上設備的語(yǔ)言命令控制;即通過(guò)這個(gè)接口,駕駛員可以用語(yǔ)言命令對這些設備進(jìn)行操作。
(2) 表盤(pán);即可以通過(guò)語(yǔ)音方式給出傳統儀表盤(pán)上的各種汽車(chē)狀態(tài)信息,如車(chē)速、燃料狀態(tài)、蓄電池狀態(tài)、故障狀態(tài)信息以及車(chē)上數據庫信息等。
(3) 語(yǔ)音形式的提示與報警功能。
3.2 基本操作方式
這個(gè)語(yǔ)音接口的基本操作為:
(1) 啟動(dòng):當汽車(chē)上電時(shí),這個(gè)系統初始化,并進(jìn)入接受語(yǔ)音命令狀態(tài)。初始化也可以通過(guò)初始化按鍵隨時(shí)重新進(jìn)入。
(2) 初始化完成后,系統可以接受系統控制命令、設備控制命令和信息數據請求命令。
(3) 系統控制命令用于設置和檢查語(yǔ)音接口系統狀態(tài)。
(4) 設備控制命令完成設備訪(fǎng)問(wèn)功能。
(5) 信息數據請求命令完成獲取汽車(chē)狀態(tài)或其他數據庫中信息的訪(fǎng)問(wèn)。
4 車(chē)上語(yǔ)音接口硬件結構
由于這個(gè)接口是通過(guò)車(chē)上網(wǎng)絡(luò )與被訪(fǎng)問(wèn)系統連接,這個(gè)接口本身就是網(wǎng)絡(luò )中的一個(gè)節點(diǎn)。它首先識別輸入的語(yǔ)音命令信息,識別后根據識別的結果發(fā)送訪(fǎng)問(wèn)命令信息。在這個(gè)實(shí)驗系統中,語(yǔ)音接口通過(guò)CAN網(wǎng)絡(luò )與被訪(fǎng)問(wèn)設備連接。系統硬件結構如圖1 所示。它由兩個(gè)信息通路構成,一個(gè)是由駕駛員到被訪(fǎng)問(wèn)設備的控制命令通路,包括拾音器、語(yǔ)音識別、控制信號轉換以及與被控制設備的接口。另一個(gè)是由信息源或設備到駕駛員的反饋信息通路,包括信息獲取設備接口、數據到詞句的轉換以及語(yǔ)音合成和發(fā)音器。語(yǔ)音識別部分完成識別駕駛員命令并轉換為命令代碼的功能。信號轉換部分把命令代碼轉換為能控制對應設備的電信號形式。這個(gè)接口支持數字信號、模擬信號、串行接口信號和CAN 總線(xiàn)網(wǎng)絡(luò )連接方式。
評論