<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 人工智能可以取代同傳翻譯嗎?

人工智能可以取代同傳翻譯嗎?

作者: 時(shí)間:2019-01-02 來(lái)源:網(wǎng)絡(luò ) 收藏
編者按:人工智能或機器翻譯技術(shù)在自然語(yǔ)言處理上,的確有許多突破。這些突破給人希望,讓人暢想未來(lái),但是,短期內的價(jià)值,更多體現在輔助翻譯等領(lǐng)域。

  前陣子,一位同傳翻譯員聲討“AI同傳造假”,在網(wǎng)上引起了軒然大波。和同傳翻譯由此成為大家熱議的話(huà)題。今天,我們來(lái)談一談“翻譯是否真的可以取代同傳翻譯員”?

本文引用地址:http://dyxdggzs.com/article/201901/396239.htm

  同聲傳譯有多難?

  同聲傳譯最早出現在一戰后的巴黎和會(huì )上,英法兩國代表借助同聲傳譯人員的幫助,完成了緊張的談判。

  如今,該技術(shù)依然在國際會(huì )議上扮演著(zhù)極其重要的角色。據統計,95%的國際會(huì )議都有專(zhuān)業(yè)同聲傳譯人員助力。

  同傳翻譯員在臺上能夠將同傳能力運用自如,需要平時(shí)大量的艱苦練習,即使是雙語(yǔ)運用自如的專(zhuān)業(yè)人員,在實(shí)戰之前,也要進(jìn)行數年的鍛煉。他們不僅需要事先學(xué)習、熟悉會(huì )議資料,還需要隨機應變的能力。同聲傳譯的工作方式也比較特殊,因為壓力巨大,一般多人協(xié)同,在一場(chǎng)數小時(shí)的過(guò)程中,每人輪流翻譯幾十分鐘。

  相較之下,普通的口譯工作則要簡(jiǎn)單不少。機器翻譯如能代替同聲傳譯無(wú)疑具有巨大的價(jià)值。

  翻譯的水平如何?

  那么,人工智能同傳翻譯的能力究竟怎樣?會(huì )不會(huì )搶走同傳翻譯員的飯碗呢?

  今年上半年的博鰲亞洲論壇上,首次出現了AI同傳。然而,現場(chǎng)配備的系統卻掉了鏈子,鬧出詞匯翻譯不準確、重復等低級錯誤。

  客觀(guān)來(lái)講,人工智能或機器翻譯技術(shù)在自然語(yǔ)言處理上,的確有許多突破。這些突破給人希望,讓人暢想未來(lái),但是,短期內的價(jià)值,更多體現在輔助翻譯等領(lǐng)域。

  當然,目前機器翻譯已經(jīng)取得非常大的進(jìn)步,在衣食住行等常用生活用語(yǔ)上的中英翻譯可以達到大學(xué)六級的水平,能夠幫助人們在一些場(chǎng)景處理語(yǔ)言交流的問(wèn)題,但距離人工同傳以及高水平翻譯所講究的“信、達、雅”,還存在很大的差距。

  目前的差距是由現有技術(shù)水平的限制決定的,機器翻譯,又稱(chēng)為自動(dòng)翻譯,是利用計算機將一種語(yǔ)言轉換為另一種語(yǔ)言,機器翻譯技術(shù)的發(fā)展與計算機技術(shù)、信息論、語(yǔ)言學(xué)等學(xué)科的發(fā)展緊密相關(guān)。從早期的詞典匹配,到結合語(yǔ)言學(xué)專(zhuān)家梳理的知識規則,再到基于語(yǔ)料庫的統計學(xué)方法,隨著(zhù)計算能力的提升和多語(yǔ)言信息的積累,機器翻譯技術(shù)開(kāi)始在一些場(chǎng)景中提供便捷的翻譯服務(wù)。

  新世紀以來(lái),隨著(zhù)互聯(lián)網(wǎng)的普及,互聯(lián)網(wǎng)公司紛紛成立機器翻譯研究組,研發(fā)了基于互聯(lián)網(wǎng)大數據的機器翻譯系統,從而使機器翻譯真正走向實(shí)用,市場(chǎng)上開(kāi)始出現比較成熟的自動(dòng)翻譯產(chǎn)品。近年來(lái),隨著(zhù)深度學(xué)習的進(jìn)展,機器翻譯技術(shù)得到了進(jìn)一步的發(fā)展,促進(jìn)了翻譯質(zhì)量的提升,使得翻譯更加地道、流暢。

  機器翻譯的難點(diǎn)在哪里?

  這里,簡(jiǎn)單介紹一下機器翻譯的難點(diǎn)。整個(gè)機器翻譯的過(guò)程,可以分為語(yǔ)音識別轉換、自然語(yǔ)言分析、譯文轉換和譯文生成等階段。在此,以比較典型的、基于規則的機器同傳翻譯為例(參見(jiàn)下圖),模塊包含了:語(yǔ)音識別(語(yǔ)音轉換為文本)、自然語(yǔ)言處理(語(yǔ)法分析、語(yǔ)義分析)、譯文轉換、譯文生成和語(yǔ)音生成等模塊。其中的技術(shù)難點(diǎn)主要是:語(yǔ)音識別、自然語(yǔ)言處理和譯文轉換等步驟。

  


  第一個(gè)技術(shù)難點(diǎn)是語(yǔ)音識別。近二十年來(lái),語(yǔ)音識別技術(shù)取得了顯著(zhù)進(jìn)步,開(kāi)始進(jìn)入家電、汽車(chē)、醫療、家庭服務(wù)等各個(gè)領(lǐng)域。常見(jiàn)的應用系統有:

  語(yǔ)音輸入系統,相對于鍵盤(pán)輸入方法,它更符合人的日常習慣,也更自然、更高效;

  語(yǔ)音控制系統,即用語(yǔ)音來(lái)控制設備的運行,相對于手動(dòng)控制來(lái)說(shuō)更加快捷、方便,可以用在諸如工業(yè)控制、語(yǔ)音撥號系統、智能家電、聲控智能玩具等許多領(lǐng)域;

  智能對話(huà)查詢(xún)系統,根據客戶(hù)的語(yǔ)音進(jìn)行操作,為用戶(hù)提供自然、友好的數據庫檢索服務(wù),例如家庭服務(wù)、旅行社服務(wù)系統、訂票系統、銀行服務(wù)等。

  可以說(shuō),語(yǔ)音識別技術(shù)與其他自然語(yǔ)言處理技術(shù)相結合,可以構建出很多復雜的應用。

  然而,語(yǔ)音識別的主要難點(diǎn)就是對自然語(yǔ)言的識別和理解。首先必須將連續的講話(huà)分解為詞、音素等單位,其次要建立一個(gè)理解語(yǔ)義的規則。由于語(yǔ)音信息量大,語(yǔ)音模式不僅對不同的說(shuō)話(huà)人不同,對不同場(chǎng)景的同一說(shuō)話(huà)人也是有差異的。

  例如,一個(gè)人在隨意說(shuō)話(huà)和認真說(shuō)話(huà)時(shí)的語(yǔ)音特征是不同的。另外,說(shuō)話(huà)者在講話(huà)時(shí),不同的詞可能聽(tīng)起來(lái)是相似的,這也是常見(jiàn)現象。單個(gè)字母或詞、字的語(yǔ)音特性,受上下文的影響,以致改變了重音、音調、音量和發(fā)音速度等。最后,環(huán)境噪聲和干擾對語(yǔ)音識別也有較大影響,致使識別率低。

  第二個(gè)技術(shù)難點(diǎn)是語(yǔ)義解析,這是智能化的機器翻譯系統的核心部分。目前,機器翻譯系統可劃分為基于規則和基于語(yǔ)料庫兩大類(lèi)。前者以詞典和語(yǔ)言知識規則庫為基礎;后者由經(jīng)過(guò)劃分并具有標注的語(yǔ)料庫構成知識源,以統計學(xué)的算法為主。

  機譯系統是隨著(zhù)語(yǔ)料庫語(yǔ)言學(xué)的興起而發(fā)展起來(lái)的。目前,世界上絕大多數機譯系統都采用以規則庫為基礎的策略,一般分為語(yǔ)法型、語(yǔ)義型、知識型和智能型。不同類(lèi)型的機譯系統,由不同的成分構成。抽象地說(shuō),所有機譯系統的處理過(guò)程都包括以下步驟:對源語(yǔ)言的分析或理解,在語(yǔ)言的語(yǔ)法、語(yǔ)義和語(yǔ)用等平面進(jìn)行轉換,按目標語(yǔ)言結構規則生成目標語(yǔ)言。

  當前,Google 的在線(xiàn)翻譯已經(jīng)為人熟知,其第一代的技術(shù)即為基于統計的機器翻譯方法,基本原理是通過(guò)收集大量的雙語(yǔ)網(wǎng)頁(yè)作為語(yǔ)料庫,然后由計算機自動(dòng)選取最為常見(jiàn)的詞與詞的對應關(guān)系,最后給出翻譯結果。

  不過(guò),采用該技術(shù)目前仍無(wú)法達到令人滿(mǎn)意的效果,經(jīng)常鬧出各種翻譯笑話(huà)。因為,基于統計的方法,需要建立大規模的雙語(yǔ)語(yǔ)料庫,而翻譯模型、語(yǔ)言模型參數的準確性直接依賴(lài)于語(yǔ)料的規模及質(zhì)量,翻譯質(zhì)量直接取決于模型的質(zhì)量和語(yǔ)料庫的覆蓋面。

  除了上述傳統的方式,2013年以來(lái),隨著(zhù)深度學(xué)習的研究取得較大進(jìn)展,基于人工神經(jīng)網(wǎng)絡(luò )的機器翻譯逐漸興起。就當前而言,廣泛應用于機器翻譯的是長(cháng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò )。該模型擅長(cháng)對自然語(yǔ)言建模,把任意長(cháng)度的句子轉化為特定維度的浮點(diǎn)數向量,同時(shí)“記住”句子中比較重要的單詞,讓“記憶”保存比較長(cháng)的會(huì )話(huà)時(shí)間。該模型較好地解決了自然語(yǔ)言句子向量化的難題。

  其技術(shù)核心是通過(guò)多層神經(jīng)網(wǎng)絡(luò ),自動(dòng)從語(yǔ)料庫中學(xué)習知識。一種語(yǔ)言的句子被向量化之后,在網(wǎng)絡(luò )中層層傳遞,經(jīng)過(guò)多層復雜的傳導運算,生成譯文。這種翻譯方法最大的優(yōu)勢在于譯文流暢,更加符合語(yǔ)法規范。相比之前的翻譯技術(shù),質(zhì)量有較高的提升。

  智能同傳翻譯離我們還有多遠?

  需要說(shuō)明的是,很多人對機器翻譯有誤解,認為機器翻譯偏差大。其實(shí),機器翻譯運用語(yǔ)言學(xué)知識,自動(dòng)識別語(yǔ)法,模擬語(yǔ)義理解,進(jìn)行對應翻譯,因語(yǔ)法、語(yǔ)義、語(yǔ)用的復雜性,出現錯誤是難免的。就已有的成果來(lái)看,全場(chǎng)景通用的機器翻譯,其翻譯質(zhì)量離終極目標仍相差甚遠。

  隨著(zhù)全球化網(wǎng)絡(luò )時(shí)代的到來(lái),語(yǔ)言障礙已經(jīng)成為二十一世紀社會(huì )發(fā)展的重要瓶頸,實(shí)現任意時(shí)間、任意地點(diǎn)、任意語(yǔ)言的無(wú)障礙自由溝通是人類(lèi)追求的一個(gè)夢(mèng)想。這僅是全球化背景下的一個(gè)小縮影。在社會(huì )快速發(fā)展的進(jìn)程中,機器翻譯將扮演越來(lái)越重要的角色。



關(guān)鍵詞: 人工智能 科大訊飛

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>