AI助力考古:MIT谷歌用神經(jīng)網(wǎng)絡(luò )破譯失傳古文字
人工智能技術(shù)正在被用來(lái)破譯失傳已久的古文字。
本文引用地址:http://dyxdggzs.com/article/201907/402625.htm近日,麻省理工學(xué)院和谷歌人工智能實(shí)驗室的研究人員提出了一種自動(dòng)破譯失傳文字的神經(jīng)網(wǎng)絡(luò )算法。這一算法首次實(shí)現了古希臘邁錫尼文明時(shí)期“線(xiàn)形文字B”的自動(dòng)翻譯,準確地把67.3% 的線(xiàn)形文字B同源詞翻譯成了希臘語(yǔ)。下一步,人工智能和機器學(xué)習技術(shù)可能會(huì )被用來(lái)解密至今仍未被破譯的古文字。
線(xiàn)形文字B大約出現在公元前1400年后,于1953年被語(yǔ)言學(xué)家邁克爾·文特里斯破譯。麻省理工學(xué)院和谷歌人工智能實(shí)驗室的實(shí)驗是自動(dòng)翻譯線(xiàn)形文字B的首次嘗試。
據《麻省理工科技評論》報道,1886年,英國考古學(xué)家阿瑟·埃文斯(Arthur Evans)偶然發(fā)現了地中??死锾貚u上的大量刻字石頭和石碑。后續研究中,他和其他研究者認定這些石頭和石碑由兩種不同文字寫(xiě)就。更古老的那一種后來(lái)被稱(chēng)作“線(xiàn)性文字A”,可追溯到公元前1800年至公元前1400年,另一種被命名為“線(xiàn)形文字B”,大約出現在公元前1400年后。
針對這兩種文字的早期破譯工作都宣告失敗。直到1953年,一位業(yè)余語(yǔ)言學(xué)家邁克爾·文特里斯(Michael Ventris)成功破譯了線(xiàn)形文字B。他的成功源于兩個(gè)重要的推斷。首先,文特里斯推測線(xiàn)形文字B詞匯表中許多重復單詞是克里特島上的地名,這一推測后來(lái)被證明是正確的。其二,他假設線(xiàn)形文字B記錄了古希臘與的早期形式,這個(gè)想法隨即幫助他破譯了剩余的文字。
這次,麻省理工學(xué)院人工智能實(shí)驗室博士羅佳鳴、麻省理工學(xué)院教授Regina Barzilay和谷歌大腦的曹原以歷史語(yǔ)言學(xué)中記錄的語(yǔ)言變化模式為依據,利用序列對序列表達模型捕獲同源詞之間的字符級對應關(guān)系,建立了一種自動(dòng)破譯失傳古文字的神經(jīng)網(wǎng)絡(luò )算法。
論文介紹,研究人員在模型中輸入失傳文字和已知相關(guān)語(yǔ)言中的非并行語(yǔ)料,模型再根據失傳文字與已知語(yǔ)言中的對應詞之間的對齊精度進(jìn)行評估。
這種方法不僅準確地把67.3% 的線(xiàn)形文字B同源詞翻譯成了希臘語(yǔ),還被用來(lái)翻譯公元前15世紀的烏加里特語(yǔ),翻譯結果比傳統方法提升了5.5%。
研究人員表示,他們的方法也顯示了對羅馬語(yǔ)言翻譯工作的改進(jìn)作用。
評論