Ubuntu Linux系統下文件編碼轉換的技巧
Ubuntu下默認文件編碼是utf-8的,一般的編輯器也都支持gbk,gb2312編碼,但有些時(shí)候還是需要把文檔從默認的gbk格式轉換成utf-8格式的,比如網(wǎng)上下載的電子書(shū)在手機上看會(huì )出現半個(gè)字,轉成utf-8就沒(méi)這個(gè)問(wèn)題了。
本文引用地址:http://dyxdggzs.com/article/201609/305023.htm一般轉換編碼都是用iconv命令來(lái)轉換,命令格式如下
$iconv -f gb18030 -t utf-8 file1.txt > file2.txt
說(shuō)實(shí)話(huà)這個(gè)命令不好使,一方面容易重復轉換,另一方面不支持通配符,無(wú)法成批轉換,文件少了還好說(shuō),要是一大堆文件豈不是要累死?
于是在google上淘寶,淘得一個(gè)更好的傻瓜型命令行工具enca,它不但能智能的識別文件的編碼,而且還支持成批轉換。
1.安裝
$sudo apt-get install enca
2.轉換
命令格式如下
$enca -L 當前語(yǔ)言 -x 目標編碼 文件名
例如要把當前目錄下的所有文件都轉成utf-8
$enca -L zh_CN -x utf-8 *
很簡(jiǎn)單吧。
不過(guò)用的時(shí)候發(fā)現有一部分文件無(wú)法傳轉,具體原因不祥,不過(guò)enca會(huì )把無(wú)法轉換的文件告訴你的。對于這些不能轉的文件,可以用gedit另存為的方式轉,雖然這法笨點(diǎn),但挺好使的。
評論