1.查看文件编码方式
file **.txt
2.修改文件编码方式
2.1.编码的问题
GB2312是国家制定的汉字编码标准,使用双子节进行编码,共收入6763个汉字和682个非汉字图形字符。GBK即对国标编码的扩展,在GB2312的基础上进行扩展形成的,使用双子节编码方式,共收入21003个汉字,从而大大满足了汉字使用的需要。
如上图所示:
文件编码为iso8859
ps:我想直接iso8859转换编码不行,于是曲线救国了一下,说没有这个字符集,可能是我打错了吧
iso8859采用单字节编码
gb2312采用双字节编码,兼容iso8859
而GBK是对gb2312的扩展,在双字节上增加了更多的汉字
所以可以采用GBK的方式进行转码
最好提前备份一下
cp /home/ubuntu/Downloads/test2.txt /home/ubuntu/Downloads/test2cp.txt
开始修改
sudo iconv -f 'gbk' -t 'utf-8' 源文件 > 目标文件
比如:sudo iconv -f ‘gbk’ -t ‘utf-8’ Downloads/test2.txt > Downloads/123.txt
可以看到文件编码方式的改变。