红联Linux门户
Linux帮助

Windows及Linux系统C语言中的中文处理的问题

发布时间:2016-12-30 10:10:43来源:linux网站作者:OOC_ZC
首先Windows下的默认编码是 ANSI,其中中文就是GBK编码。
Linux下中文编码是UTF-8。
换行符的区别。Windows下是\r\n,Linux下是\n。
其中我在Windows下建立的文本文件,在Linux下加一个换行后,用getchar( )查看,还是增加了一个\r\n。
由此猜测换行符是什么取决于在哪个系统下建立。但似乎也不太对。
则比如从UTF-8编码的文本读取汉字,直接输出在Linux下,不会乱码,因为都是UTF-8.
同理,从编码GBK的文件读取,在Windows下也不会乱码。
所以推荐在Windows下保存为GBK,Linux下为没有BOM的UTF-8。
如果汉字直接写在代码里,则汉字的编码就取决于环境,其中vs下为GBK编码,MinGW下为UTF-8编码。
以后了解深入后再补充。
 
Linux 命令
dos2UNIX  file // 把file文件从dos改成UNIX型。 dos为WIN下文件,换行与Linux不同。    
UNIX2dos  file  // 相反。  
iconv -f 原本编码  -t 目标编码  filename  -o newfile  //把filename文件从f变成t编码,新文件保存为newfile  
eg: iconv  -f big5 -t utf8  xx.big5  -o xx.utf8  //
 
本文永久更新地址:http://www.linuxdiyf.com/linux/27366.html