随着web应用的不断发展,我们经常需要转换编码格式。最初有debian开始的libiconv已经在各种平台上都可以应用了。对于C/C++代码来说这个库是一个福音,省去编码转换的很大麻烦。其中shell下就有iconv命令,具体用法是 iconv -f UTF-8 -t GBK from.txt -o to.txt. 含义是utf-8(from.txt) 编码转换成 GBK(to.txt). 这个lib几乎支持世界上所有编码格式之间转换 ,功能非常强大。但特别要注意的是两个编码格式是否都定义你了要转换的文字,否则你会失败!
库的头文件包括在 iconv.h中,简单使用方法如下
char in_buf[1024];
char out_buf[1024*2];
char *in_ptr = in_buf;
char *out_ptr = out_buf;
cd = iconv_open( "UTF-8","GB2312"); //把GB2312的字符转换成UTF-8
iconv( cd, &in_ptr, (size_t *)&in_len, &out_ptr, (size_t *)&out_len);
iconv_close(cd);
经常犯的的错误是illegal input sequence at position。这表明你提供的字符串不是要转换的编码格式,或者你含有该字符集没有包含的文字。比如你把GBK中汉字当作了GB2312,这时候就会死活转换不成功。