红联Linux门户
Linux帮助

Windows文件换行符转Linux换行符

发布时间:2016-08-09 13:44:43来源:linux网站作者:河边一支柳
前段时间,有个朋友碰到由于Windows的换行符和Linux换行符不一样,导致程序编译不通过。这个问题之前自己也碰到过,网上资料也蛮多,不过还是借此总结总结,因为发现总结+实践的方式能够让自己更好的提升。
 
操作系统文件换行符
首先介绍下,在ASCII中存在这样两个字符CR(编码为13)和 LF(编码为10),在编程中我们一般称其分别为'\r'和'\n'。他们被用来作为换行标志,但在不同系统中换行标志又不一样。下面是不同操作系统采用不同的换行符:
Unix和类Unix(如Linux):换行符采用 \n
Windows和MS-DOS:换行符采用 \r\n
Mac OS X之前的系统:换行符采用 \r
Mac OS X:换行符采用 \n
 
Linux中查看换行符
在Linux中查看换行符的方法应该有很多种,这里介绍两种比较常用的方法。
第一种使用"cat  -A [Filename]" 查看,如下图所示,看到的为一个Windows形式的换行符,\r对应符号^M,\n对应符号$.
Windows文件换行符转Linux换行符
第二种使用vi编辑器查看,然后使用"set list"命令显示特殊字符:
Windows文件换行符转Linux换行符
细心的朋友发现了,怎么^M还是没显示出来,这里也是给大家提个醒,用VI的二进制模式(“vi -b [FileName]”)打开,才能够显示出^M:
Windows文件换行符转Linux换行符
 
Windows换行符转换为Linux格式
下面介绍三种方法,选择哪一种看自己喜好,当然你也可以选择第x种。
(1)第一种使用VI: 使用VI普通模式打开文件,然后运行命令"set ff=unix" 则可以将Windows 换行符转换为Linux换行符,简单吧!命令中ff的全称为file encoding。
(2)使用命令"dos2unix",如下所示:
[root@localhost test]# dos2unix gggggggg.txt   
dos2unix: converting file gggggggg.txt to UNIX format ...  
(3)使用sed命令删除\r字符: 
[root@localhost test]# sed -i 's/\r//g' gggggggg.txt   
 
多文件处理换行符转换
通常我们都会有一批文件需要替换,比如一个目录的都要替换,我自己写了一个简单的脚本去遍历目录和子目录下的所有文件,并且将其转换为Linux换行格式。代码如下:
#!/bin/sh
#CheckInput  
#Check Whether the input is valid  
#0 means not valid  
CheckInput()  
{  
ret=1;
#Check the number of parameter  
#And Check whether the argument is a folder  
if [ $# -lt 1 ]   
then  
echo "Please use the command like ./dos2u.sh [Folder]";  
ret=0  
elif [ ! -d $1 ]  
then  
echo "Please use an invalid Folder as the shell argument";  
ret=0  
fi
return $ret;  
}
#TraverseFolder  
#Traser all the files under the folder  
TraverseFolder()  
oldPath=`pwd`  
cd $1;  
for file in `ls`  
do  
if [ -d $file ]  
then   
TraverseFolder $file;  
else  
#echo $file;  
#sed -i 's/\r//g' $file  
dos2unix $file  
fi
done  
cd $oldPath;  
}
CheckInput $*  
if [ $ret -ne 1 ]  
then  
exit -1  
fi
TraverseFolder $1  
这个就纯当练习了,应该可以用更简单的方式去解决,比如find命令+dos2unix命令,小伙伴们可以自己试一试。我这么写主要目的是为了以后有其他需求更便于扩展,当然还有一些bug要修改啦。
 
本文永久更新地址:http://www.linuxdiyf.com/linux/23158.html