红联Linux门户
Linux帮助

CentOS 6.4安装搭建Scrapy 0.22环境

发布时间:2015-08-09 15:48:52来源:linux网站作者:linux人

Scrapy是一个开源的机遇twisted框架的python的单机爬虫,该爬虫实际上包含大多数网页抓取的工具包,用于爬虫下载端以及抽取端。

CentOS 6.4 安装搭建 Scrapy 0.22 环境过程记录,希望对大家有所帮助。


一、安装Python2.7.6

1.更新CentOS lib库文件

yum -y update

2.安装开发工具包

yum groupinstall -y development

3.安装扩展包

yum install -y zlib-dev openssl-devel sqlite-devel bzip2-devel

4.下载Python2.7.6

wget http://www.python.org/ftp/python/2.7.6/Python-2.7.6.tar.xz

5.解压Python2.7.6

tar -xvf Python-2.7.6.tar.xz

6.进入Python2.7.6目录

cd Python-2.7.6

7.编译安装Python2.7.6

./configure

make && make altinstall


二、解决Yum不支持Python2.7的问题

1.将老的Python程序进行备份

mv /usr/bin/python /usr/bin/python2.6.6

2.建立新的Python链接

ln -s /usr/local/bin/python2.7 /usr/bin/python

3.修改/usr/bin/yum文件

vi /usr/bin/yum

将第一行的 #!/usr/bin/python 改为 #!/usr/bin/python2.6.6

CentOS 6.4安装搭建Scrapy 0.22环境


三、安装setuptools 和 pip

1.下载setuptools

wget --no-check-certificate https://pypi.python.org/packages/source/s/setuptools/setuptools-1.4.2.tar.gz

2.解压setuptools

tar -xvf setuptools-1.4.2.tar.gz

3.进入setuptools目录

cd setuptools-1.4.2

4.通过已安装的Python2.7.6安装setuptools

python setup.py install

5.安装 pip

easy_install pip

6.curl https://raw.github.com/pypa/pip/master/contrib/get-pip.py | python2.7 -


四、安装libxslt-devel支持lxml

yum install libxslt-devel


五、安装Scrapy

pip install scrapy


如何在Ubuntu 14.04 LTS安装网络爬虫工具:Scrapy:http://www.linuxdiyf.com/linux/9985.html