虚拟环境:
虚拟环境是用于创建独立的python环境,允许我们使用不同的python模块和版本,而不混淆。
让我们了解一下产品研发过程中虚拟环境的必要性,在python项目中,显然经常要使用不同的python库(包装器)来完成工作,但结局并不总是圆满的,大部分时候,我们会面临着诸如python应用无法在新的机器(操作系统)上运行的环境问题,这是新机器上Python库的依赖问题导致的。为了更好的理解,设想在开发python应用的过程当中,我们使用了python pandas(python的数据分析库)0.18.0版本中的函数,而这个函数在新机器安装的0.17.1的python pandas库里没有,由于版本差异,python应用就无法在新机器上运行。
要解决这个问题,我们需要使用一个包含了项目所需的所有东西的python环境,从而可以有序独立地运行。
python项目开发,不管你要忙于多少个项目,使用虚拟环境都是非常推荐的一种方式。
在Ubuntu系统下,创建虚拟环境相当简单,使用virtualenv就可以了(一个创建独立python环境的工具)。
关于virtualenv:
virtualenv通过创建隔离的环境解决项目的依赖冲突问题,这些隔离的环境包括python开发者项目所需的所有工具。用这个工具创建的虚拟环境包括新的python二进制文件,其实是整个python标准库的拷贝。
安装virtualenv:
$ sudo pip install virtualenv
现在我们已经成功安装了virtualenv,现在我们创建一个文件夹(环境),我们将安装python数据挖掘包。
创建虚拟环境:
$ virtualenv dataaspirant_venv
在当前路径下会创建一个文件夹,包含了python的可执行文件和pip库,便于你安装其他包。虚拟环境的名称可以是任何名称,在这个例子中,名为dataaspirant_venv,省略名称的话,文件就会默认放在当前目录。
这将创建一个在任何路径下都可以命令运行的python拷贝,只不过是把它放在了一个名为dataaspirant_venv的文件夹里。
使用虚拟环境
要使用虚拟环境,执行以下命令:
$ source dataaspirant_venv/bin/activate
当前虚拟环境的名称会出现在命令行提示符的左边,让你知道当前的虚拟环境是哪个,从现在开始,你用pip安装的任何包都被放进dataaspriant_env文件夹,和全局的python安装是隔离的。
python数据挖掘包安装
开始安装python数据挖掘包了
安装numpy
$ pip install numpy
安装scipy
$ pip install scipy
安装matplotlib
$ pip install matplotlib
安装ipython
$ pip install ipython[all]
安装pandas
$ pip install pandas
安装Statsmodel
$ pip install statsmodel
安装scikit-learn
$ pip install scikit-learn
运行脚本文件
当虚拟环境是使用状态时,你只需要到你的script文件所在路径下,运行即可。
$ python script_file.py
停用虚拟环境
如果你不再需要虚拟环境,可以停用。
$ deaactivate
接着你就会回到系统默认的python环境。
要删除一个虚拟环境,只需要删除文件夹,本例中使用rm -rf dataaspriant_env即可。