红联Linux门户
Linux帮助

Ubuntu系统下创建python数据挖掘虚拟环境

发布时间:2016-06-16 10:12:48来源:cnblogs.com/quicksnow/作者:爱笑的羊

Ubuntu系统下创建python数据挖掘虚拟环境


虚拟环境:

虚拟环境是用于创建独立的python环境,允许我们使用不同的python模块和版本,而不混淆。

让我们了解一下产品研发过程中虚拟环境的必要性,在python项目中,显然经常要使用不同的python库(包装器)来完成工作,但结局并不总是圆满的,大部分时候,我们会面临着诸如python应用无法在新的机器(操作系统)上运行的环境问题,这是新机器上Python库的依赖问题导致的。为了更好的理解,设想在开发python应用的过程当中,我们使用了python pandas(python的数据分析库)0.18.0版本中的函数,而这个函数在新机器安装的0.17.1的python pandas库里没有,由于版本差异,python应用就无法在新机器上运行。

要解决这个问题,我们需要使用一个包含了项目所需的所有东西的python环境,从而可以有序独立地运行。

python项目开发,不管你要忙于多少个项目,使用虚拟环境都是非常推荐的一种方式。

在Ubuntu系统下,创建虚拟环境相当简单,使用virtualenv就可以了(一个创建独立python环境的工具)。


关于virtualenv:

Ubuntu系统下创建python数据挖掘虚拟环境

virtualenv通过创建隔离的环境解决项目的依赖冲突问题,这些隔离的环境包括python开发者项目所需的所有工具。用这个工具创建的虚拟环境包括新的python二进制文件,其实是整个python标准库的拷贝。

安装virtualenv:

$ sudo pip install virtualenv

现在我们已经成功安装了virtualenv,现在我们创建一个文件夹(环境),我们将安装python数据挖掘包。

创建虚拟环境:

$ virtualenv dataaspirant_venv

在当前路径下会创建一个文件夹,包含了python的可执行文件和pip库,便于你安装其他包。虚拟环境的名称可以是任何名称,在这个例子中,名为dataaspirant_venv,省略名称的话,文件就会默认放在当前目录。

这将创建一个在任何路径下都可以命令运行的python拷贝,只不过是把它放在了一个名为dataaspirant_venv的文件夹里。

使用虚拟环境
要使用虚拟环境,执行以下命令:

$ source dataaspirant_venv/bin/activate

当前虚拟环境的名称会出现在命令行提示符的左边,让你知道当前的虚拟环境是哪个,从现在开始,你用pip安装的任何包都被放进dataaspriant_env文件夹,和全局的python安装是隔离的。


python数据挖掘包安装
开始安装python数据挖掘包了

安装numpy

$ pip install numpy

安装scipy

$ pip install scipy

安装matplotlib

$ pip install matplotlib

安装ipython

$ pip install ipython[all]

安装pandas

$ pip install pandas

安装Statsmodel

$ pip install statsmodel

安装scikit-learn

$ pip install scikit-learn

运行脚本文件
当虚拟环境是使用状态时,你只需要到你的script文件所在路径下,运行即可。

$ python script_file.py

停用虚拟环境
如果你不再需要虚拟环境,可以停用。

$ deaactivate

接着你就会回到系统默认的python环境。
要删除一个虚拟环境,只需要删除文件夹,本例中使用rm -rf dataaspriant_env即可。


本文永久更新地址:http://www.linuxdiyf.com/linux/21561.html