ubuntu 16.04下的系统是默认装好python的环境的,这比windows系统要方便很多,不需要我们自己再额外配置环境变量和手动安装python。
装的16.04下默认安装好的python版本是2.7.11。
ps.还是建议大家先使用python2.7,建议先不要使用python3以上版本,因为2.7的库要多很多,而且3以上的和2.7的在语法上也有蛮大的不同。
进行数据挖掘主要还是使用python的几个库:numpy,scipy,pandas,scikit-learn,statsmodels,matplotlib等等。
为了方便安装,使用pip工具来安装也是很方便的,用:
pip install +库名
即可。
但是发现有时在pip上由于各个库的依赖关系处理的不是很好,常常会出现安装报错的情况,因此还是建议大家在安装数据挖掘所需库的时候,使用以下方法安装:
Numpy:
sudo apt-get install python-numpy
Scipy:
sudo apt-get install python-scipy
绘图库matplotlib:
sudo apt-get install python-matplotlib
主力工具pandas:
sudo apt-get install python-pandas
统计建模分析工具statsModels:
sudo apt-get install python-statsmodels
机器学习库scikit-learn:
sudo apt-get install python-sklearn
之后,就可以愉快的开始挖矿之旅了!