网上关于Python安装XGboost的教程很多,本文只介绍最简单的一种,即Linux(Ubuntu16.04)+Anaconda2+Python2.7+pip的在线安装方式。Windows系统下安装过程比较复杂,请大家自行百度。
首先安装Anaconda,它是现在很流行的Python数据科学模块的集合。由于Python安装包时,经常需要依赖于其他包,过程繁琐。Anaconda安装后,不仅默认集成了numpy、pandas、scipy、sklearn等分析模块,而且在安装新包时,能自动查找依赖的包,非常方便。打开官网的下载页面:www.anaconda.com/download/,选择Linux的企鹅图标如下:
最新版本是5.01,根据需要选择对应的Python版本,本文是2.7。之前下载的一个本版是4.3,在终端命令行输入:bash Anaconda2-4.3.1-Linux-x86_64.sh即可安装,其他版本方法相同。完成后输入:conda info查看安装信息,如下:
然后需要升级一个gc++的依赖库,命令conda install libgcc。因为Xgboost底层实现是C++。安装完成后输入命令conda list查看Anaconda上的安装列表:
显示libgcc的版本是5.2.0。
最后就是安装xgboost了,命令pip install xgboost等待安装完成。之前已经安装过,在此不演示。完成后进入python环境查看,显示版本为0.6。
到此XGboost安装完毕。下节介绍第一个简单的用例。
领取专属 10元无门槛券
私享最新 技术干货