Python数据分析与挖掘实战5-2代码错误解决办法 建立决策树模型 绘制决策树方法

在学习《Python数据分析与挖掘实战》这本书的同学会发现,如果对第五章的5-2示例代码不加修改会出现这样的错误:AttributeError: 'numpy.ndarray' object has no attribute 'columns'。

我在这里将解决办法分享给大家,并附上决策树的绘制。

这是书上的代码:

运行之后会出现:AttributeError: 'numpy.ndarray' object has no attribute 'columns'

修改后的代码:

使用以上代码,可以正常运行,会在代码所在文件夹输出tree.dot文件。

我们要将决策树tree.dot绘制成pdf或png文件,需要安装Graphviz,官网下载地址:http://www.graphviz.org/download/

安装之后为程序bin文件夹添加环境变量,然后就可以在命令行中使用了。

在转化为图像之前,我们要在dot文件第一行下面添加下面两行代码,指定中文字体,以免中文乱码:

edge [fontname="SimHei"];node [fontname="SimHei"];

然后,我们在命令行中使用以下命令即可生成pdf或者png图像:

dot -Tpdf tree.dot -o tree.pdf

dot -Tpng tree.dot -o tree.png

生成的图形如下:

本公众号原创作品,未经授权禁止转载,特此声明,谢谢合作!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180129G00DID00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券