在学习《Python数据分析与挖掘实战》这本书的同学会发现,如果对第五章的5-2示例代码不加修改会出现这样的错误:AttributeError: 'numpy.ndarray' object has no attribute 'columns'。
我在这里将解决办法分享给大家,并附上决策树的绘制。
这是书上的代码:
运行之后会出现:AttributeError: 'numpy.ndarray' object has no attribute 'columns'
修改后的代码:
使用以上代码,可以正常运行,会在代码所在文件夹输出tree.dot文件。
我们要将决策树tree.dot绘制成pdf或png文件,需要安装Graphviz,官网下载地址:http://www.graphviz.org/download/
安装之后为程序bin文件夹添加环境变量,然后就可以在命令行中使用了。
在转化为图像之前,我们要在dot文件第一行下面添加下面两行代码,指定中文字体,以免中文乱码:
edge [fontname="SimHei"];node [fontname="SimHei"];
然后,我们在命令行中使用以下命令即可生成pdf或者png图像:
dot -Tpdf tree.dot -o tree.pdf
dot -Tpng tree.dot -o tree.png
生成的图形如下:
本公众号原创作品,未经授权禁止转载,特此声明,谢谢合作!
领取专属 10元无门槛券
私享最新 技术干货