我正在学习关于使用python的数据科学的udemy课程。本课程侧重于算法的输出,而较少关注算法本身。特别是,我正在执行一个决策树。每次我在python上运行算法,也使用相同的样本,算法给我一个稍微不同的决策树。我问过导师,他们告诉我:“决策树不能保证每一次运行的结果是相同的,因为它的性质。”有人可以解释我为什么要更详细的解释,或者给我一个好书的建议?
我完成了数据导入的决策树:
import numpy as np
import pandas as pd
from sklearn import tree
并执行以下命令:
clf = tree.DecisionTreeClassifier()
我用python开发了一个绘图决策树,
tree.plot_tree(clf.fit(X_train, y_train))
plt.suptitle("Decision surface of a decision tree using paired features")
plt.show()
但是当我运行这段代码时,树会像这样出现
决策树
有什么办法可以使树正常吗?
我想为我现有的neo4j图形数据库分配一个决策树。我必须创建一个决策树,告诉我价格是便宜还是昂贵。为了做到这一点,我将便宜定义为低于平均价格,将昂贵定义为高于平均价格。我在cypher中尝试了以下代码,但它不起作用。
我也想做出其他不同的决定,但这是最简单的一个。另外,如果我可以在一些python代码上实现决策树,并将其连接到现有的neo4j数据库?
MAtch (p:Price),(ch:Cheap)
WITH avg(toFloat(p.monthly)) as average
Where ch.price < average
MERGE (p)-[:IS_CHEAP]-&g