是否有可能通过使用python代码改变matlab和jupyter笔记本中相同数据集的准确性?
对于相同的数据集,首先在matlab中应用,决策树法的准确率为96%,然后使用python代码将相同的数据集应用到jupyter笔记本中,通过k次交叉验证,C4.5 (决策树)的准确率为53%。
我不明白对于相同的数据集和相同的方法获得不同的准确性的问题在哪里。
我在python代码中的过程如下所示:
import pandas as pd
import numpy as np
from sklearn import tree
from sklearn.model_selection import
我正在学习关于使用python的数据科学的udemy课程。本课程侧重于算法的输出,而较少关注算法本身。特别是,我正在执行一个决策树。每次我在python上运行算法,也使用相同的样本,算法给我一个稍微不同的决策树。我问过导师,他们告诉我:“决策树不能保证每一次运行的结果是相同的,因为它的性质。”有人可以解释我为什么要更详细的解释,或者给我一个好书的建议?
我完成了数据导入的决策树:
import numpy as np
import pandas as pd
from sklearn import tree
并执行以下命令:
clf = tree.DecisionTreeClassifier()
我正在学习如何在python中使用决策树。我修改了一个示例,以导入csv文件,而不是使用此站点的虹膜数据集:
代码:
import numpy as np
import urllib
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
from sklearn import datasets
from sklearn import metrics
# URL for the Pima Indians Diabetes dataset (UCI Machine Learning Repository
我试验了不同的建模方法,包括KNN、决策树、神经网络和SVN,并试图对我的数据进行拟合,看看哪种方法最有效。令我惊讶的是,决策树的最佳工作方式是训练精度为1.0,测试精度为0.5。无论训练精度为0.92,测试精度为0.42,神经网络的性能都是最好的,比决策树分类器低8%。
请有人解释一下,与决策树这样的建模技术相比,神经网络可能具有低精度的情况/情况。我尝试过不同配置的神经网络,比如:
1 hidden layer and 1 neuron : Train Accuracy 34% Test Accuracy 42%
7 hidden layers and 5 neurons in each
我想用JSON定义一个嵌套的if-statement,并使用Python进行测试。我正在考虑一个简单的带有嵌套分支的决策树,并进行递归测试。
伪码
# is_valid = (a == b OR a == a) AND c == c # True
tree = {
branches: [
{
value1: 'a',
operator: '==',
value2: 'b',
child_connector: 'or