是否有可能通过使用python代码改变matlab和jupyter笔记本中相同数据集的准确性?
对于相同的数据集,首先在matlab中应用,决策树法的准确率为96%,然后使用python代码将相同的数据集应用到jupyter笔记本中,通过k次交叉验证,C4.5 (决策树)的准确率为53%。
我不明白对于相同的数据集和相同的方法获得不同的准确性的问题在哪里。
我在python代码中的过程如下所示:
import pandas as pd
import numpy as np
from sklearn import tree
from sklearn.model_selection import
我正在做一个机器学习项目,我正处于进步的第一阶段。我正致力于提取特征和测试要使用或不使用的特性。我有一个由两个类组成的数据集。我想检查一下,情感和其中任何一个群体之间的关系是否会发生。我的数据如下:
group_a this is a tweet
group_b this is another tweet
group_b this is another tweet
group_a this is another tweet
如何找到情感和组之间的关联?,因为这是我的项目的特性选择部分,--我可以使用任何工具,而不是手工实现。如果你能教我怎么做,我们欢迎你。
PS:实际上,在实现算法之前,我想检
我正在尝试用C4.5算法为一个学校项目创建一棵决策树。决策树是针对的,属性信息如下。
Attribute Information:
1. Age of patient at time of operation (numerical)
2. Patient's year of operation (year - 1900, numerical)
3. Number of positive axillary nodes detected (numerical)
4. Survival status (class attribute)
1 = the patient survive
我正在用gdb调试C4.5代码,我得到的错误是
GNU gdb (Ubuntu 7.7-0ubuntu3.1) 7.7
Copyright (C) 2014 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent per