sklearn c4.5_c4.5 python实现_python 实现c4.5算法 - 腾讯云开发者社区

、、、、

我在文档中读到sklearn对树使用CART算法。是否有特定的属性需要更改以使其变得类似于c4.5实现？

浏览 79提问于2019-03-07得票数 1

1回答

H2O使用哪种决策树算法？

、

H2O的普通随机森林是否使用购物车、C4.5、5.0或其他什么？我找不到这个信息。sklearn的文档说他们使用了修改过的CART版本，我想H2O也使用了类似CART的东西。

浏览 0提问于2021-05-03得票数 0

1回答

基于sklearn的决策树算法的类型

有不同类型的决策树算法。ID3，CART，C4.5。我需要帮助来识别哪种算法是由sklearn在Python中实现的？

浏览 2提问于2018-03-06得票数 1

回答已采纳

1回答

我正在尝试制作一个小型的数据科学工具(有点像WEKA的迷你版)。现在，我有了这些具有大量特征(70-100+)的数据集，它们大多是分类的。我正在使用Python sklearn进行机器学习逻辑，我需要根据我得到的sklearn错误将这些类别转换为数字值。考虑到这一点，一次热编码不是一个选择，因为它会放大太多的维度。我已经研究了其他可能的方法，比如频率编码，标签编码等，但我不确定在我的情况下应该选择什么。另外，有没有人知道WEKA实际上是如何处理这些的？我在WEKA中输入我的数据集，它们工作得很好，它们给了我很好的结果！任何帮助都将不胜感激。谢谢!

浏览 24提问于2021-04-21得票数 0

1回答

参考url地址学习数据挖掘算法C5.0。

、

有没有人知道如何计算C5.0数据挖掘算法，可能是一个地址引用url？

浏览 0提问于2013-04-02得票数 1

1回答

WEKA J48类的C#或.NET实现？

、、、、

我正在寻找一个C#转换或实现的的java代码虽然我可以自己转换它，但我希望节省一些时间，并找到一个干净的注释实现。

浏览 0提问于2012-06-21得票数 2

回答已采纳

2回答

使用os和system的python中的命令行输入

、

我尝试在python中使用os.system运行iris_dataset，然后在获取值的同时将值从iris_dataset复制到Temp，然后打开Temp文件并使用它，如下所示。 import os import sys os.system("/home/mine/Desktop/C4.5/c4.5 -u -f iris_dataset") os.system("/home/mine/Desktop/C4.5/c4.5rules -u -f iris_dataset > Temp") f=open('Temp') 一旦我完成了我的

浏览 31提问于2021-10-17得票数 0

回答已采纳

2回答

在MATLAB和scikit之间，对于决策树的学习是不同的。

、、、、

是否有可能通过使用python代码改变matlab和jupyter笔记本中相同数据集的准确性？对于相同的数据集，首先在matlab中应用，决策树法的准确率为96%，然后使用python代码将相同的数据集应用到jupyter笔记本中，通过k次交叉验证，C4.5 (决策树)的准确率为53%。我不明白对于相同的数据集和相同的方法获得不同的准确性的问题在哪里。我在python代码中的过程如下所示： import pandas as pd import numpy as np from sklearn import tree from sklearn.model_selection import

浏览 0提问于2019-01-23得票数 2

回答已采纳

1回答

我正在寻找橙色中的特定算法

、、、

我在课堂上学习数据挖掘，但我在使用Orange库时遇到了麻烦。我从Weka来到Orange，试图找到J4.8和C4.5算法，但我找不到它们的列表。谷歌搜索会把我带到一个页面，上面说它有算法()，但我仍然找不到它们。我使用的是Python 2.7。它是兼容的，还是我必须编写它们？谢谢

浏览 11提问于2015-05-30得票数 1

1回答

不同决策树算法的复杂度和性能比较

、、、、

我正在研究数据挖掘，更准确地说，是决策树。我想知道是否有多个算法来构建一个决策树(还是仅仅一个？)，哪一个更好，基于如下标准性能复杂性决策失误还有更多。

浏览 4提问于2012-04-02得票数 45

回答已采纳

3回答

决策树实现(ID3或C4.5)

、、、

我想用PHP实现一个决策树(机器学习)算法。我在谷歌上到处搜索，在PHP中什么也找不到。有没有人知道PHP中实现决策树的教程或函数？

浏览 0提问于2011-11-18得票数 4

1回答

在weka中手动控制决策树

、、

Month是我的数据集中的一个属性，我认为它非常重要，我希望首先在j48中拆分它。但默认情况下，weka会先选择其他属性进行拆分。有什么方法可以控制这种情况吗？谢谢!

浏览 0提问于2013-06-04得票数 2

回答已采纳

1回答

决策树在助推中的实现

、、、

我正在实现AdaBoost(增强)，它将使用CART和C4.5。我读过关于AdaBoost的文章，但是我找不到关于如何将AdaBoost与决策树连接起来的很好的解释。假设我有有n个例子的数据集D。我把D到TR训练的例子和TE测试的例子分开。假设TR.count = m，所以我设定的权重应该是1/m，然后我用TR构建树，用TR测试它得到错误的例子，用TE测试来计算错误。然后我改变重量，现在我将如何获得下一套训练？我应该使用什么样的抽样(有或没有替换)？我知道新的培训集应该更多地集中在错误分类的样本上，但是我如何实现这一点呢？那么，CART或C4.5如何知道他们应该把注意力集中在权重更大的例子上呢

浏览 1提问于2016-12-16得票数 0

回答已采纳

1回答

具有数值的ID3决策树

、、

我正在寻找一个ID3决策树实现，它以一个验证和测试文件作为输入，并返回预测。我找到了，但是我无法将它们调整为数值，例如。您知道从控制台或用Python编写的任何ID3树实现吗？或者任何关于如何在数值中使用的建议都是很棒的。

浏览 2提问于2010-02-18得票数 5

1回答

c4.5算法缺失值

、、

C4.5算法如何处理连续间隔上的缺失值和属性值？另外，决策树是如何被剪除的？有谁能用一个例子来解释一下。

浏览 2提问于2017-02-14得票数 0

1回答

数值属性和类的Java决策树

、、

我正在寻找一个用于决策树的java库，它可以接受数字属性和类/等级。Weka的J48处理离散属性，但不接受数字属性。谢谢

浏览 2提问于2010-09-11得票数 2

回答已采纳

1回答

如何在LaTeX中合并多行单元格？

我有以下代码： \begin{table}[ht] \begin{center} \begin{tabular}{ | l | l | l | l | l | l | l | } \hline \multirow{2}{*}{Oprava} & \multirow{2}{*}{zkratka} & \multirow{2}{*}{alg.} & chybovost \% & & & \\ \hline & & & MAE & RSE & RMSE & RRSE \\ \

浏览 1提问于2016-07-26得票数 4

回答已采纳

1回答

连续目标变量的决策树

我正在尝试构建一个决策树，其中我在r.which决策树中混合了自变量和连续因变量，我可以应用吗？我不想使用购物车，因为我想要2个以上的分割。

浏览 7提问于2015-08-20得票数 0

3回答

如何在scikit learn中设置ID3算法？

、、、

有一个用于各种类型的树(ID3，CART，C4.5)，但我不明白我应该传递什么参数来模拟传统的行为？

浏览 2提问于2015-08-29得票数 5

2回答

情绪分析工具对组进行分类

、、、

我正在做一个机器学习项目，我正处于进步的第一阶段。我正致力于提取特征和测试要使用或不使用的特性。我有一个由两个类组成的数据集。我想检查一下，情感和其中任何一个群体之间的关系是否会发生。我的数据如下： group_a this is a tweet group_b this is another tweet group_b this is another tweet group_a this is another tweet 如何找到情感和组之间的关联？，因为这是我的项目的特性选择部分，--我可以使用任何工具，而不是手工实现。如果你能教我怎么做，我们欢迎你。 PS:实际上，在实现算法之前，我想检

浏览 2提问于2012-11-06得票数 2

1回答

决策树ID3/C4.5在Hadoop上的并行实现

、、、、

我想在Hadoop上实现决策树ID3/C4.5。任何人都能知道如何继续前进。我对算法很清楚，但我需要知道如何将它们并行化。

浏览 3提问于2012-10-15得票数 2

1回答

有决策树的Adaboost (自适应增强)方法的例子是什么？

、、、

有什么好的教程可以解释如何在为样本训练集构建决策树的连续迭代过程中对样本进行加权？我想明确地说，在构建第一个决策树之后，如何分配权重。决策树是使用信息增益作为锚来设计的，我想知道这是如何由于先前迭代中的错误分类而受到影响的。任何好的教程/例子都是非常感谢的。

浏览 2提问于2014-09-21得票数 3

回答已采纳

1回答

如何获取ADTree的WEKA分类路径

、、

我使用WEKA来实现其决策树的树。(我目前正在使用GUI来测试程序是如何工作的，但这个问题是针对如何在GUI中或通过Java API来实现的) 我已经放置了训练数据并学习了模型。我还有一个我正在运行的样本测试。虽然预测非常准确，但我似乎找不到一种方法来打印测试所经历的路径。我有兴趣知道是哪些变量导致了这棵树得出这个结论。如果这是不可能的，谁能推荐给我一个好的库与决策树(adtree也做技巧)，它将返回每个分类测试样本的路径。

浏览 2提问于2015-06-04得票数 0

1回答

C4.5算法如何处理属性相同但结果不同的数据？

、、、

我正在尝试用C4.5算法为一个学校项目创建一棵决策树。决策树是针对的，属性信息如下。 Attribute Information: 1. Age of patient at time of operation (numerical) 2. Patient's year of operation (year - 1900, numerical) 3. Number of positive axillary nodes detected (numerical) 4. Survival status (class attribute) 1 = the patient survive

浏览 8提问于2017-03-25得票数 1

2回答

Weka如何在J48和其他分类器中计算输出预测？

我在Weka语言中使用了J48分类器的输出预测，并得到了预测的结果(概率)。由于我需要在我的研究中使用这些预测数，我需要知道weka是如何计算这些数字的？公式是什么？是为每个分类器指定的吗？

浏览 2提问于2015-11-27得票数 0

2回答

在spark决策树中使用什么算法(是ID3、C4.5还是CART)

、

我有一个关于MLlib中决策树的问题。Spark中使用的是什么算法？是ID3，C4.5还是CART？

浏览 5提问于2016-12-07得票数 8

1回答

有人能解释一下ID3和CART算法的区别吗？

、、、

我必须用R软件和rpart软件包创建决策树。本文首先定义了ID3算法，然后实现了各种决策树。我发现rpart包与ID3算法不兼容。它使用了CART算法。我想了解两者的差异，也许可以解释我的论文中的不同之处，但我没有找到任何将两者进行比较的文献。你能帮帮我吗?你知不知道哪一篇论文两者比较过，或者你能向我解释一下两者的区别吗？

浏览 4提问于2013-11-20得票数 5

2回答

*nix上c4.5算法的实现

、、

我正试图在我的mac os机器(也有一台red hat enterprise Linux4.6机器)上编译和执行，但是还没能得到相同的结果。有没有人尝试过这个方法，并成功地在他们的机器上编译和执行了相同的代码？如果是这样的话，请分享一下这些步骤。

浏览 1提问于2009-05-12得票数 3

回答已采纳

1回答

随机林的可能算法

、、、、

我正在研究随机森林，我在寻找随机森林的算法。我已经查找了决策树的算法(如ID3、C4.5、CART)。但是，对于随机森林，有哪些不同的算法？我没有完全理解它的文学。你能说套袋和ExtraTrees就是例子吗？提前感谢

浏览 4提问于2019-11-19得票数 2

回答已采纳

1回答

将重定位截断为fit:针对未定义符号“`cfree”的R_X86_64_PC32

、、、

我试图在Cygwin中为Win64编译Win64算法。我有错误 besttree.o:besttree.c:(.text+0x240): undefined reference to `cfree' besttree.o:besttree.c:(.text+0x240): relocation truncated to fit: R_X86_64_PC32 against undefined symbol `cfree' 当我看最好的树时，我在 FormTarget(Size) /* ----------- */ ItemNo Size; { ItemNo

浏览 3提问于2014-10-09得票数 0

回答已采纳

2回答

在随机森林中使用什么样的决策树？

、、

阅读一些文档(对于示例)，我知道有很多类型的决策树(Cart、ID3等等)。我还知道，随机森林是一种使用一组决策树的粒子算法。我的问题是:在随机森林中，使用什么样的决策树？(cart，id3，.)

浏览 0提问于2022-03-21得票数 0

回答已采纳

1回答

规则集优化算法

、、

我有手写分类器(有很多)。它被实现为规则集的集合IIF - THEN。我想优化错误的%。有一些分类器的False Positive和False Negative结果占很大的比例。在我对这个问题的研究中，我发现RIPPER alghorytm女巫，似乎是为解决这类问题而设计的。此外，也有一些可以帮助Multi Naive Bias的方法。据我所知，在EA中通常有Global Optimization步骤，C通常/有时通过RIPPER实现。所以，简单地说。我已经手动生成了rule-set女巫，我现在已经进行了优化，例如使用RIPPER。是真的吗？你能引用一些文献吗？

浏览 0提问于2016-11-06得票数 1

1回答

插入符号的问题:r

、、、

我的代码如下： library('RMySQL') library('DMwR') library('tm') library('Snowball') library('SnowballC') rt_outlier <- dbGetQuery(con, "SELECT *,tweet_text from outlier_info,tweets where outlier_info.tweet_id=tweets.tweet_id limit 500") rt_not_outlier &

浏览 1提问于2015-01-09得票数 0

1回答

如何控制滑雪板DT分类器中每个分叉的分支数？

、、、

我正在尝试编码一个两类的DT分类问题，我以前使用过SAS。但想在斯克勒夫做这事。目标变量是两个类别的分类变量。但是有几个连续的自变量。在SAS中，我可以为每个拆分指定“最大分支数”。因此，当它被设置为4时，一些叶将分裂为2，而另一些将分裂为4(特别是对于连续变量)。我找不到与滑雪板等效的参数。看了“最大叶节点”。但这控制了整个树的“叶”节点的总数。我相信你们中的一些人可能也遇到过同样的情况，并且已经找到了解决办法。请帮助/分享。我会非常感激的。

浏览 0提问于2018-05-05得票数 1

1回答

已经有了一个带有二进制类的决策树模型，当我测试一个新实例时，我如何获得一个概率？

、

我已经为一个二分类问题构建了一个决策树模型。困扰我的是，当我有一个新的测试实例时，我如何获得它所属的概率或得分(而不是具体的分类结果)。

浏览 1提问于2013-08-02得票数 1

2回答

如何计算昆兰C4.5算法中数值属性的阈值？

、、

我试图找出C4.5算法如何确定数值属性的阈值。我已经研究过，但我无法理解，在大多数地方，我发现这些信息：首先根据考虑的属性Y的值对训练样本进行排序。这些值只有有限的数目，所以让我们将它们按排序顺序表示为{v1，v2，…。、vm}.位于vi和vi+1之间的任何阈值都具有相同的效果，即将情况划分为属性Y的值位于{v1、v2、…的情况下。，以及值为{vi+1、vi+2、…的、vm}.因此，在Y上只有m-1可能的分裂，所有这些都应该被系统地检查以获得一个最优的分裂。通常选择每个区间的中点：(vi +vi+1)/2作为代表阈值。C4.5为每个区间{ vi，vi+1}选择一个较小的值vi，而不是中点

浏览 5提问于2013-04-19得票数 5

2回答

需要帮助选择数据处理/神经网络API

、、

我正计划为我用Java开发的电子商务平台构建一个功能，以像Amazon一样展示相关产品。有几个与产品相关的不同指标，我想探讨一下。购买历史记录(同时购买) 按家庭/类型分类(类似产品分类) 有意关联(提高结果；“买这个！”) 虽然我可能能够开发我自己的数据处理库，但它并不是很便携，而且我敢说它也不是很好。有几个包可以用来做这类事情，但我觉得我无法评估哪个包或解决方案最适合我。如有任何关于轶事或个人经验的意见，将不胜感激。注意:我把它标记为神经网络，因为我在一次蟒蛇演讲中使用了类似神经网络的数据，我不认为神经网络是这项工作的最佳选择。

浏览 4提问于2010-09-03得票数 0

回答已采纳

1回答

Python中有真正的C4.5实现吗？(处理缺失值)

、、

据我理解，与ID3相比，C4.5提供了4个改进：处理训练数据和“测试”数据中的缺失值，处理连续数据处理属性上的成本。修剪来源但是，我发现的所有决策树python模块，即使是所谓的C4.5，都不能处理缺少的值。你知道有一个图书馆能处理它们吗？如果它能与Pandas DataFrames“开箱即用”的话，那就太好了.

浏览 0提问于2020-01-05得票数 6

1回答

决策树- C4.5 vs CART规则集

当我阅读关于决策树的scikit--学习用户手册时，他们提到 CART (分类和回归树)与C4.5非常相似，但它的不同之处在于它支持数值目标变量(回归)，不计算规则集。CART使用特征和阈值构造二叉树，在每个节点上获得最大的信息增益。我不明白C4.5算法在哪里计算规则集(我甚至不知道规则集是什么意思)。它与购物车本质上是一样的，只不过它使用吉尼指数而不是交叉熵。请有人详细解释哪些规则集是什么以及它们在C4.5中是如何使用的？

浏览 0提问于2017-09-23得票数 6

1回答

在Matlab中绘制包含实例结果的决策树

、、

我已经在Weka中创建了一个决策树。我现在想在matlab中计算一个预测(使用这个模型)，并在树中很好地可视化结果。但是我还没有找到一种好的方法来绘制树和它上的实例的结果。我应该把它画成流程图吗？有没有一种开箱即用的方法？我可以在Matlab中计算C4.5吗?它是否已经绘制了树？

浏览 3提问于2016-05-23得票数 0

3回答

C5算法的实现？

、

你知道我在哪里可以找到这个算法的一些信息，来研究它吗？是否已经有其实现的示例，或者只有知道它的实现？

浏览 7提问于2011-02-23得票数 7

回答已采纳

1回答

决策树:分类概率分布？

、、、

我使用Weka的J48 (C4.5)决策树分类器。一般来说，对于决策树，当你击中一片叶子时，能不能确定一个分类概率分布？我知道在朴素贝叶斯中，每一次分类尝试都会产生一个分类分布。如果可以使用决策树，这种功能在Weka J48树中可用吗？我也可以尝试实现我自己的树。

浏览 3提问于2012-08-07得票数 3

1回答

使用gdb调试时未找到调试符号

、、、

我正在用gdb调试C4.5代码，我得到的错误是 GNU gdb (Ubuntu 7.7-0ubuntu3.1) 7.7 Copyright (C) 2014 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent per

浏览 1提问于2014-10-13得票数 0

2回答

决策树(例如C4.5)是否是非参数学习？

、

我是机器学习的新手，正在尝试将决策树归纳放到事情的宏伟计划中。决策树(例如，使用C4.5或ID3构建的决策树)是参数化的还是非参数化的？我猜测它们可能确实是参数的，因为实际值的决策分割点可能是根据特征值的一些分布确定的，例如均值。然而，它们并不共享必须保留所有原始训练数据的非参数特征(就像使用kNN一样)。

浏览 2提问于2012-12-13得票数 9

回答已采纳

3回答

如何在weka库中添加一种新的weka分类算法

、、

我想使用一些由weka分类算法(如c4.5，ID3)，但我不知道如何添加到weka！在weka上有吗？如果这些算法不可用，我如何添加它们？

浏览 7提问于2013-04-23得票数 0

1回答

数字的OCR。用Hu不变矩进行分类

、、、、

我正在用几个数字做图片的OCR。我隔离数字，计算每个数字的7 hu不变矩，并存储数据。因此，当我有足够的数据为每一个数字，我想匹配一个传入数字与我已经拥有的数据。我首先计算数字的7个hu矩，然后查看所有的数据，并检查其他hu矩向量是否与我新到达的数字相匹配。对于数字6，7 hu矩可能如下所示： 0.0015019597635929924 8.216737738246056E-7 2.0375639403591246E-10 7.83546684255912E-11 7.317864741055554E-21 3.429093590309372E-14 -6.668347984552349E

浏览 6提问于2014-03-17得票数 3

2回答

比较多行以选择值最小的行

、、、、

我希望比较第二列中的行，并获得连续列中值最高的行，其优先级为column 3> 4 > 5。我对第二列的数据集进行了排序，以便将相同的值放在一起。我的数据集如下所示： X1 A 0.38 24.68 2.93 X2 A 0.38 20.22 14.54 X3 A 0.38 20.08 00.48 X3.3 A 0.22 11.55 10.68 C43 B 0.22 11.55 20.08 C4.2 C 0.22 11.55 3.08 C4.5 C 0.22 11.55 31.08 C42 D 0.96 21.15 11.24 C44 D 0.

浏览 7提问于2020-10-13得票数 0

回答已采纳

2回答

导出Weka模型以在C或C++中使用

、、、、

我在使用Weka进行数据探索和确定最适合我的问题的分类算法方面取得了很大的成功。现在我有了一个可以工作的经过训练的模型，我想把它集成到我的C++程序的其余部分中。不幸的是，这似乎是一项困难的任务:只有Weka具有将分类器导出为Java对象文件的本机支持。有没有人找到了以有用的格式导出经过Weka训练的模型参数的方法？如果有一个实用程序可以从J48决策树生成C/C++代码，我会特别感兴趣。

浏览 2提问于2011-05-15得票数 8

回答已采纳

1回答

c4.5的问题

我使用的是C4.5算法(可以在找到) 我的名字在这里： Play, Don't Play. Sky: Sunny, Cloudy, Rainy. AirTemp: Warm, Cold. Humidity: Normal, High. Wind: Strong, Weak. Water: Warm, Cool. Forecast: Same, Change. 我的数据在这里 Sunny, Warm, Normal, Strong, Warm, Same, Play Sunny, Warm, High, Strong, Warm, Same, Play Sunny, Warm, Hig

浏览 1提问于2011-01-19得票数 1

4回答

使用哪种数据处理工具？

、、、

有人能解释一下最著名的数据挖掘开放源码工具的主要优缺点吗？在我读到的所有地方，RapidMiner，Weka，Orange，KNIME都是最好的。有人能在一个小的子弹列表中快速地进行技术比较吗。我的需要如下：它应该支持分类算法(朴素贝叶斯，支持向量机，C4.5，kNN)。它应该很容易在Java中实现。它应该有可以理解的文件。它应该有参考生产项目或用例工作在。一些额外的基准比较，如果可能的话。谢谢!

浏览 7提问于2016-07-25得票数 9

回答已采纳