我试图在python中再现R的createDataPartition函数的行为。我有一个具有布尔目标变量的机器学习数据集。我想将我的数据集分成一个训练集(60%)和一个测试集(40%)。如果我这样做完全随机,我的目标变量将不会适当地分布在这两个集合之间。我在R中实现了这样的目标:
inTrain <- c
我的问题显然是caret::包的一个怪癖。我以前的答案只适用于运行估计,因为我可以让S3确定要使用的predict()的哪个变体。然而,我想为我的线性模型计算一个95%的预测区间。要做到这一点,我必须使用predict.lm()变量的predict()函数。term is gone我正在使用caret::包来创建和交叉验证一个线性模型,然后我将使用该模型从一个预测值<e
我试图使用各种预测算法,从卡雷特包在R中的回归问题,即我的目标变量是连续的。卡雷特认为分类是问题的适当类别,当我通过任何一个回归模型时,我会得到一条错误消息,上面写着“错误的分类模型类型”。数据在CCPP.zip中。让我们把功率作为其他变量的函数来预测。功率是一个连续变量。library(readxl) po