我使用这个数据集,目标列是最后一个'DEATH_EVENT',我把最后一个分隔开了。我正在使用KMeans来计算命中和失误的次数。结果非常糟糕,我想我应该删除一些列,或者创建一个删除的循环。你怎么做?
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
X = np.genfromtxt('heart_failure_clinical_records_dataset.csv', delimiter=
我第一次学习了一个教程,在h2o中使用了中的R。我想做的是对我没有的数据进行预测,这意味着在测试集之外,未来的日期。
数据是时间序列,测试集上的预测如下所示:
print(automl.error.tbl)
# A time tibble: 10 x 5
# Index: Time
Time actual pred error error.pct
<date> <dbl> <dbl> <dbl> <dbl>
1 2018-01-31 11.4 11.4 0.0342 0