另外,该数据中没有缺失的属性/特征值(MissingAttributeValues),更加方便了后续的分析。
数据处理
#从sklearn.cross_ validation导人数据分割器。...y = column_or_1d(y, warn=True)
性能评估
不同于类别预测,我们不能苛求回归预测的数值结果要严格地与真实值相同。一般情况下,我们希望衡量预测值与真实值之间的差距。...特别是,现实生活中的许多实例数据的各个特征与回归目标之间,绝大多数不能保证严格的线性关系。...dtr.fit(x_train, y_train)
#使用默认配置的单一回归树对测试数据进行预测,并将预测值存储在变量dtr_y_predict中。...;③依托训练数据构建最佳的树模型是NP难问题,即在有限时间内无法找到最优解的问题,因此我们所使用类似贪婪算法的解法只能找到一些次优解,这也是为什么我们经常借助集成模型,在多个次优解中寻觅更高的模型性能。