我试图运行简单的逻辑回归程序在火花。我得到了这个错误:我试图包含各种语言来解决问题,但这并不是解决问题。java.lang.IllegalArgumentException:需求失败:列pmi必须是org.apache.spark.ml.linalg.VectorUDT@3bfc3ba7类型,但实际上是DoubleType,更新从dataset中删除了string value属性,该数据集是label。:128)
at scala.collection.AbstractMap.g
在我的spark DataFrame中,有一列包含了CountVectoriser转换的输出-它是稀疏向量格式的。我想要做的是将这列再次“分解”成一个密集的向量,然后是它的组成部分行(这样它就可以用于外部模型的评分)。vector type, however, 'features' is of vector type.;
现在看起来可能是Cou