我能够训练模型并保存模型(Train.scala)。现在我想使用这个经过训练的模型来预测新数据(Predict.scala)。我是否应该在Train.scala中对Predict.scala文件使用相同的VectorAssembler?因为我在转换后发现了特征数据类型的问题。例如:当我读入训练好的模型并尝试对新的特征化数据进行预测时,我得到了这个错误:[error] found : org.apa
我有一个包含多个分类列的数据帧。我正在尝试使用两列之间的内置函数来查找菱形统计数据:但是,它给出了一个错误:
IllegalArgumentException: 'requirement failed: Column feature1 must be of type struct<type:tinyint,size:int,indices:array<in
我想用Spark MLlib提供的MinHash模型找到重复的文章,然后我遇到了一个异常:“必须至少有1个非零条目。”:760)at org.apache.spark.rdd.RDD.iterator(RDD.scala(RDD.scala:323)
at org.apache.spark.rdd.RDD.iterator