在MLLIB管道中,如何在Stemmer (来自Spark NLP)之后链接一个CountVectorizer (来自SparkML)?当我尝试在管道中使用这两者时,我得到的结果是: myColName must be of type equal to one of the following types: [array<string>
我正在努力在星火上实施ALS。我使用ml类而不是mllib,因为CSV文件在一列中包含字符串。mllib中的评级类不接受字符串作为参数。我想使用来自org.apache.spark.mllib.recommendation.MatrixFactorizationModel类的预测函数,但是在运行时它正在org.apache.spark.rdd.RDD中搜索。org.apache.spark.ml.recommendation.ALS
import or