下面的例子将每个文档中的词语转换成长度为3的向量:
[Java] 纯文本查看 复制代码
?...的输出如下:
[0,WrappedArray(苹果, 官网, 苹果, 宣布),(1,[0],[2.0])]
[1,WrappedArray(苹果, 梨, 香蕉),(1,[0],[1.0])]
因为setMinDF...new VectorSlicer().setInputCol("userFeatures").setOutputCol("features")
//根据索引号,截取原始特征向量的第1列和第...,截取原始特征向量的第1列和f2
slicer = new VectorSlicer().setInputCol("userFeatures").setOutputCol("features")...RFormula
RFormula用于将数据中的字段通过R语言的Model Formulae转换成特征值,输出结果为一个特征向量和Double类型的label。