我正在处理Spark中的一个分类问题,其中示例的数据集是基于一组历史特征构建的。这个问题与网络管理有关,目的是在devices.For的日常运行中发现故障。每个DeviceID都有一个代表其日常操作的“向量”时间序列。是否有可能构建一个“特征矩阵”,以便基于一个历史特征而不是一个简单的特征向量来获得一个“标签点”?(对不起,我的英语...)
发布于 2016-03-24 22:02:11
否:因为LabeledPoint
构造函数的签名很清楚:
new LabeledPoint(label: Double, features: Vector)
它需要一个Vector
,而不是Matrix
。
是:每个矩阵都可以很容易地表示为一维向量,并且没有一个算法关心特定特征的含义(尽管有些算法会考虑声明的类型)。
https://stackoverflow.com/questions/36197553
复制相似问题