我有一个表示来自二进制类的实例的数据集。这里的问题是只有来自正类的实例,而我没有来自负类的实例。或者更确切地说,我想从负片中提取出那些更接近正片的东西。
更具体地说,假设我们有从我们商店购买商品的人的数据,当时要求购买忠诚卡,或者稍后根据自己的意愿。抛开隐私问题不谈(这只是一个例子),我们有不同的属性,比如年龄、邮政编码等。
在我们的示例中,另一组客户端是未申请该卡的客户端。
我们想要的是找到与第一组中申请忠诚卡的人最相似的子集,以便我们可以向他们发送申请忠诚度计划的报价。
这并不是一个确切的分类问题,因为我们试图从“负面”组中获取实例。
它不完全是集群,这通常是无监督的,因为我们已经知道一个集群(忠诚卡客户端)。
我考虑过使用kNN。但我真的不知道我有什么选择。
我还想知道,如果可能的话,如何使用weka或其他Java库来实现这一点,以及我是否应该标准化所有的属性。
https://stackoverflow.com/questions/56255659
复制相似问题