问一种算法，用于从与另一个较小的数据集相似的数据集中对实例进行分类，其中此较小的数据集表示单个类
EN

Stack Overflow用户

提问于 2019-05-22 19:18:14

回答 2查看 126关注 0票数 3

我有一个表示来自二进制类的实例的数据集。这里的问题是只有来自正类的实例，而我没有来自负类的实例。或者更确切地说，我想从负片中提取出那些更接近正片的东西。

更具体地说，假设我们有从我们商店购买商品的人的数据，当时要求购买忠诚卡，或者稍后根据自己的意愿。抛开隐私问题不谈(这只是一个例子)，我们有不同的属性，比如年龄、邮政编码等。

在我们的示例中，另一组客户端是未申请该卡的客户端。

我们想要的是找到与第一组中申请忠诚卡的人最相似的子集，以便我们可以向他们发送申请忠诚度计划的报价。

这并不是一个确切的分类问题，因为我们试图从“负面”组中获取实例。

它不完全是集群，这通常是无监督的，因为我们已经知道一个集群(忠诚卡客户端)。

我考虑过使用kNN。但我真的不知道我有什么选择。

我还想知道，如果可能的话，如何使用weka或其他Java库来实现这一点，以及我是否应该标准化所有的属性。

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56255659

复制

相似问题

问一种算法，用于从与另一个较小的数据集相似的数据集中对实例进行分类，其中此较小的数据集表示单个类EN