首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >一种算法,用于从与另一个较小的数据集相似的数据集中对实例进行分类,其中此较小的数据集表示单个类

一种算法,用于从与另一个较小的数据集相似的数据集中对实例进行分类,其中此较小的数据集表示单个类
EN

Stack Overflow用户
提问于 2019-05-22 19:18:14
回答 2查看 126关注 0票数 3

我有一个表示来自二进制类的实例的数据集。这里的问题是只有来自正类的实例,而我没有来自负类的实例。或者更确切地说,我想从负片中提取出那些更接近正片的东西。

更具体地说,假设我们有从我们商店购买商品的人的数据,当时要求购买忠诚卡,或者稍后根据自己的意愿。抛开隐私问题不谈(这只是一个例子),我们有不同的属性,比如年龄、邮政编码等。

在我们的示例中,另一组客户端是未申请该卡的客户端。

我们想要的是找到与第一组中申请忠诚卡的人最相似的子集,以便我们可以向他们发送申请忠诚度计划的报价。

这并不是一个确切的分类问题,因为我们试图从“负面”组中获取实例。

它不完全是集群,这通常是无监督的,因为我们已经知道一个集群(忠诚卡客户端)。

我考虑过使用kNN。但我真的不知道我有什么选择。

我还想知道,如果可能的话,如何使用weka或其他Java库来实现这一点,以及我是否应该标准化所有的属性。

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56255659

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档