首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >建立一个模型,根据过去的通话历史和人口统计来预测一个人接电话的可能性。

建立一个模型,根据过去的通话历史和人口统计来预测一个人接电话的可能性。
EN

Data Science用户
提问于 2018-08-11 15:03:36
回答 1查看 277关注 0票数 -1

想象一下,你有一个网络中每个人的名单。你想知道他们接电话的可能性有多大。在你的网络中,有几个人你已经打过好几次电话了(有些人打了两三次电话,其他人打了很多次电话,有些人超过50次),而且你有记录他们是否会接电话(每通电话)。这是有用的信息,因为那些过去接听过电话的人很可能在将来再次接电话。

也有几个人,你从来没有打过电话,因此,不知道他们是否经常接听电话在过去。然而,因为他们在你的网络中,而且你认识他们,你有一些基本的人口学信息,比如年龄、性别、种族、他们居住的地方(农村/城市)、手机/固定电话等等。很明显,你也有你过去打过电话的人的人口信息,所以你可以查看回答率和各种人口变量之间的关系。

现在,您想要建立某种模型(倾向模型?)来预测你网络中的人在你打电话的时候接电话的可能性。您如何利用通话历史和人口统计信息(考虑到您的许多朋友和家人没有任何通话历史)。我正在寻找的结果基本上是一种度量/概率/分类,然后我可以用它来优先考虑某些人而不是其他人。从基本的数据探索中,我知道我列出的许多变量都是自己预测的,但我不知道如何将它们组合成一个很好的、整洁的模型。我能用R中的机器学习包吗?我不一定需要一个完整的答案这个问题,我只是不知道从哪里开始!如果这有帮助的话,我可以在R中建立基本的线性和逻辑回归,所以我熟悉这些概念。

(现在也可以想象一下,你有数以百万计的通话记录,还有数以百万计的个人需要打电话,但却有人口统计数据,这会改变你的做法吗?)

EN

回答 1

Data Science用户

发布于 2018-08-11 16:02:26

添加一个变量,指出它是否是您第一次调用此人;这将非常有用,当您稍后将结果推广到您以前从未调用过的人(以及必须排除在您的培训数据中的人)时。如果是我,我会从一种更探索性的技术开始,比如决策树。您可以使用rpart实现决策树。决策树将显示您的潜在解释变量与呼叫应答的不同概率之间的分割和关联方式。然后用它建立你的模型。你说过你有过logistic回归的经验,这是一个合适的选择。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/36788

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档