首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【干货】Logistic回归Python实战,评估销售系统的盈利能力

【干货】Logistic回归Python实战,评估销售系统的盈利能力

作者头像
WZEARW
发布2018-04-12 13:01:05
1.4K0
发布2018-04-12 13:01:05
举报
文章被收录于专栏:专知专知

【导读】一个企业的盈利与其销售市场部门密不可分,传统的销售手段是销售人员逐个联系现有或潜在的顾客,这种方式不仅耗时耗力,而且不可避免地会有疏漏,不能够精准地联系到购买潜力较大的顾客。在本文中,Sai Vishnu Kanisetty将机器学习中的Logistic Regression(逻辑回归)运用到销售系统中,用Python实现,目的是寻找系统中具有高转化率的客户,从而提高工作效率,提升企业利润。专知内容组编辑整理。

Logistic Regression in Python to evaluate profitability of Sales-Marketing System

企业的销售和营销部门负责“找到客户,销售和赢利”。销售人员通过多种沟通方式联系现有客户和潜在客户,由于时间和成本限制,不能联系到所有的客户。在这篇文章中,机器学习中的逻辑回归(Logistic Regression)被用来识别具有较高转化率的目标人群,针对确定群体的盈利能力进行评估。

要了解更多内容,请参考我的GitHub。

GitHub:

https://github.com/saivishnuk/Data-Science/tree/master/Logistic-Regression-to-evaluate-profitability-of-Sales-Marketing-System

▌文章大纲


1)总体了解销售系统,并说明本文中使用的示例;

2)了解逻辑回归技术,以及在这种情况下它如何发挥作用;

3)方法,代码和盈利能力的评估结果。

▌总体了解销售系统,并说明本文中使用的示例


大多数销售系统都是通过销售代理访问或手机联系客户。生成销售线索和将销售线索转化为客户以及接触客户都要消耗成本,是一项时间和成本密集型任务。

例如,一家公司推出了一款新产品,并希望与可能对该产品感兴趣的现有客户进行接触。 公司现有客户的数量为41,188,公司估计接触客户的平均成本为10美元,如果客户购买产品,那么平均收入为50美元。从数字来看,成本与收入比是1:5,这样做会产生很大的利润。意识到以前的市场营销活动(〜11.5%)中同类产品的转化率,管理者明白,这种瞄准每一个客户的做法会造成很大的损失。 因此,经理决定“首先确定目标受众,然后再做预算。 他希望他团队的数据科学家回答3个问题:

  • 实现最高投资回报的成本是多少?
  • 实现最高利润的成本是多少?
  • 利润-投资平衡点涉及的成本是多少?

▌了解逻辑回归技术,以及在这种情况下它如何发挥作用


二项逻辑回归(binomial logistic regression)预测了二分类中类别的概率,该变量基于一个或多个独立的变量,可以是连续的也可以是离散的。 在销售系统中,因变量是先前营销活动的结果,自变量是先前的活动指标,如“过去已达到客户的次数”,“自上次购买以来的天数”,以及客户的统计特征。在本文中,我们假设数据已经按照7/3的比例划分为训练集和测试集,并且我们只关注衡量盈利率的方法。

▌方法,代码和盈利能力的评估结果


1.在训练集和测试集中,结果变量为“1”(购买产品标记为1)的客户的百分比为11.2%。

2.通过训练集中的所有客户来计算“每个客户的平均利润”。

这表明,通过向所有客户提供约11.2%的转换率将导致$ 1,25,710的损失。 所以,可以把目标转向具有更高转换率的顾客。

3. 对训练集进行Logistic回归,并使用事件发生的预测概率、以0.01的间隔来计算每个概率值的成本,收入,利润和投资回报(ROI)。

上述函数以“实际结果”,“事件发生的预测概率”,“每个人的成本”,“每个人的收入”,“检查的概率范围”作为输入。 下面的代码调用上述函数,将训练数据作为输入,并估计每个人的成本和收入,来进行决策。

如果客户购买产品或不会购买产品,则“事件发生的可能性”被认为是隔离的。 我们可以观察到,随着“事件发生概率”的增加,“目标顾客百分比”减少。有趣的是,事件发生概率减少了,投资回报率却增加了,这意味着尽管我们减少了顾客数量,但是与增加顾客数量相比,我们得到了很好的结果,这也可以在下面的图表中看到

关于事件发生的不同预测概率的收入,成本和专业图表:

该图显示,随着“事件发生概率”的增加,成本,收入等指标不断下降,ROI也在增加。 根据“预算限制”,“高投资回报率”等需要,可以选择一个特定的概率作为截止点。

不同成本的投资收益和利润图

从前面的结果可以看出,这张图也显示了“利润和ROI随成本增加而降低”。这张图可以用来回答管理者提出的三个问题:

1) 实现最高投资回报的成本是多少?

成本较少会带来较高的投资回报率,但是与较高的成本相比,相关的利润则会较少

2) 实现最高利润的成本是多少?

成本较高会得到很高的收益,但这样的高成本可能带来更低的投资回报率

3) Profit-ROI平衡点涉及的成本是多少?

支出11,300美元,可以得到25,300美元的收入,而这笔支出的投资回报率为224,截止概率为0.42

我们还需要确保将截断概率设置为0.42才不会导致过拟合或欠拟合,并且测试数据的结果与训练数据差不多。

在上面的代码中,model_eval是用户定义的函数,结果表明训练和测试结果的模型评估指标几乎相同。 因此,0.42可以被视为截止概率,概率在0.42以上的所有客户都可以被视为目标人群。

参考文献:

https://towardsdatascience.com/logistic-regression-in-python-to-evaluate-profitability-of-sales-marketing-system-fe2261964fa4

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-01-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 专知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档