首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何检验预测模型的影响

如何检验预测模型的影响
EN

Data Science用户
提问于 2022-09-11 07:42:54
回答 2查看 84关注 0票数 0

假设我建立了一个电子邮件营销活动,目标是预测哪些成员将购买或不购买,并在此基础上改变营销电子邮件活动。在我们建立了模型之后,假设我们建议以某种方式改变营销邮件的主体。经过一季后,我们发现与上季或去年同季比较,购买量增加了10%。我们如何知道这10%的增长是由于模型的预测能力和随后的变化,而不是任何其他原因,如外部因素?我们是否应该进行A/B测试,如果是的话,具体是如何进行的?假设检验怎么样?如何计算机器学习模型的样本大小?

EN

回答 2

Data Science用户

发布于 2022-09-11 17:07:19

在营销电子邮件中应用倾向机器学习模型的一种方法是:

  • 使用二进制分类器建立机器学习(ML)模型,以预测哪些客户更有可能购买。
  • 根据营销预算和联系标准,应将电子邮件发送给更倾向于按预期行事的客户(即购买毕竟),但将其中一些客户不作为一个控制组进行干预(干预意味着发送新邮件,而不是干预发送旧邮件):

在这种情况下,您可以:

  • 使用选定的度量(AUC,recall.)评估您的ML模型性能(一旦它在生产中,一旦它已经被用于运动)。对于未接受任何干预的客户群体(本例中的新邮件),它可能使用的是B&D。
  • 另一方面,通过使用假设测试和置换测试等方法,对收到新邮件的客户和没有收到邮件的客户(A和B)进行比较,评估活动的有效性;您的无效假设是,接收和不接收电子邮件的客户之间没有实际的差别(效果),您想要检验它是否真的是错误的(即,拒绝此假设,确认该活动实际上是有效的。您可以遵循以下步骤(信息来源):
  1. 计算样本A和B (n &m尺寸)的统计量的差异
  2. 将所有度量合并到一个数据集中。
  3. 从2中数据集的所有可能排列中绘制一个置换数据集。
  4. 将置换数据集划分为大小为n和m的两个数据集A‘和B’
  5. 计算这些样本的差异并记录此差异。
  6. 重复步骤3-5,直到对所有(或充分的)排列进行评估。
  7. 将p值作为记录差异的次数至少与原始差值一样极端(从1开始陡峭),然后除以排列总数。
票数 1
EN

Data Science用户

发布于 2022-09-12 14:36:10

衡量干预成功的基本方法(如电子邮件活动)是进行A/B测试。为了更深入地了解哪些客户部分更多或更少受到该活动的影响,您应该使用来自"uplift建模“领域的方法。你可以在网上找到大量的资料。

举个例子,在运行A/B测试之后,您可以使用“转换结果方法”计算一个新的响应变量y^*=\frac{ y*I_{treated}}{p_{treated}}+ \frac{y*I_{\text{not treated}}}{p_{\text{not treated}}},然后您可以以y^*为目标运行您喜欢的任何ML模型,并且您将得到预期的治疗效果作为预测变量(例如国家)的函数。

这里有几篇文章可以让你开始:

https://towardsdatascience.com/a-quick-uplift-modeling-introduction-6e14de32bfe0

https://towardsdatascience.com/uplift-modeling-e38f96b1ef60

我还编写了一个R包,它在R:https://github.com/IyarLin/segmenTree中使用了上述方法

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/114313

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档