首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >时间序列数据分类

时间序列数据分类
EN

Data Science用户
提问于 2016-04-21 13:29:03
回答 1查看 242关注 0票数 3

背景:我正在做一个分类项目。在这里,我根据客户过去的购买历史向他们推荐商品。

问:“时间泄漏”对培训有何影响?

比方说,我正试图预测今天为某些客户购买的商品。我只训练以前的历史,不知道今天要买什么。我的特性包括一组二进制变量,在历史上的任何一天都可以被认为是推荐(1)或不推荐(0)项(本质上充当“哑”分类器本身)。例如,这些特性之一可能是某一项是否在客户的前10名列表中,等等。

在这种情况下,是否可以在整个历史中计算前10位,并根据这个列表创建一个应用于历史上每一天的特性?当然,这将使特征从历史的第一天就有了对未来的认识。

还是有一个滑动窗口,其中的功能创建只能回顾过去是更合适的?

EN

回答 1

Data Science用户

发布于 2017-07-11 12:06:44

我不完全理解你的例子,但是:

如果您想在某一天将您的模型投入运行/生产环境中.那么你就不应该在训练的时候允许“展望未来”。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/11340

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档