首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何预测基于内容的需求

如何预测基于内容的需求
EN

Data Science用户
提问于 2019-02-19 12:08:37
回答 1查看 103关注 0票数 2

这是我在ds StackExchange上的第一篇文章,所以请温和一点,如果有什么不清楚的地方请告诉我:)

我有许多产品(>100万),我将所有购买的产品都保存在一个带有时间戳的DB中。(“采购数据”)

每种产品都有“内容特征”(如产品尺寸、产品安全等级等)。

“购买数据”如下所示:

\x\x{e76f}\{e76f}\x{e76f}\x{e76f}

其中每一行都是购买带有时间戳id的产品。

我的主要目标是获得明天最想要的产品,我将问题转化为第二天的需求预测,或者将每个产品标识和日划分为高需求或低需求),

在这些设置中,我遇到了两个主要问题:

  1. 生成需求数据:我希望将“购买数据”转换为一天的需求(“需求数据”)--这意味着我按产品id和天对数据进行分组,然后计数行数并将其保存为'freq‘(并删除行复制).问题是,每天的最小产品频率是1,而不是0。

例如:如果产品#1在周日3次购买,周三2次购买,则购买和需求数据如下:

“购买数据”fi(产品id)正在映射到内容特性i:

| time stamp | product id | content f 1 | ... | content f N | | Sunday 05:20 | 1 | f1(1) | ... | fn(1) | | Sunday 08:11 | 1 | f1(1) | ... | fn(1) | | Sunday 10:25 | 1 | f1(1) | ... | fn(1) | | Wednesday 08:10 | 1 | f1(1) | ... | fn(1) | | Wednesday 16:20 | 1 | f1(1) | ... | fn(1) |

“需求数据”:

| day | product id | content f 1 | ... | content f N | freq | | Sunday | 1 | f1(1) | ... | fn(1) | 3 | | Wednesday | 1 | f1(1) | ... | fn(1) | 2 | But if product #1 was not purchase at Monday there wouldn't be any row since there is no purchase data for this item at that timestamp.

由于有超过100万种产品,所以我希望避免创建0频率的行,

是否有一种方法可以在不使用0需求行的情况下为大量项目(产品)创建(或设计)需求数据?

  1. 基于内容的时间序列:在创建“需求数据”之后,我想将其用作时间series. --我的问题是,我需要将数据分割成1米以上的序列,每个产品/项目id都有一个,而且这些序列也非常稀疏.我想找到一种使用“内容特征”作为时间序列输入的方法,并让模型学习使用某种基于相关内容特征的时间序列平均值。

基于内容的序列时间预测的最佳建模方法是什么?

EN

回答 1

Data Science用户

发布于 2019-02-19 13:38:04

欢迎来到现场。我鼓励你以不同的方式思考你的问题。你关注的是“今天卖了什么”,而你应该关注的是“谁在历史上买了什么”。

您要寻找的是一种推荐系统,通常有两种类型:

  1. 基于内容的-您应该根据产品的属性推荐什么?算法基本上是说,“你买了早餐麦片,这是其他产品可能与你的麦片…”
  2. 基于社区-根据购买产品的人的属性,你应该推荐什么?算法基本上是说,“你是女性,30岁以下,没有孩子,其他女性,30岁以下,没有孩子,也喜欢这些产品…”

我将假设您没有关于您的客户的信息,所以让我们关注基于内容的推荐人。考虑产品的属性是正确的,但您应该同时考虑它们(1)比昨天更长的时间,以及(2)产品和它们的属性是如何相互关联的。需要属性X的人也可能需要属性Y,也就是(很可能)跨越多个产品,并将对这些产品产生更高的需求。

在您选择的语言/工具中开始研究基于内容的推荐系统,最终您将得到所需的算法。在那里,您还可以考虑用户数据收集,然后进入一个基于社区的长期推荐。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/45807

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档