首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python :挖掘时间有序序列的方法

Python :挖掘时间有序序列的方法
EN

Data Science用户
提问于 2020-09-14 14:37:00
回答 1查看 272关注 0票数 0

我有一个如下所示的数据集:

代码语言:javascript
复制
timestamp          event

12/1/2020 14:30     A  
12/1/2020 14:12     C
12/1/2020 14:10     A
12/1/2020 12:01     B
11/1/2020 21:20     A
11/1/2020 21:00     B
   .....           ...

events是用户在应用程序上的操作。timestamp是引发该特定事件的时候。我想挖掘数据中的事件序列,以找出用户的工作流程(带有时间限制的市场篮子分析?)从用户开始使用应用程序之日起就已在应用程序中。

解决这个问题的正确方法是什么?是否有允许我将序列挖掘作为黑匣子应用的库??

EN

回答 1

Data Science用户

发布于 2020-09-14 16:28:15

  1. Tru从datetime列中生成一些特性- attr =

你可以谷歌搜索关于制作日期功能。2)找出事件的累积和-

代码语言:javascript
复制
cumsum_df_all = df.groupby('column')[other-columns].cumsum()
cumsum_14_day = (df.groupby('column')[other-columns].rolling(14, min_periods=1).sum().reset_index(0, drop=True)

就像wise 7,3,1天一样,只要看看数据有多频繁,它就会快速变化。

  1. 同样,查找roling std dev。还有艾格。

rolling_avg_14_day = (df.groupby('column').rolling(14,min_periods=1).mean().reset_index(0,drop=True))

相应地设置滚动周期。

  1. 查找特定时间段的事件值之间的差异- diff_7_day = df.groupby('column').diff(periods=7)

基本上,我们试图将时间有序序列转化为线性回归问题。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81688

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档