前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas:根据行间差值进行数据合并

pandas:根据行间差值进行数据合并

作者头像
Bo_hemian
发布2020-09-09 12:32:28
7820
发布2020-09-09 12:32:28
举报
文章被收录于专栏:machine_learning

1. 问题描述

在处理用户上网数据时,用户的上网行为数据之间存在时间间隔,按照实际情况,若时间间隔小于阈值(next_access_time_app),则可把这几条上网行为合并为一条行为数据;若时间间隔大于阈值(next_access_time_app),则可把这几条上网行为分别认为是独立无关的行为数据。 具体可结合下图理解:

因此需求是有二:一是根据阈值(next_access_time_app)决定是否需要对数据进行合并;二是对数据合并时字段值的处理。其中第二点较为简单,不做表述,重点关注第一点。

深入思考,其实这个问题的关键是对数据索引进行切片,并保证切出来的索引能被正确区分。

因此,此问题可以抽象为:如何从一个列表中找出连续的数字组合?

2. 解决办法

代码语言:javascript
复制
t1 = []
t2 = []
for idx in continuous_action_index:
    t1.append(idx)
    if idx + 1 not in continuous_action_index:
        t1.append(idx + 1)
        t2.append([t1[0], t1[-1]])
        t1 = []

3. 总结

在遇到问题时,能否快速定位到问题的本质,进而采取相应的办法去解决,本身就是对解决问题能力的一种衡量。

之前刷过一些Leetcode试题,之所以会觉得和实际业务无法有效结合,其实是因为自己遇到的问题太少而产生的幼稚想法。

总之,以后在工作中需要多多进行知识的串联,这样才能把能力做到最大化提升。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-12-13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 问题描述
  • 2. 解决办法
  • 3. 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档