专栏首页机器学习AI算法工程快手活跃用户预测_哈工大团队解决方案

快手活跃用户预测_哈工大团队解决方案

“快手”新注册用户脱敏和采样后的数据30天,预测未来7天活跃的用户。

解决方案:滑窗法

特别特征:因为注册必登陆,行为能体现用户的某种本质,所以对注册当天提取了特征,注册本身是一种异常,所以去除注册当天记录后再提取特征

主要使用lgb模型,xgb、catboost提升微小。另外使用了三个NN模型(keras+tensorflow)。前两个NN结构相似,都是把mlp,lstm,cnn集合在一个网络中。

lgb线下0.8905~0.891,三个NN线下都可以0.891+

第一个NN训练方式非常对新手友好,

第二个NN训练比较正常。

第三个NN为GBDT特征(使用xgb提取)+deepFM,主要是对网上的开源代码做了点修改,以个人理解实现。

滑窗法对近期用户预测不准:

另外对26-30的用户使用单天滑窗,单独提取特征,使用5个lgb模型进行单独预测

AI项目体验地址 https://loveai.tech


本文分享自微信公众号 - 机器学习AI算法工程(datayx)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python+flask搭建CNN在线识别手写中文网站

    目前国内有很多优秀的中文手写识别数据集。例如:北京邮电大学模式识别实验室发布的数据(HCL2000),它是目前最大的脱机手写汉字库,共有1,000个人...

    机器学习AI算法工程
  • 用keras对国产剧评论文本的情感进行预测

    RNN即循环神经网络,其主要用途是处理和预测序列数据。在CNN中,神经网络层间采用全连接的方式连接,但层内节点之间却无连接。RNN为了处理序列数据,层内节点的输...

    机器学习AI算法工程
  • 知乎320万用户的信息分析与数据可视化

    art 1: 动机 作为一个知乎的重度用户,我深深的被知乎社区的高素质群体所吸引,这也是我在微信朋友圈、新浪微博、baidutieba等社区见不到的东西。那么为...

    机器学习AI算法工程
  • 深度学习的兴起:从NN到DNN | 小白深度学习入门

    1943年,神经生理学家和神经元解剖学家 Warren McCulloch 和数学家 Walter Pitts 提出了神经元的数学描述和结构,并且证明了只要有足...

    叶锦鲤
  • Science重磅!用光速实现深度学习,跟GPU说再见

    深度学习对算力的需求没有止境,但受制于能耗和物理极限,基于硅基的电子元件虽然现在还能支撑,但远处那堵几乎不可逾越的高墙已然显现。

    新智元
  • 聊聊我在这家公司设计的SSO

    是的,没错,小明接到这个需求以后,整体思路也是按着SSO设想的,但是细想之后,发现不能完全照搬,要考虑项目的实际情况:比如已知的几个子系统是之前的已经开发好的,...

    程序员小明
  • 数据分析之Pandas缺失数据处理

    3. 缺失数据的运算与分组 3.1. 加号与乘号规则 3.2....

    Datawhale
  • 创造互联网奇迹的微博,还会遭遇哪些局部战争?

    微博发布二季度财报后,盘前股价大涨超过4%达到89.99美元的历史峰值,市值首次突破200亿美元,成为BAT、京东、网易和携程之后,第七家摸到“200亿美元”红...

    罗超频道
  • 收藏|Pandas缺失值处理看这一篇就够了!

    本文目录 1. 基础概念 1.1. 缺失值分类 1.2...

    刘早起
  • 从头搭建一个HTTPS网站

    “ 在这个信息爆炸的时代,信息安全更加重要,也更加受到重视。比如说,如果你想搭建一个供微信小程序服务的后台,那么接口就必须是https的,今天就一起来搭建一个h...

    周萝卜

扫码关注云+社区

领取腾讯云代金券