首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面向电信行业存量用户的智能套餐个性化匹配模型(top6)

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

作者头像
大黄大黄大黄
发布2019-04-09 16:01:29
1.6K0
发布2019-04-09 16:01:29
举报

1、赛题链接:面向电信行业存量用户的智能套餐个性化匹配模型

2、赛题任务: 利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。

3、数据解读及预处理:

  • 多分类任务–>11分类;根据service_type来划分套餐 ,一类8个,另外一类3个(下文图片里面的大宝卡以及腾讯王卡系列)。
  • 11个套餐表所对应的卡,通过对1_total_fee进行value_counts和网上套餐比较可以大致推出来。
在这里插入图片描述
在这里插入图片描述
  • 数据预处理---->清洗数据以及对1234_total_fee进行类似3sigma的进行标记。

4、特征工程:

  • 对1-2-3-4_total_fee进行min ,max ,std ,mean等操作;最后发现四个月话费的最小值是比较强的特征,从EDA来看对套餐区分是比较明显的。
在这里插入图片描述
在这里插入图片描述
  • 本月流量以及上个月流量的差值特征;并且发现某些用户上个月的流量是一个完整的数值,比方说1024,2048,3072这种数值,对这种用户进行了简单的标记。
在这里插入图片描述
在这里插入图片描述
  • 用当月费用减去超出通话时长的钱。1_total_fee - (service1_caller_time)*0.15
  • 计算每个用户的基本费用(base_fee)
在这里插入图片描述
在这里插入图片描述
  • 判断四个月的话费是否是一个整数。比方说套餐36的用户如果账单里面出现了36和36.0的话,那么后者36.0可能是其他base_fee通过开加油包等超出套餐费用叠加上来的。
  • 四个月的费用分别groupby(“complaint_fee”)进行count。
在这里插入图片描述
在这里插入图片描述

5、搭建模型:

模型: 十折的lightgbm模型 + 五折的xgboost模型

xgboost实在是太慢了,没有GPU加成的话貌似要跑差不多一个白天,但是用上GPU精度就降低了。

6、模型融合: 通过林有夕大神分享的投票代码进行融合,有一点收益但是不大。

7、处理:

  • 我们队伍是失败了,大概思路就是对模型分不开的两个套餐加一个权重。决赛队伍应该都是有分享的。
  • 还有就是植物之前ijcai2018所用过的"食之无味,弃之可惜",惜的是我们也失败了。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年03月26日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档