前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于校园用户模型一点浅谈

关于校园用户模型一点浅谈

作者头像
python与大数据分析
发布2022-03-11 13:26:41
3410
发布2022-03-11 13:26:41
举报
文章被收录于专栏:python与大数据分析

前后花了1个月时间思考校园用户模型,这个模型呢,下过N多版本的规范,也做过好多遍,市场形势的变化,校园用户的特征变化,导致这个模型也越来越失真。数据分析想过,数据挖掘模型也考虑过,一直没有头绪,去年9月开学期曾经想做过,结果没作准,感觉很没面子,今年干脆放手做一下,挺好玩的;简单写一下,也不涉及什么机密和算法,算法这东西无所谓有也无所谓无,都是一点点的累积起来的,每一个想法都是在之前一步步验证出来的。

比如爬虫技术,涉及百度POI和高德POI,开发了N版爬虫,到现在也很难算一个成功的产品;最终是爬出来校园的边界线。

比如点面算法,网上有很多版本,不断的尝试和测试,就OK了。

爬虫和点面算法,就把基站带到了校园区域内,即不轻信别人提供的数据,也不轻易否认别人提供的数据,两者结合就形成了各高校的基础数据。

人口的驻留特征花费了不少时间验证,假设你是一个学生,你会每天在校园上多久的课?每天必去哪里?每个月在校园至少呆多少天?这是校园用户的基本判断条件,当然由于基站的覆盖原因,这里面还包括了很多其他用户?如何排除这些用户?是另外一个话题,根据用户的标签,根据用户的寒暑期特征?在这里不细说了。

关于人口的驻留特征,基于基站统计过,基于基站的内推发统计过,基于MR的位置统计过,最终选择了基站统计法。

当然最后的输出,包括用户的基本属性、年龄、开户时间、校园、驻留时长、天数等等,便于进行再次筛选,限于不可明说的原因,暂时说到这里。

下面的图是一个基本的思路草稿图:大概介绍了校园用户模型用到的知识点。后面的图是两幅统计分析图,仅供娱乐。

该图是某些高校不同年龄段在寒假期间的绝对用户,可以看到用户陡降的时间点和平稳时间点,大致可以看到某些阶段是离校高峰期,而开学是错开时间点的,春节前后的10天基本平稳,也就是说这20天基本上是常驻人口了。

下面的图是海南高校在一段时间内不同年龄段的占比的变化,大致可以看到春节前后10天左右18-24岁年龄的占比是最低的,也符合校园用户特征;年龄>50的占比随着人口的变化占比反而变高。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 python与大数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档