首页
学习
活动
专区
工具
TVP
发布

决胜机器学习

专栏成员
219
文章
292714
阅读量
105
订阅数
有趣的算法(十) ——归并排序思想解决大量用户数据清洗
有趣的算法(十)——归并排序思想解决用户数据清洗 (原创内容,转载请注明来源,谢谢) 一、问题阐述 近期工作中接触到一个很有趣的算法,在此进行分享。 当前有一个千万条级别的用户数据,其中包含用户openid、用户是否有效状态。其中,这些用户是关注微信公众号的用户,openid是可以从微信拿到的接口中,确定的用户信息。 每个用户关注或者取消关注,系统可以从微信接口中获取信息,并且每个新关注的用户,系统会搜索现有库,如果用户openid已经在数据库中存在,则将其状态置为有效;如果用户不存在,则新增一条记录,
用户1327360
2018-03-07
9160
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档