专栏首页腾讯大数据的专栏SparkInAction 图计算 用户关系染色分析

SparkInAction 图计算 用户关系染色分析

前言

需求:如果一个用户使用了某个手机,这个手机上登录过其他的用户,那么这些用户是有关系的,同样用户关联到的用户又可以通过手机关联到其他用户 这样就构成了一个强大的关系网。现在给出用户与手机登录关系表,请找出所有的用户是有关系的。

问题分析

整个用户手机关系网拓扑图如下图所示:

从图中可以发现,找到有关系的关联的用户,就是要找出上面无向图的所有联通分支。比如上图有两个联通分支。

测试数据集

对应上图,测试数据集合如下:

希望的输出结果为所有关联的用户对应同一个ID。

测试代码

运行结果:

可以发现,结果正如我们所料。

总结

基于 Spark GraphX 可以做很多图计算方面的事情,而且是分布式,速度比单机处理快,值得好好研究。

本文分享自微信公众号 - 腾讯大数据(tencentbigdata)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-12-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据赋能,如何精细化运营?

    3月18日,腾讯大数据举办了2018年线下沙龙—深圳站,吸引了深圳互联网圈众多运营&推广的小伙伴踊跃报名参加活动,共同探讨主题:互联网用户增长与运营之道。 信息...

    腾讯大数据
  • 腾讯大数据沙龙(北京站):赋能运营,助力增长!

    腾讯大数据
  • 腾讯推荐——让您的系统瞬间个性化

    腾讯推荐 “腾讯推荐”是腾讯大数据近期大力打造的开放服务平台,旨在集业务接入、数据上报、算法计算、实时推荐和效果监控于一体,对外提供全自动实时精准推荐服务。 ...

    腾讯大数据
  • 如何设计出一款出色的结账表单

    以下内容由Mockplus团队翻译整理,仅供学习交流,Mockplus是更快更简单的原型设计工具。

    奔跑的小鹿
  • App 数据分析到底要分析什么

    DAU、MAU、留存率、频率、时长.....到底产品经理要分析什么数据?笔者结合海外移动端产品的数据分析实践与MTA服务的客户案例,带你从产品初创到成熟不同阶段...

    旺仔小小鹿 .
  • 运营必读 |“用户金字塔模型”在社区产品中的重要性

    用户1756920
  • 电商如何进行精细化运营?

    背景:在互联网及移动设备不断普及的时代背景下,越来越多的国内传统品牌商及国际知名品牌为提高销售规模纷纷试水电商业务。基于电商市场的持续扩增以及品牌商电商化的业务...

    1480
  • 蚂蜂窝 :1.2 亿用户背后的数据驱动

    大家好,我是都斌,现任蚂蜂窝电商事业部副总裁。旅行是一件让人非常开心的事,所以我今天就用比较轻松的方式来跟大家分享一下我们蚂蜂窝是如何数据驱动业务增长的。 一、...

    沉默的白面书生
  • 诸葛io客户成就总监邱千秋:数据驱动下的理财产品业务增长探索

    数据猿导读 科技金融相比传统金融具备更高的效率、更大的灵活性和更强的抵御金融风险的能力。想跑在金融标杆的前列,一方面要将用户体验做到极致,另一方面要保持不断创新...

    数据猿
  • 功能主观评测之用户选取

    用户5521279

扫码关注云+社区

领取腾讯云代金券