前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面向大规模社会关系网络数据的层次数据发现

面向大规模社会关系网络数据的层次数据发现

作者头像
sparkexpert
发布2022-05-07 14:06:35
1870
发布2022-05-07 14:06:35
举报

现在随便哪个关系网络的数据规模都非常庞大,如https://snap.stanford.edu/data/上面公开的数据集,动不动都是几万个节点,十几万个边的。

然而这种大图数据背后的一些规律挖掘更突显了大数据发现价值的本质。

本篇博客在承接上次社团发现的问题,继续在大规模关系网络挖掘上进行分析测试。

主要实验数据集采用了三个:

(1) https://snap.stanford.edu/data/com-DBLP.html

com-DBLP

Undirected, Communities

317,080

1,049,866

13,477

DBLP collaboration network

对30多万个节点,100多万个边的测试,速度还是超快的,只需要

(2) https://snap.stanford.edu/data/com-Youtube.html

com-Youtube

Undirected, Communities

1,134,890

2,987,624

8,385

Youtube online social network

对110多万个节点,300万条边的测试

(3) 然而对于下面这个数据集,边数超过1000万,就发现内存不够的现象,这种现象简直是无解,普通PC还是胜任不了超大规模图的计算。当然要计算,得进行数据的预处理操作。

cit-Patents

Directed, Temporal, Labeled

3,774,768

16,518,948

Citation network among US Patents

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2015-12-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图数据库 KonisGraph
图数据库 KonisGraph(TencentDB for KonisGraph)是一种云端图数据库服务,基于腾讯在海量图数据上的实践经验,提供一站式海量图数据存储、管理、实时查询、计算、可视化分析能力;KonisGraph 支持属性图模型和 TinkerPop Gremlin 查询语言,能够帮助用户快速完成对图数据的建模、查询和可视化分析。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档