首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我应该使用哪个数据库来管理关系?

我应该使用哪个数据库来管理关系?
EN

Software Engineering用户
提问于 2011-10-22 14:31:37
回答 4查看 2K关注 0票数 1

我需要两种能力:

  • 计算相互的朋友区分不同类型的边缘,例如朋友,敌人和其他)
  • 获得区分不同类型边之间的关系

我的问题是速度:如果我使用一个数据库作为MySQL,我可以在几分钟内得到成千上万的关系,但是如果我需要计算共同的朋友,这对我的服务器来说代价很大,不是吗?

我在我的网站上有大约10万个账户,我想介绍一个关系系统,但很明显,我必须决定发展它的正确方式。你知不知道?

EN

回答 4

Software Engineering用户

发布于 2011-11-21 11:22:59

由于您在网站上有100000个用户帐户,我将为您运行一个快速估计:

  • 100 000帐户
  • 假设 ~30%的帐户实际上是活跃的
  • 假设 ~20%的活跃账户平均有100个关系
  • 假设 ~80%的活跃账户平均有10种关系

换言之:

  • 70k用户基本上是不活动的
  • 24k用户平均拥有10种关系。
  • 6k用户平均拥有100个关系。

这意味着您的多到多关系表将具有:

70k *0+ 24k * 10 + 6k * 100 =840 k行或~100万行

老实说,100万行对于正确配置的RDBMS来说是微不足道的。此外,你可能会有能力应付,直到你有大约几百万个帐户,只是扩大。

注意:假设您添加了一个类似于此的表:

代码语言:javascript
运行
复制
SourceUserId, DestinationUserId, LoveOrHate
票数 3
EN

Software Engineering用户

发布于 2011-11-21 13:23:34

首先,无论您选择哪种解决方案,获取共同朋友列表都是相当容易和快速的操作。它只是得到所有的用户A朋友,得到所有的用户B朋友和交叉的结果。

许多RDBMSes实现了本机使用INTERSECT,一些NoSQL存储也设置了交叉命令(例如:SINTER在Redis)。

另一件事是,图形数据库的性能没有那么好。当然,他们还宣传了“与关系DBs相比,1000倍或更多的改进”。然而,这是对泛型图和泛型图算法的改进。它们提供了更大的灵活性,但是如果您只有少数几种类型的关系,那么构建在关系数据库或NoSQL之上的专用代码将更有效率。

票数 2
EN

Software Engineering用户

发布于 2011-10-22 14:47:24

您可以使用像Neo4j这样的图形数据库。

...an开源、高性能、企业级NOSQL图形数据库.Neo4j是一个健壮(完全酸性的)事务性属性图数据库。由于其图形数据模型的特点,Neo4j具有高度的灵活性和快速性。对于连接的数据操作,Neo4j运行速度比关系数据库快一千倍.

它们有利于用户之间的关系,例如社交网站。

票数 1
EN
页面原文内容由Software Engineering提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwareengineering.stackexchange.com/questions/115720

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档