问图模测度
EN

Data Science用户

提问于 2015-02-25 10:07:24

回答 2查看 585关注 0票数 3

图聚类的质量有几个度量标准，例如Newman模块化。这些使您能够比较同一图的两个候选聚类。

有谁知道一个度量来回答“这个图有多模块化”这个问题吗？例如，这两个图中的第一个图比第二个图更模块化:o==o-o==o--o=o--o==o-o=o-o-o==o-o==o-o=o-o=o

可以选择一个聚类算法，运行它，并为找到的最佳聚类计算您喜欢的模块化度量。但这只是一个下限，所以看起来不太令人满意。

这个问题很重要。例如，如果生命的分子组织是模块化的，那么生命科学家的工作就会比没有模块化更容易。最好有一个强有力的测试--到目前为止，一些讨论似乎涉及一厢情愿的想法。

我对此最好的尝试是：-如果靠近叶子的边缘有更高的权重，树就更模块化--图的模块化是它的最小切割生成树的模块化，有人知道这个问题的既定答案吗？

clustering

回答 2

Data Science用户

发布于 2015-02-26 11:19:35

我不确定是否有一个明确的答案，特别是因为问题似乎没有明确的定义现在-你的“数字”似乎表明了边缘权重，但你接着提到节点权重，一些明显不同的东西。

如果问题是您是否能够找到将一个图分成两个较小模块的方法，那么您可能需要考虑应用最稀疏的切割技术--低成本的削减将意味着(?)高度模块化。我相信这些可以很容易地修改，以解释没有标签，边缘标记或节点标记的图表。

票数 1

Data Science用户

发布于 2018-01-25 07:43:29

没有一个答案。之所以有不同的聚类算法，部分原因在于集群有不同的标准。一种是集群内的三角形数，与跨越边界的数目相比--但这在二分图中是无用的。Infomap有一个微妙的，有时会带来好的结果。一个标准比较了集群中的边数(除以集群的大小)和离开集群的边数(除以图的其余部分的大小)。正如前面的答案所建议的那样，如果边权可以合理地被认为是节点之间某事物流动的能力，例如信息，那么剪裁是非常合适的。在这种情况下，最小割集生成树是图的合理摘要。树叶附近的强链接和中心附近的弱链接将表示模块化。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/5228

复制

相似问题

问图模测度
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图模测度EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图模测度
EN