首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >图模测度

图模测度
EN

Data Science用户
提问于 2015-02-25 10:07:24
回答 2查看 585关注 0票数 3

图聚类的质量有几个度量标准,例如Newman模块化。这些使您能够比较同一图的两个候选聚类。

有谁知道一个度量来回答“这个图有多模块化”这个问题吗?例如,这两个图中的第一个图比第二个图更模块化:o==o-o==o--o=o--o==o-o=o-o-o==o-o==o-o=o-o=o

可以选择一个聚类算法,运行它,并为找到的最佳聚类计算您喜欢的模块化度量。但这只是一个下限,所以看起来不太令人满意。

这个问题很重要。例如,如果生命的分子组织是模块化的,那么生命科学家的工作就会比没有模块化更容易。最好有一个强有力的测试--到目前为止,一些讨论似乎涉及一厢情愿的想法。

我对此最好的尝试是:-如果靠近叶子的边缘有更高的权重,树就更模块化--图的模块化是它的最小切割生成树的模块化,有人知道这个问题的既定答案吗?

EN

回答 2

Data Science用户

发布于 2015-02-26 11:19:35

我不确定是否有一个明确的答案,特别是因为问题似乎没有明确的定义现在-你的“数字”似乎表明了边缘权重,但你接着提到节点权重,一些明显不同的东西。

如果问题是您是否能够找到将一个图分成两个较小模块的方法,那么您可能需要考虑应用最稀疏的切割技术--低成本的削减将意味着(?)高度模块化。我相信这些可以很容易地修改,以解释没有标签,边缘标记或节点标记的图表。

票数 1
EN

Data Science用户

发布于 2018-01-25 07:43:29

没有一个答案。之所以有不同的聚类算法,部分原因在于集群有不同的标准。一种是集群内的三角形数,与跨越边界的数目相比--但这在二分图中是无用的。Infomap有一个微妙的,有时会带来好的结果。一个标准比较了集群中的边数(除以集群的大小)和离开集群的边数(除以图的其余部分的大小)。正如前面的答案所建议的那样,如果边权可以合理地被认为是节点之间某事物流动的能力,例如信息,那么剪裁是非常合适的。在这种情况下,最小割集生成树是图的合理摘要。树叶附近的强链接和中心附近的弱链接将表示模块化。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/5228

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档