我想将社交网络图中的几个节点组合成一个值,用于排序节点:
in_degree + betweenness_centrality = informal_power_index
问题是,in_degree
和betweenness_centrality
是在不同的尺度上测量的,例如0-15 vs 0-35000,并且遵循幂律分布(至少不是正态分布)。
是否有一种好的方法来重新确定变量,这样在确定informal_power_index
时,一个变量就不会支配另一个变量?
三种明显的办法是:
mean
并除以stddev
)。这似乎会过多地压缩分布,将长尾值与peak.min(variable)
,再除以max(variable)
。这似乎更接近于解决问题,因为它不会改变分发的形状,但也许它不会真正解决这个问题?特别是,该方法将是different.mean(variable)
的方法。这不能解决尺度上的差异,但对于比较而言,平均值可能更重要?还有其他想法吗?
发布于 2012-06-28 18:44:56
非常有趣的问题。像这样的东西能起作用吗?
让我们假设我们希望将这两个变量缩放到-1的范围,例如betweeness_centrality的例子,其范围为0-35000。
的缩放版本。
这保留了幂律分布,同时也将其缩小为-1,1,并且没有(x-均值)/sd所经历的问题。
https://stackoverflow.com/questions/703924
复制相似问题