我目前正在编写一个脚本,用于从我的图表中删除冗余的数据点。我的数据包括来自相邻数据集的重叠,我只想要通常更高的数据。(想象两个x偏移量略有重叠的高斯分布。我只对重叠区域中的较高值感兴趣,这样当我组合数据以生成单个光谱时,我的最终图形不会变得非常嘈杂。)
以下是我的问题:
1)两个数据集的x值不一样,所以我不能简单地说"at x,take max y value“。它们很接近,但并不相等。
2) x值之间的距离不相等。
3)数据是有噪声的,因此可能存在多个数据集相交的点。虽然高斯A在相交后通常比高斯B更高,但噪声意味着高斯B可能仍然有一些更高的值。这意味着我不能简单地说“总是取这个x区域
我必须计算出n维空间中多面体之间的重叠百分比,其中我唯一可用的参考源是这些多面体中的一组随机采样点。 假设以下两个R对象是来自5维两个不同多边形的两组随机采样点: one <- matrix(runif(5000, min = 0, max = 5), ncol = 5)
two <- matrix(runif(5000, min = 0, max = 4), ncol = 5) 在本例中,我为第二个对象选择了一个较小的范围,因此我们知道应该有不到10%的重叠。如果我错了,请告诉我。 编辑:为了清楚起见,问题是这两个对象之间的重叠百分比是多少? 我需要一种推广到n维空间的方法