缺失值的类型一般可以分为:
完全随机缺失 (MCAR);
当缺失值对任何其他变量或任何观察特征没有隐式的依赖性时,就会发生这种情况。...存在缺失值时的距离计算
让我们看一个例子来理解这一点。考虑二维空间 (2,0)、(2,2)、(3,3) 中的一对观察值。这些点的图形表示如下所示:
基于欧几里德距离的最短距离的点被认为是最近的邻居。...在这种情况下,上面的代码显示观察 1 (3, NA, 5) 和观察 3 (3, 3, 3) 在距离方面最接近 (~2.45)。...因此,用第 1 最近邻估算观察 1 (3, NA, 5) 中的缺失值将给出 3 的估计值,这与观察 3 (3, 3, 3) 的第二个维度的估计值相同。...此外,将观测值 1 (3, NA, 5) 中的缺失值与 2 最近邻进行估算将给出 1.5 的估计值,这与观测值 2 和 3 的第二个维度的平均值相同,即 (1, 0, 0) 和 (3, 3, 3)。