我正在使用sklearn的成对距离函数,它在计算一个巨大的矩阵时拯救了我的生命,但是我遇到的问题是我失去了我的指数。具体来说,我最初有一个17000 x 300的巨大数据,我根据某些类条件将其分解为4种不同的数据格式。四个单独的数据数组保留原始索引,但在对其中一个数据执行成对的距离函数后,它给我返回一个具有正确值的</e
组内没有重复的观测值,但在整个数据集中组之间有许多重复的观测值。我想要两组之间有多少重复观察的成对矩阵。Bat 3 Night
Bat 3 Night
Deer 2 Night (在A组和B组) 我最接近的是这段代码,它没有创建成对矩阵,而是列出了共享的观察值如果有人能给我如何在dplyr或base R中做到这一点的