我正在收集个人网络中的MAC地址。输出将保存为csv格式。只有两列: MAC和TIME。下面的图片应该清楚地演示了我的数据文件:
我要做的是找出输出中是否有重复的行(基于MAC列)。如果是,那么我将需要检查最后两个副本,看看是否有1小时或更长的时间间隔。如果再次返回yes,那么我将不得不从输出中删除此MAC地址的所有重复项。到目前为止我所拥有的:(我试着写一个函数,我把它叫做'check list cleaner‘,它可以在任何时候或每分钟调用,以便删
考虑到可能存在一些间隔不均匀的数据点,我想定义一个函数来获取时间序列和间隔X(例如,30分钟或任何其他间隔)作为输入,并给出在X间隔内间隔点作为输出的时间序列。因此,该算法应该检测缺失时间并删除它们,并创建合适的时间并为它们生成值。然后根据定义的函数,对采样率进行调整和标准化。对于近似丢失的数据并对其进行清理,无论是平均插值还是线性插值都是可行的。以下是原始数据的一部分:
import pa