我正在清理从csv文件导入的一些数据。数据框有2998列。但是,当我导入数据时,它在2998之后的几列中创建了NAs。我尝试使用codel删除这些列,比如: DF <- DF,c(-2999),但它什么也不做(在环境中,它说我只有2998列)。 how the data look as exported in a csv 如何删除这些NAs?
我有两个数据帧(df1和df2),这两个数据帧有100多列。JA列是id列。我想一次比较两列,并从两个数据框中获得未合并的结果,就像df3一样。我为BC列创建了df3。我想对整个数据帧执行此操作。我的意思是,我必须逐个检查每一列,而不是一次检查所有列。当我检查一个列时,我想创建类似于df3的东西。有没有办法做到这一点。
df1
JA AB BC fas waa ad
1 1 ace 52 5 2 ce
2 22 a e 3 5 78 ce
3 36
我在dataframe中有两个列,其中包含左侧外部联接后的日期信息。由于联接的样式,其中一个日期列现在包含NAs。我想检查这些列之间是否所有非NA值是相同的。下面是一个例子:
date 1 date 2
1/1/21 NA
1/2/21 1/2/21
1/3/21 NA
1/4/21 1/4/21
如果所有非NA值匹配,则不需要第二列。
在我做左外连接之前,我做了一个外部连接,下面是这样的语句:
identical(df[['date 1']], df[['date 2']])
返回一个true,因为两列中的每一行确实是
我有一个数据框,其中包含起点和终点之间的距离。起始点在行中,终点在列中。现在我想把它们逐个打印出来(起点、终点、距离、新行)。应省略缺少的值(NAs)。
这是我的数据框:
EndPoint
StartPoint TX001 TX002 TX003
TX002 37.4 NA NA
TX003 NA 14.78704 NA
TX005 NA NA 60.78947
我想要得到的是:
TX002 TX001 37.4
TX003
我有一个最终将被转换为xts对象的数据文件。第一列包含日期数据,而所有其他列都包含数字数据。但是,并非所有数值列的值数/长度相同。有些列包含NAs的行比其他列多。
我希望通过删除列中包含NAs的行来筛选数据,该列的NAs数量最少,但对于我所选的所有其他列,仍然保留包含NAs的行。例如,下面的列grpA的NAs数量最少。我希望删除包含NAs的前2行数据,但不管值是什么,都要在grpB中保留它们。
我所拥有的:
Date grpA grpB
2007-11-06 NA NA
2007-11-07 NA NA
2007-11-09 1.66 NA