假设您有一个包含9列的dataframe。您希望删除列5:9中所有NAs的情况,如果列1:4中有NAs,则根本不相关。
到目前为止,我已经找到了允许您删除任何5:9列中有NAs的行的函数,但我只需要删除列5:9中所有NAs的行。
我编写了自己的函数来完成这个任务,但是由于我有300k+行,所以非常慢。我在想有没有更有效的方法?这是我的密码:
remove.select.na<-function(x, cols){
nrm<-vector("numeric")
for (i in 1:nrow(x)){
if (sum(is.na(x[i,cols])
我有一个有200行和150列的数据框架。在这些列中,我希望更改大约50行和100列的NAs。
下面是我的数据框架(一小部分)的一个例子:
>df
Bird Mammal Type
1 NA 1 A
2 1 0 B
3 1 0 A
4 0 NA A
5 NA 1 A
6 0 0 B
7 0 0 A
8 NA NA A
9
日安,我现在在interbase XE7和2017下运行了很多数据库。最近,我在其中一个数据库上发现了一个奇怪的行为:一个带有主键的表被发现托管了许多具有相似值的行,如下图所示。我们可以看到SCRIPTTYPE是一个主键列,它包含很多次MATRIX,没有空格或奇怪的字符(我检查过了)。我能够毫无问题地进行备份/恢复。我对此感到困惑,我想知道是否有人遇到过类似的事情?以及它是如何做到的?谢谢。enter image description here
我有一个对象,在一定数量的行之后,每个列中都有所有NAs。在此之前,有些列还具有NAs。我希望得到最后一行的行索引,其中至少有一个列包含数据。下面是一些要处理的示例数据:
编辑:用于健壮性,我在第二行中添加了NAs,后面是@G.Grothdieck注释。在这种情况下,输出应该仍然是5。
df <- data.frame(a = 1:5, b = 6:10, c = c(1:3,rep(NA, 2)))
df <- rbind(df, rep(NA, ncol(df)), rep(NA, ncol(df)))
df[2,] <- NA
df
a b c
1 1
我为我的Synology NAS找到了一个bash脚本,它在一个文件夹中查找*.mp4文件,将视频剥离并将其另存为*.m4a。(目的是一个自动的“YouTube到播客的转换器”)。
for f in *.mp4; do mv -- "$f" "$(date +%Y-%m-%d -r "${f}") $f"; done
for f in *.mp4; do ffmpeg -i "$f" -vn -acodec copy "${f%.mp4}.m4a"; done
有时*.mp4文件名包含句点,例如‘'This
我有一个data.frame,看起来像:
a b c d
1 2 NA 1
NA 2 2 1
3 2 NA 1
NA NA 20 2
我希望用c / d (并删除c和d)替换NAs,如下所示:
a b
1 2
2 2
3 2
10 10
背景:d是该特定行中NAs的总和。
我不知道这些列的名称,所以我尝试了几种不同的方法,例如:
df2[, 1:(length(colnames(df2)) - 2)][is.na(df2[, 1:(length(colnames(df2)) - 2)])] = df2$c / df2$d
但得到了:
Error
我有一个表(NewsImages),其中包含列newsID(外键)、newsImage、imageID(主键),我的查询是Select newsImage From newsImages Where newsID = 'something'
查询返回具有特定newsID的所有图像,我想要的是从结果查询中删除具有名为“something”的图像的行。如有任何帮助或建议,我们将不胜感激
我正在做一个项目,在这个项目中,我需要删除所有的列及其数据,除了使用Astyanax客户端的Cassandra中的一个列和它的数据。
我有一个动态的列家族,如下所示,我们已经有几百万条记录进入了这个专栏家族。
create column family USER_TEST
with key_validation_class = 'UTF8Type'
and comparator = 'UTF8Type'
and default_validation_class = 'UTF8Type'
and gc_grace = 86400
and column
使用这教程中的以下查询删除重复行时,如何强制删除所找到的重复项中的哪些?
DELETE FROM dbo.ATTENDANCE
WHERE AUTOID NOT IN (SELECT MIN(AUTOID) _
FROM dbo.ATTENDANCE
GROUP BY EMPLOYEE_ID,ATTENDANCE_DATE)
而且这个效果很好。我之所以使用这个id,是因为惟一可用的id是IDENTITY列中的一个。为了确定是否有重复行,我必须查看多列的组合。
但是,如果我有一组重复的行,那么我/如何决定要删除哪些行呢?我将如何强迫它删除除具有最高IDENTITY值的那个之
我有一个最终将被转换为xts对象的数据文件。第一列包含日期数据,而所有其他列都包含数字数据。但是,并非所有数值列的值数/长度相同。有些列包含NAs的行比其他列多。
我希望通过删除列中包含NAs的行来筛选数据,该列的NAs数量最少,但对于我所选的所有其他列,仍然保留包含NAs的行。例如,下面的列grpA的NAs数量最少。我希望删除包含NAs的前2行数据,但不管值是什么,都要在grpB中保留它们。
我所拥有的:
Date grpA grpB
2007-11-06 NA NA
2007-11-07 NA NA
2007-11-09 1.66 NA
我在dataframe中有两个列,其中包含左侧外部联接后的日期信息。由于联接的样式,其中一个日期列现在包含NAs。我想检查这些列之间是否所有非NA值是相同的。下面是一个例子:
date 1 date 2
1/1/21 NA
1/2/21 1/2/21
1/3/21 NA
1/4/21 1/4/21
如果所有非NA值匹配,则不需要第二列。
在我做左外连接之前,我做了一个外部连接,下面是这样的语句:
identical(df[['date 1']], df[['date 2']])
返回一个true,因为两列中的每一行确实是
我需要一个在制定选择查询的帮助。
我有一个包含50列的表,现在我不想检索该表中的所有列。
也就是说,假设我有这样的列: a,b,c,d &我想要一个没有c,d列的select查询。我知道简单地使用select a, b from table就可以达到这个目的,但是当有50列时,你只想从它们中检索40列。
在sql server语法中是否有任何特定的T-SQL可用来完全满足要求。
我有以下数据框架:
a b c
x 1 1
x 1 NA
y NA 1
y 1 1
我想删除任何栏中至少包含安娜的行,但前提是"a“列包含"y”。因此,结果将是:
a b c
x 1 1
x 1 NA
y 1 1
到目前为止,我已经尝试过:
my_DF %>%
filter(!(any(is.na(.)) & a == "y"))
但由此产生的数据框架如下:
a b c
x 1 1
x 1 NA
因此,这只是删除"a“包含"y”的任何行,而不管该行是否至少包含一个列中的NAs。
如何