我有两个一行的数据帧,每个数据帧都有相同的列名。其中一个数据帧在一个或多个列中具有NA值。我希望删除其中一个数据帧中具有NA值的列,并删除第二个数据帧中的相同列。
样本:
数据框架1:
age height education average
NA 1.80 college NA
数据框架2:
age height education average
36 1.95 college 85
结果:
数据框架1:
height education
1.80 college
数据框架2:
height education
1.95 college
我该
我有一个关于新闻文章的社交媒体数据列表,保存在每个新闻媒体的列表中。每次收集更多数据时,都会将该列表添加到列表中。到目前为止,数据已经被添加到每个列表中9次。
例如:这是一个列表结果的一瞥
glimpse(buzzfeed200125[[1]])
List of 6
$ results :'data.frame': 100 obs. of 45 variables:
..$ author_name: chr [1:100] "Amber Jamieson, Mary Ann Georgantopoulos, Marie Telling, Zor
我想创建一个新的列,条件是"if Temperatur > 80 show hot in row,否则在行中显示冷“ 这是我的代码: tempcat_aq <- aq %>% group_by(aq$Temp) %>% mutate(TempCat = if(any(aq$Temp > 80) "hot" else "cold")) 我正在使用R中内置的airquality数据帧和dplyr库。 谢谢你帮我的忙。
我正在尝试找到一种在数据帧内进行搜索的方法,以返回多个条件的列和行引用。
#some data
SalesData<-data.frame(Appliance=c("Radio", "Laptop", "TV", "Fridge"), ThisYear=c(5,25,5,8), LastYear=c(6,20,5,8))
#code to find which row column TV is in which correctly gives row 3, col 1
TVRef<-which(SalesDat
我有如下数据框架:
df1 <- data.frame(a=c(1:5), b=c(6:10), c=c(11:15))
df2 <- data.frame(a=c(1:5), c=c(11:15))
虽然df2缺少列b,但我希望将两个数据帧中的列合并(由NA填充非存在列)。
> df2
a b c
1 1 NA 11
2 2 NA 12
3 3 NA 13
4 4 NA 14
5 5 NA 15
在实际环境中有多个数据帧。它们中的大多数都有完整的列,但有些数据帧遗漏了一些列。
我认为有一些方法可以通过names()从一个特定的数据框架中获取完整的列名,并将其应用于所
我正在努力计算R中数据帧中两组之间的t-test。下面的示例代码产生了一个有两列的数据帧:变量和值。有两个变量:"M“和"F”。
data <- data.frame(variable = c("M", "F", "F"), value = c(10,5,6))
我需要证明M和F的值在统计上是不同的。换句话说,10在统计上与5和6的平均值不同。我需要在此数据框中添加另一列来显示p值。当我运行下面的代码时,它给出了以下错误:
result <- data %>% mutate(newcolumn = t.test(
我想知道如何从python中的pdf文件中提取特定的表列。
到目前为止我的代码
import tabula.io as tb
from tabula.io import read_pdf
dfs = tb.read_pdf(pdf_path, pages='all')
print (len(dfs)) [It displays 73]
我可以通过打印(dfs2)访问各个表列,我想知道如何在所有使用for循环的数据帧中搜索特定的列。
我想做这样的事
for i in range(len(dfs)):
if (dfs[i][2]) == 'Section I
我有下面的表格和下面的数据
id description
1 a,b,a
我需要一个PostgreSQL脚本,给我以下输出
id description
1 a,b
这就是我到目前为止所尝试的。
create temporary table test
(
id integer,
description text
);
insert into test
select 1,'a,b,a';
select id,string_agg(distinct description, ',') as description
from tes
我在包含两列的data.frame中有信息,例如:
name age
a 10
b 20
c 30
我有一个名字列表,c b d。现在,我想按列表的顺序获得原始数据帧属性的data.frame (或list或任何东西)。对于上面的例子,这将是
name age
c 30
b 20
d NA
我觉得这不应该太困难(即使是排队),但我无法在R中找到一种方法。
背景:
我有一个从边缘列表创建的“网络”对象。我有另一个顶点属性,但是对于这些属性最初是如何排序的,我没有权力。现在,我要分配这些属性的网络顶点。
但是为了使用
network %v%
我有以下列表列的数据框架:
a <- data.frame(col1=c("a","b","c"))
a$col2 <- list(list(),list(name="Michal", age=28), list(name="Johnny", age=31))
我希望将这些列合并为一个数据框架,以便所需的输出如下所示:
col1 name age
1 a NA NA
2 b Michal 28
3 c Johny 31
将列表列转换为我
假设我有一个数据帧,如下所示:
A | B | C | D | E
-----------------
* | * | * | * | *
我想通过列A和B的唯一值将DF分成多个片段,并将每个片段存储为结果列表的一个项目(以导出到.csv文件)。
我知道nest做了几乎相同的事情,但它排除了我以前嵌套的列(这意味着A和B不在结果数据框中)
我想包含所有列。
编辑:图片插图。