我希望能够分别绘制两个数据帧,并依次配对每个列(但不是所有列对所有列)。数据格式在大小和列标题上是相同的,但值不同。因此,数据格式是这样的:
df_X =
A B C
0 1 1 1
1 2 2 2
...
df_Y =
A B C
0 3 3 3
1 4 4 4
...
目前,我可以通过使用带有两个头列的合并的dataframe开始,在子图上手动完成此操作:
df_merge =
col A B C
X Y X Y X Y
0 1 3 1
我有两个来自excels的数据帧,如下所示。第一个数据帧有一个多索引头。 我试图根据货币(即KRW,THB,USD,INR)查找数据帧中的每一列与相应数据帧之间的相关性。目前,我正在执行一个循环来遍历每一列,在找到相关性之前按索引和相应的头进行匹配。 for stock_name in index_data.columns.get_level_values(0):
stock_prices = index_data.xs(stock_name, level=0, axis=1)
stock_prices = stock_prices.dropna()
fx
我有以下数据框:
y <- data.frame(group = letters[1:5], a = rnorm(5) , b = rnorm(5), c = rnorm(5), d = rnorm(5) )
如何获得一个数据帧,为我提供每一行的列a,b和c,d之间的相关性?
类似于:sapply(y, function(x) {cor(x[2:3],x[4:5])})
谢谢你,S
我有两个spark数据帧(A和B),大小分别为a x m和b x m,包含浮点值。此外,每个数据帧都有一个列'ID',这是一个字符串标识符。A和B具有完全相同的ID集(即包含关于同一组客户的信息)。
我想通过一些函数把一列A和一列B结合起来。更具体地说,我想构建一个标量积A的列和B的列,并根据ID对列进行排序。更具体地说,我想计算A和B的列之间的相关性。在所有列对上执行此操作将与矩阵乘法相同: A_transposed x B。然而,目前我只对一小部分列对的相关性感兴趣。
我脑海中有两种方法,但我很难实现它们。(而且根本不知道这两者是否可行或可取。)
(1)获取每个数据帧的感兴
我有一个函数,它在一个数据帧中使用两列:
def create_time(var, var1):
if var == "Helår":
y = var1+'Q4'
else:
if var == 'Halvår':
y = var1+'Q2'
else:
y = var1+'Q'+str(var)[0:1]
return y
现在我想遍历我的数据帧,使用函数创
我知道“如何在数据帧列表中更改名称”的答案已经被多次回答了。但是,我试图生成一个函数,该函数可以将任何列表作为参数,并更改列表中所有数据帧的所有列名。我正在处理大量的.csv文件,所有这些文件都有相同的3个列名。我将分组导入文件,如下所示:
# Get a group of drying data data files, remove 1st column
files <- list.files('Mang_Run1', pattern = '*.csv', full = TRUE)
mr1 <- lapply(files, read.csv, sk
我有一个包含非数字列CatColumn的DataFrame df。
A B CatColumn
0 381.1396 7.343921 Medium
1 481.3268 6.786945 Medium
2 263.3766 7.628746 High
3 177.2400 5.225647 Medium-High
我希望将CatColumn包含在与数据帧中其他列的相关性分析中。我尝试过DataFrame.corr,但它在相关性分析中不包括具有标称值的列。
我有两个巨大的数据格式,它们的列和行名相同,但值不同。现在,我想计算两个数据文件之间的每一列的相关性,但只计算同名的列。
yyyymm `10000` `10001` `10002` `10003` `10004` `10005` `10006`
<int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 198601 NA NA NA NA NA NA
我有一个具有159个obs和27个变量的数据帧,我想将第4列(变量4)中的所有159个obs与以下每一列(变量)关联,即,将列4与5关联,然后将列4与6关联,依此类推……我一直在尝试创建一个循环,但没有成功,因为我是R的初学者,所以它比我想象的要难。我想让它变得更简单的原因是,我需要对更多的数据帧做同样的事情,如果我有一个函数可以做到这一点,它将变得更容易和更少的时间。因此,如果有人能帮助我,那就太好了。 df <- ZEB1_23genes # CHANGE ZEB1_23genes for df (dataframe)
for (i in colnames(df)){
我试图使用MonetDB驱动程序使用DBI::dbWriteTable()将数据帧插入到MonetDBLite中,并且必须调整MonetDB表和R数据帧中的列类型。
我想知道是否存在从R到MonetDB的数据类型映射。例如,我知道(或者假设)R中的character向量应该映射到CHAR(n), CHARACTER(n), VARCHAR(n), CHARACTER VARYING(n), TEXT, CLOB, CHARACTER LARGE OBJECT的MonetDB列,或者STRING和back。
这方面有任何官方文件吗?谷歌没有打开任何东西。