我正在尝试从三个列表创建一个dataframe,这三个列表是我使用网络抓取的数据生成的。但是,当我尝试将这些列表转换为字典,然后使用它们来构建我的pandas数据帧时,它会为每个字典项(行)输出一个数据帧,而不是将所有这些项都作为行包含在数据帧中的一个数据帧。 我认为问题出在我用来网络抓取数据的for循环中。我知道在这个问题上也有人问过类似的问题,包括这里的Pandas DataFrame created for each row和这里的Take multiple lists into dataframe,但我已经尝试了这些解决方案,但没有任何乐趣。我相信网络刮擦循环增加了一个细微的差别,使
我有两种格式的数据,df1和df2。df1是一个包含数据帧的列表,df2是一个数据帧。我想将一个值(cut_off)与两个数据帧的特定列(score)进行比较。我希望将该值替换为用户定义的值。我怎么才能做到这一点?
cut_off = [1,2,3,4]
df_elements = [df1.sample(n=12) for i in range(100)] #randomly selecting 12 rows from a big set
for co in cut_off:
print ("set1 : " + str((df_elements[1]['
我迷失了R中的以下对象:
# create a list of filenames
files <- list.files("directory", full.names = TRUE)
# read all files as csv
data <- lapply(files, function(x) (data.frame(read.csv(x))))
这很好,但我不知道数据的类型,也不知道如何掌握它。让我们看看:
data[1]
[[1]]
Date value1 value2 ID
1 2003-01-01 NA NA
我试图对多个数据帧执行一个简单的for循环,并将输出(从所有数据帧)保存到一个列表中。
下面是示例数据:
# Two example data frames (variables x and y)
a <- data.frame(x=rnorm(1:100, 10, 1), y=1:100)
b <- data.frame(x=rnorm(1:100, 500, 50), y=1:100)
# Merging data frames to a list, which we aim to loop through
data_frame_list <- list(a, b)
我有11383个数据帧的列表。我需要将它们合并到一个大数据框架中,但是它们有不同的列(2,3,4列),所以当我使用来自Dplyr的rbind_all时,结果并不理想。
一种方法是重新绑定具有相同列数的数据帧(标题不同,但我不介意)。由于我有2,3和4列的数据帧,根据列表中每个数据帧的列数,它将产生3个大数据帧。
预期产出:
有4列的数据帧:
SKU Tv y Video Tecnología Deportes
2003091070002P Tv y Video Tecnología Deportes
2.00E+12 Tv y Video Te
我想使用for循环遍历列表,并将以下函数应用于所有列表元素:
new_x = do.call("rbind",mget(ls(pattern = "^x.*")))
其中x是数据帧的特定名称模式。当列表元素i是函数的名称模式时,如何遍历列表?我们的目标是得到这样的东西:
for (i in filenames){
i = do.call("rbind",mget(ls(pattern = "^i.*")))
}
所以我的问题基本上是如何在名称模式中使用i,这样我就能够使用循环将数据帧的更多独立部分绑定到xpart1、xpart
我有一个大约400个数据帧的列表,我想为每个数据帧提取特征。所有数据帧的功能都将是相同的。
数据帧由来自加速度计的信号组成,我将应用分类来识别不同的活动。因为我的类是基于特定模式的,所以我需要我的特征(统计特征和频域特征)基于窗口。
我可以直接对数据帧列表执行此操作吗?提取特征,然后将新的特征列添加回每个数据帧的列表中?
任何建议都将不胜感激。我被卡住了。我知道如何在每个数据帧上执行此操作,但处理如此多的数据帧非常耗时。
列表示例
# Dataframes, x and y are accelerometer measurements and a is annotation
df1 <
我正在为如何使用key和value而苦苦挣扎。这是可行的: for col, val in zip(rawData.columns, out):
print((col), ':', round(val, 2))
a: 2.05
b: 1.98
c: 2.01
d: 1.98 不过,我现在不想像上面那样打印结果,而是将结果放在一个数据帧中 dw = pd.DataFrame()
for col, val in zip(rawData.columns, out):
dw[f'test ({col})'] = val 这会产生一个空的数据帧:
是否有一种简单的方法(或任何方式)来提取数据帧中某个条件在R中出现的第n行号?假设我有一个30列的数据框架,所有类型的值都是相同的。我想从发生某些条件的第二次出现的每一列中提取行号。提取与条件匹配的所有行的计数非常简单,但我不知道如何提取与条件的第n次出现匹配的行。
我正在考虑将数据帧转换为列表的想法,在每个数据帧中添加一个累积和列,并在累积和达到4时使用行索引(例如)。但是,肯定有比这更简单的方法。
示例:
#create data
example<-replicate(30,rnorm(n=10))
#pseudo code
which(row of 2nd negative nu