我正在从一个网站提取数据,我想将其存储在数据库中。为此,我希望在for循环中创建和删除数据帧。
我尝试创建一个数据框列表,并使用循环删除每个元素,但不起作用。
tables = [df1,df2,df3]
for table in tables:
del table
它不会删除数据帧,也不会显示任何错误。
我可以使用'del‘逐个删除它们,但我需要一个更具扩展性的解决方案。
del df1
del df2
我有一个192个数据帧的列表,每个数据帧包含几个变量。我的目标是为列表中的每个数据帧运行回归,并提取截取和betas,并将它们附加到一个新的数据帧中,因此我将拥有一个192行的数据帧和一列截取的列,以及几个用于betas的列。 我唯一能运行的方法是: # list with 192 lm objects #
reg_list = list()
# loop for running regressions and adding the results into the list #
for(i in 1:length(df)){
reg_list
我有一个大约400个数据帧的列表,我想为每个数据帧提取特征。所有数据帧的功能都将是相同的。
数据帧由来自加速度计的信号组成,我将应用分类来识别不同的活动。因为我的类是基于特定模式的,所以我需要我的特征(统计特征和频域特征)基于窗口。
我可以直接对数据帧列表执行此操作吗?提取特征,然后将新的特征列添加回每个数据帧的列表中?
任何建议都将不胜感激。我被卡住了。我知道如何在每个数据帧上执行此操作,但处理如此多的数据帧非常耗时。
列表示例
# Dataframes, x and y are accelerometer measurements and a is annotation
df1 <
假设我从一个数据帧中提取一个序列(就像apply函数会发生的那样)。我正在尝试从该系列中查找原始数据帧索引。
df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})
x=df.ix[0]
x
Out[109]:
a 1
b 4
c 7
Name: 0, dtype: int64
注意输出底部的"Name: 0“部分。如何从序列对象x中获取值'0‘?
#filter report for a list of manufacturers
manu_list = ['ford','chrysler','mercury','jeep','dodge','ferrari']
df_subset = df[df['manufacturer'].isin(manu_list)]
我正在解决一个问题,并试图将列表中的项提取到单独的数据框中。如上所述,我能够基于与给定列中的值匹配的行来创建数据帧的子集。现在,我正在尝试为列表中的每个值创建一个单独
我已经将多个csv文件导入到一个数据帧中,现在希望从每个原始csv文件中提取一行,然后将它们编译在一起。每当我尝试查找行时,它都会显示 'list' object has no attribute loc' 我不知道为什么当我使用pd.read_csv("filepath")的时候,它总是把它作为一个列表,谢谢
我有一个句子列表,例如:['i hate dogs', 'i like cats']和一个包含句子和类型的熊猫数据帧。 我想做的是将这些句子与我的熊猫数据框列“句子”中的相同句子进行匹配,并提取出“类型”列。 因此,我会有另一个类型列表,这些类型都与第一个列表中的句子匹配。 sentence_list = ['i hate dogs', 'i like cats']
Type_list = ['neg','pos']
这应该很简单,但我不知道怎么做。我有一个数据帧和一个包含两个数据帧的列表。现在我想将它们组合在一起,这样我就有了一个包含三个数据帧的列表。而且我不想在“手动”中这样做。 a = data.frame(xa = 1:10,
ya = 11:20)
b = list(c = data.frame(x = 1:10),
d = data.frame(x = 1:20,
y = 11:30)) 现在我在想这样的事情: res = c(a, b) 但这会导致以下结果: > sapply(res, cl
我已经创建了3个数据框架,然后使用下面的命令将它们放入列表中
# create 3 data frames
bag <- round(data.frame(v1=rnorm(10),v2=rnorm(10,1,2)),2)
book <- data.frame(a1=rnorm(10),a2=rnorm(10,1,2),a3=rep("NA",10))
table <- round(data.frame(c1=rnorm(10),c2=rnorm(10,1,2)),2)
# create a list
list1 <- setNames(lapply(
我已经创建了很多数据帧作为预处理的一部分。由于我限制了6 6GB的内存,我想从内存中删除所有不必要的数据帧,以避免在scikit-learn中运行GRIDSEARCHCV时耗尽内存。
1)是否有一个函数可以只列出当前加载到内存中的所有数据帧?
我尝试了dir(),但它提供了许多数据帧以外的其他对象。
2)我创建了一个要删除的数据帧列表
del_df=[Gender_dummies,
capsule_trans,
col,
concat_df_list,
coup_CAPSULE_dummies]
范围(&R)
for i in del_df:
del (i)
但它不会删
我正在尝试创建一个函数来向数据帧中添加标记。数据框架的名称包含我需要的信息(日期、选择、处理等.)。所以我做了一个函数来提取我需要的信息。我有一个包含所有数据帧的大列表,当我将函数应用到列表时,它确实为标记创建了新列,但是值是NA-s。每个数据帧都有相同的名称结构,如果我从列表中提取一个数据帧并运行该函数,它就能工作。你能帮我找出为什么当我把它应用到清单上时不起作用吗?
这是我的功能:
library(stringr)
tagging <- function(H){
namey<-deparse(substitute(H)) #get the name of the dat
我正在尝试将一个函数应用于R中全局环境中所有拼写相似的数据帧。我想将此函数应用于所有这些数据帧,但如果不指定1 by 1,我就不知道如何执行此操作。我想以与以前相同的拼写将数据帧返回到全局环境。
mtcars_test = mtcars
iris_test = iris
#....etc......could be 2 of them or 88 of them...but they will all end in "_test"
# figure out what data frames I am working with
list_of_my_dfs = lapply(l