我将一组数据帧存储在一个列表中。我的目标是格式化列表中的每个数据帧,以便将特定列中的值转换为列名。由于我希望对列表中的每个数据帧进行转换,所以我尝试在列表中的所有元素上应用tidyverse中的tidyverse函数。但是,我收到以下错误:
the condition has length > 1 and only the first element will be usedError: `var` must evaluate to a single number or a column name, not a double vector
下面是我从借来的一个简化讨论的示例:
创建虚拟
我正在从一个网站提取数据,我想将其存储在数据库中。为此,我希望在for循环中创建和删除数据帧。
我尝试创建一个数据框列表,并使用循环删除每个元素,但不起作用。
tables = [df1,df2,df3]
for table in tables:
del table
它不会删除数据帧,也不会显示任何错误。
我可以使用'del‘逐个删除它们,但我需要一个更具扩展性的解决方案。
del df1
del df2
我有一份数据帧列表。列表中的每个数据帧都是唯一的-这意味着有一些共享但不同的列。我想创建一个dataframe,它包含来自dataframe列表的所有列,如果元素不存在,将填充NaN。我尝试过以下几种方法
import pandas as pd
df_new = pd.concat(list_of_dfs)
#I get the following: InvalidIndexError: Reindexing only valid with uniquely valued Index objects
问题似乎是由于列表中的数据帧造成的。每个数据帧只有一行,所以它的索引是零,因此重新索引不会起到
#filter report for a list of manufacturers
manu_list = ['ford','chrysler','mercury','jeep','dodge','ferrari']
df_subset = df[df['manufacturer'].isin(manu_list)]
我正在解决一个问题,并试图将列表中的项提取到单独的数据框中。如上所述,我能够基于与给定列中的值匹配的行来创建数据帧的子集。现在,我正在尝试为列表中的每个值创建一个单独
我有一个SQLite查询,我想运行多次,根据感兴趣的年份创建多个Pandas数据帧。像这样的东西(但这绝对行不通)。基本上,我试图在year列表上循环创建数据框架,以创建4个数据帧(每年1帧),而且即使经过相当多的Googling搜索,我现在仍然无法做到这一点。
year = [2018, 2019, 2020, 2021]
query = '''
SELECT
some stuff
FROM table
WHERE table.YEAR = ?
'''
for x in year:
df[x] = pd.read_sql_que
我从一个数据帧列表中创建了一个数据帧,如下所示:
team_df = pd.concat(all_teams, keys=flat_list, axis=0)
我附上了一张输出的图片。
我想改信
它是这样的:
team1
player 1
player 2
player 3
player 4
player 5
player 6
team2
player 1
player 2
player 3
player 4
player 5
player 6
这是一个基本的查询,但我想遍历数据帧列表,并为每个数据帧设置索引作为数据帧中的一列。下面代码的问题是它没有用新的索引保存数据帧。如何格式化此For循环,以便在for循环之外永久更改数据帧?谢谢。
dflist = [df_1, df_2, df_3]
for i in dflist:
i = i.set_index('column_2')