在pandas中将来自不同dfs的不同列连接成一个df时出错

可能是由于以下原因之一：

列名不匹配：在将不同dfs的列连接成一个df时，列名必须匹配。如果列名不一致，可以使用rename()函数将列名统一，或者使用merge()函数指定连接键。
数据类型不匹配：如果不同dfs的列的数据类型不一致，连接时可能会出错。可以使用astype()函数将列的数据类型转换为一致的类型，或者使用pd.to_numeric()等函数将特定列的数据类型转换为数值类型。
索引不匹配：如果不同dfs的索引不一致，连接时可能会出错。可以使用reset_index()函数重置索引，或者使用set_index()函数设置相同的索引。
缺失值处理：如果不同dfs的列存在缺失值，连接时可能会出错。可以使用dropna()函数删除包含缺失值的行，或者使用fillna()函数填充缺失值。
内存不足：如果数据量过大，内存可能不足以容纳连接后的df。可以考虑使用分块处理或者增加内存容量。

推荐的腾讯云相关产品：腾讯云数据库TencentDB、腾讯云云服务器CVM、腾讯云对象存储COS、腾讯云人工智能AI Lab等。具体产品介绍和链接地址请参考腾讯云官方网站：https://cloud.tencent.com/

如何为pyspark.pandas使用ODBC连接

、、、、

在下面的python代码中，我可以使用ODBC连接成功地连接到MS Azure SQL Db，并且可以使用熊猫的dataframe方法将数据加载到Azure表中。但是，当我使用pyspark.pandas时，to_sql(...)方法会失败，说明不支持这样的方法。我知道火场上的熊猫API已经达到了97%的覆盖率。但我想知道是否有其他方法可以在仍然使用ODBC的情况下实现相同的目标。问题：在下面的代码示例中，如何使用pyspark.pandas的ODBC连接连接到Azure并将数据加载到SQL表中？ import sqlalchemy as sq #import pandas as pd im

浏览 4提问于2022-04-22得票数 0

1回答

将嵌套的JSON展平到pandas数据框列中

、、、

我有一个嵌套了json数据字符串的pandas列。我想将数据展平到多个pandas列中。下面是来自单个单元格的数据： rent['ques'][9] = "{'Rent': [{'Name': 'Asking', 'Value': 16.07, 'Unit': 'Usd'}], 'Vacancy': {'Name': 'Vacancy', 'Value': 25.34100001, 'Unit'

浏览 2提问于2020-06-08得票数 0

2回答

数据框列中的常见元素

、、

我有一个CSV列表，我目前正在Pandas的数据帧中读取。我需要在数据帧的其中一列中找到公共元素。 df1 = pd.read_csv("example.csv") df2 = pd.read_csv("example1.csv") val = np.intersect1d(example[' column'], example1[' column']) 如何对多个文件执行此操作。

浏览 30提问于2018-06-11得票数 0

回答已采纳

1回答

我尝试将多个csv文件(13个文件)连接成一个(按列排列)，但我得到的结果不是按列排列的

、、、、

import pandas as pd dfs_AIC = [] for filenum in range(1,13): dfs_AIC.append( pd.read_csv('AIC_{}.csv'.format(filenum)) ) aaa_pvalue=(pd.concat(dfs_AIC).to_csv("AIC_Concatinate_1-13.csv")) 我试图将多个csv文件(13个文件)连接成一个文件(按列)，但我得到的结果不是按列排列的，而是在生成的csv中以对角线方式连接的值。

浏览 4提问于2021-10-12得票数 -1

1回答

导入多个excel文件并合并为单个pandas df，源名称为列

、、、

我正在尝试用python将一堆xlsx文件合并成一个单一的pandas数据帧。此外，我还想包含一个列，它列出了每一行的源文件。我的代码如下： import pandas as pd from pandas import ExcelWriter from pandas import ExcelFile import glob import os # get the path for where the xlsx files are path = os.getcwd() files = os.listdir(path) files_xlsx = [f for f in files if f[-4

浏览 12提问于2019-11-09得票数 1

回答已采纳

1回答

单列、多个不同形状文件的概念

、、

我有200个不同的文件，我需要把一列一列地连接成一个文件。这200个文件位于一个目录中，所以我尝试了下面的脚本。 path = '/data' files = os.listdir(path) files_txt = [os.path.join(path,i) for i in files if i.endswith('tsv')] ## Change it into dataframe dfs = [pd.DataFrame.from_csv(x, sep='\t')[[6]] for x in files_txt] ##Concate

浏览 0提问于2018-08-14得票数 1

回答已采纳

2回答

KeyError pandas数据帧

、、、

此脚本的目的是读取csv文件，然后从中创建数据框。该文件包含外汇历史数据。该文件有7列Date、Time、Open、High、Low、Close和Volume，大约600k行。下面是一个数据示例： Open High Low Close Volume Release Date 2020-02-05 01:50:00 109.450 109.452 109.449 109.451 79 2020-0

浏览 12提问于2020-05-29得票数 0

回答已采纳

1回答

Pandas -连接多个名称不同但数据类型相同的excel文件

、、

我有大约50个excel工作表与.'xlsb‘扩展名。我想将一个特定的工作表连接到pandas DataFrame中(所有工作表的名称都相同)。我遇到的问题是，每个工作表中的列名称并不完全相同。我使用pandas编写了一段代码，但它的工作方式是将所有值连接到pandas数据框中的同一列中，但基于列的名称。所以举个例子:有时我有一列叫做: FgsNr，有时叫做FgNr --两列中的数据类型和含义完全相同，我希望把它们放在数据框中的同一列中，但是pandas创建来分离数据框中的列，并将那些列中列出的同名的值堆叠在一起。 files = glob(r'C:\Users\Folder

浏览 29提问于2021-08-10得票数 0

1回答

pandas滚动窗口数据的计算

、、

我在使用简单的自建函数基于pandas滚动窗口进行数据处理时遇到了一些问题。我有三个带有值的列，并希望使用一个简单的列表理解来计算其中的一列，以便进一步处理。在我的示例中，我只是简单地对这些值进行求和，这将为每个窗口生成一个值。但是看起来列表理解失败了.import pandas as pd import numpy as np from collections import Counter as count df = pd.DataFrame(np.random.randint(0,100,size=(50, 3)), columns=list('ABC')) def my_

浏览 9提问于2018-01-31得票数 0

1回答

如何比较来自多个csv的数据

、、、

我有25个csv文件，每个文件有4列，我必须比较所有25个csv中名为City的1列，然后在csv中写入输出，说明哪个城市存在于多少个文件中。例如：在excel中，我想要纽约在第一个0列，第一行，然后在下一列中，我想要得到纽约所在城市的文件名。像csv_output.csv一样 New york File 1, File 2, File 3, File 5, File 25 Jakarta File 1, File 7, File 19. 如何使用Python、Pandas或CSV或任何其他选项来执行此操作。目前，我最初检查了两个csv，但这也不起作用。我的要求是25个CSV文件。 im

浏览 0提问于2020-08-01得票数 2

1回答

从单个csv文件解析多个不同大小的表

、、、、

我有一个包含多个表的CSV文件。每个表都有一个标题以及可变数量的行和列(这些数量可能因文件而异)。标题，以及行和列的名称也可能在将来需要解析的不同文件之间改变，所以我不能对它们进行硬编码。某些列也可能包含空单元格。以下是具有此结构的示例CSV文件的屏幕截图： ? 我需要找到一个解决方案，将所有的表从CSV解析到Pandas DFs。理想情况下，最终输出应该是一个Excel文件，其中每个表都另存为一个工作表，并且每个工作表的名称将是相应的表标题。我尝试了建议的解决方案in this post，但它始终无法识别表的开始/结束。当我使用更简单版本的输入csv文件时，建议的代码只返回一个表。

浏览 11提问于2021-06-29得票数 1

回答已采纳

1回答

Pandas将不同的excel工作表合并为一个工作表，并按工作表名称派生出一个新列。

、

我需要将不同的excel表格合并成一个表格，并添加一个新列作为相应的表格名称。下面的代码合并了所有的工作表，但如何将工作表名称添加为列?？ import pandas as pd df = pd.concat(pd.read_excel(r"C:\\Users\\xx\\FC_List.xlsx", sheet_name=None), ignore_index=True) print(single_df) df.to_csv(r"C:\\Users\\Users\\FC_List.csv", index=False) 下面的代码抓取表单名称 import p

浏览 21提问于2021-03-27得票数 0

回答已采纳

3回答

根据pandas中的csv文件名重命名列

、、

假设我正在读取N个csv文件，并将它们合并到单个Pandas DataFrame中，如下所示： dfs = [pd.read_csv(f) for f in list_of_files] df = pd.concat(dfs, axis=1) 如何重命名每个文件中的列，使其包含基于文件名的后缀？例如，如果文件f1和f2包含以下内容： f1： A 1 2 3 f2： B 4 5 6 然后，上面的逐列concat会生成： A B 1 4 2 5 3 6 ..。但我想： A_f1 B_f2 1 4 2 5 3 6

浏览 0提问于2019-03-13得票数 4

2回答

Pandas根据列中的值将数据帧拆分成多个csv

、、、

我有一个问题，但我需要一些进一步的步骤。问题是我的文件包含像50k+这样的行。每行有4个值"Indicator“、"Country”、"Date“和"value”。我想根据国家/地区拆分我的CSV。我不知道有多少个国家，所以所有具有相似名称的国家都应该在一个CSV文件中，依此类推。CSV文件的顺序也不正确。我使用的是pandas，到目前为止我的代码如下： import pandas as pd def read_csvfile(): df = pd.read_csv('ebola_data_db_format.csv', sep=

浏览 0提问于2020-11-12得票数 1

2回答

循环遍历学校附加到数据帧熊猫

、、

我正在从学校抓取一些数据，每个学校都有三个凭证(user1 - user2 - password)我可以创建一个函数，让我能够抓取每个学校的名称 import requests from bs4 import BeautifulSoup import pandas as pd url = 'http://student.emis.gov.eg/new/index.aspx' def get_data(user1, user2, password): with requests.session() as s: r = s.get(url)

浏览 18提问于2020-12-01得票数 1

回答已采纳

2回答

python索引级别和列标签

、、、、

我正试图加入20种不同股票的多重高-低差。我使用了这个doe，并给出了错误消息： ValueError(msg) ValueError：'date‘既是索引级别，也是列标签，这是不明确的。 import pandas as pd def test_demo(): tickers = ['ADI', 'ACN', 'ABT'] df2 = pd.DataFrame() main_df = pd.DataFrame() for count, ticker in enumerate(tickers):

浏览 1提问于2021-04-27得票数 0

1回答

如何将Excel工作簿中的多个电子表格合并为pandas数据帧？

、、、、

我有多个文件夹和子文件夹，其中包含带有多个选项卡的Excel工作簿。如何将所有信息合并到1个pandas数据帧中？到目前为止，我的代码如下： from pathlib import Path import os import pandas as pd import glob p = Path(r'C:\Users\user1\Downloads\key_folder') globbed_files = p.glob('**/**/*.xlsx') df = [] for file in globbed_files: frame = pd.rea

浏览 5提问于2018-09-01得票数 0

回答已采纳

1回答

dask读取具有不同模式的多个拼图文件

、、、、

我想用dask将具有不同方案的多个拼图文件读取到pandas dataframe，并能够合并这些方案。当我谈到不同的方案时，我的意思是，在所有这些文件中都有公共列，但在一些文件中有其他文件中没有的列。不幸的是，当我用 dd.read_parquet(my_parquet_files, engine="fastparquet") 我只有普通的列可读。我知道在spark中有一个读取选项mergeSchema，我想知道在dask中是否有一个简单的方法来做同样的事情？

浏览 40提问于2019-09-04得票数 0

1回答

如何使用Pandas将两个列从一个Excel文件复制到一个新的Excel文件

、、

我需要将两个列从Excel文件'Input.xlsx‘复制到一个新的Excel文件'Output.xlsx’。我使用Pandas尝试了下面的代码，但是在“Output.xlsx”文件中，第一行中的所有数据都是写出来的，我已经没有2列数据了。你能帮我修一下密码吗？以下是代码： import pandas as pd document1 = pd.ExcelFile('C:\\Users\\PycharmProjects\\Input.xlsx') sheets=document1.sheet_names appended_data=[] df1=pd.re

浏览 6提问于2022-01-12得票数 0

回答已采纳

2回答

循环中熊猫数据中列的更改顺序

、、

我有许多pandas.Dataframe对象，希望在一个for循环中重新排序所有这些对象的列，但是它不起作用。我拥有的是： import numpy as np import pandas as pd df1 = pd.DataFrame(np.random.rand(5, 5)) df2 = pd.DataFrame(np.random.rand(5, 5)) dfs = [ df1, df2 ] 现在，更改列的名称是可行的： for df in dfs: df.columns = [ 'a', 'b', 'c', 'd&#

浏览 0提问于2019-06-05得票数 3

回答已采纳

1回答

遍历列表并将结果附加到pandas数据帧

、

我正在尝试从sportsreference中提取boxscore NFL数据。当您调用单个日期的boxscore数据时，您将在单行的多个列中获得一组统计数据。因此，我尝试迭代列表中boxscore的多个日期，然后将每一行附加到相同的dataframe。 import pandas as pd from sportsreference.nfl.boxscore import Boxscore boxscore_list = ['201909080mia', '201909150rav', '201909220kan', '2019090

浏览 18提问于2019-09-28得票数 0

回答已采纳

1回答

将多个.csv文件中的数据导入单个DataFrame

、、、、

我很难将几个.csv文件中的数据放到一个数组中。我可以很好地从.csv文件中获取所有的数据，我只是不能把所有的东西都放到一个简单的numpy数组中。每个.csv文件的名称对我来说都很重要，所以最后我希望有一个Pandas，其中的列标记为.csv文件的初始名称。 import glob import numpy as np import pandas as pd files = glob.glob("*.csv") temp_dict = {} wind_dict = {} for file in files: data = pd.read_csv(file)

浏览 2提问于2017-10-19得票数 1

回答已采纳

2回答

在pandas中将两列数据连接到一列中

、

我在pandas中有两个列，如下所示： column_a column_b ok pen ok book 0.615 C/H 0.551 I/H 有没有办法将这两列连接成这样的列?： column_c pen book 0.615 0.551 我试了这么多方法，但都不能给我想要的结果，

浏览 40提问于2019-12-24得票数 0

回答已采纳

1回答

如何使用循环[Pandas，Python]从现有的df中创建由列组成的多个数据文件？

、、

我尝试基于一个现有的dataframe的列创建多个数据文件。为了保持代码的简单和可伸缩性，我使用了一个循环。这就是我试过的： import pandas as pd for index in range(df.shape[1]): df_index = df.iloc[:, [0, index]] 上面的代码的输出是一个dataframe，它由dataframe的第一列和最后一列组成。所需的输出是多个数据格式，由第一列和单次迭代中的索引组成。我使用的数据集由85列组成。所需的输出将由85个数据文件组成。

浏览 5提问于2019-12-02得票数 0

回答已采纳

2回答

在遍历URL列表之前重命名dataframe列

、、、、

我设置了一个代码，循环遍历链接的XML文件(urls_list)列表，平放文件并追加行。我想重命名这些列，所以我在cols中设置了一个列名列表。在df中，这些行似乎被正确地追加了，但我不知道如何重命名这些列。以下是目前为止的代码： import pandas as pd import pandas_read_xml as pdx urls_list = ['https://www.resultats-elections.interieur.gouv.fr/telechargements/PR2022/resultatsT1/027/058/058com.xml',

浏览 9提问于2022-04-19得票数 0

回答已采纳

1回答

如何通过逗号连接Pandas数据帧的2列？

、

我想用逗号连接Pandas数据帧的两列，即:第一列中的"abc“与第二列中的"123”连接成为"abc，123“。例如： >>> import pandas as pd >>> import numpy as np >>> df = pd.DataFrame({'IDx': ['a','b',np.nan,'C'], 'IDy':['1','','2','D']}) >

浏览 0提问于2016-02-01得票数 4

1回答

用一个函数填充一个新列，该函数使用2个现有列和python和大熊猫。

、、

我在创建和填充基于另外两个行值的新列时遇到了一些困难。我创建了一个函数，该函数(在一个大型CSV文件(1GB)中)查找源代码和目的地邮政编码，并返回specif行。我希望生成距离和时间，并将其作为新列添加到orders文件中。我尝试过使用orders.apply()，而不是得到这个错误 File "pandas\_libs\index.pyx", line 88, in pandas._libs.index.IndexEngine.get_value File "pandas\_libs\index.pyx", line 128, in pandas

浏览 3提问于2019-10-16得票数 1

回答已采纳

1回答

查找相同列中具有非空值的行

假设我有一个数据帧 import numpy import pandas ar = numpy.array([[1.2, 2.1, 0, 1.3], [0, 0, 1.2, 1.5], [2.1, 1.3, 0, 5.6], [0, 0, 2.4, 3.7]]) df = pandas.DataFrame(ar, index = ['0', '1', '2', '3'], columns = ['colA', 'colB', 'colC', 'colD'])

浏览 10提问于2021-04-21得票数 1

回答已采纳

1回答

使用循环函数将数据过滤为数据文件列表

、、

我有一个小数据，两列宽。我的目标是根据QE列中的唯一值将这个数据分割成一个数据序列列表。我似乎无法在我的代码中找到错误。为澄清而编辑： import pandas as pd def Function1(): data = {'Name': ['Dave', 'Sue', 'John', 'Dave', 'Michael', 'Sue'], 'QE': ['12.31.2019', '12.31.2019&

浏览 1提问于2020-08-06得票数 1

回答已采纳

1回答

在同一个excel工作表中编写多个数据框架--另一个在python中

、、、

转载代码： import numpy as np import pandas as pd # Create a Dataframe df1 = pd.DataFrame(np.random.rand(8).reshape(4,2),columns=['X','Y']);print(df1.shape) df2 = pd.DataFrame(np.random.rand(6).reshape(3,2),columns=['X','Y']);print(df2.shape) df3 = pd.DataFrame(np.random

浏览 1提问于2021-05-13得票数 2

回答已采纳

2回答

读取具有可变列数的CSV文件

、、

我有一个CSV文件，看起来 K1 ,Value M1,0 M2,10 M3,3 K2 ,Value,Value,Value M1,4,6,3 M2,7,3,4 M3,10,2,6 K1 ,Value,Value M1,0,4 M2,10,2 M3,3,7 该文件按5行分组。例如，第一个组的名称是K1，后面是一个具有固定3行和1列的dataframe。组中的行数是固定的，但列数是可变的。K1有1列，K2有3列，K3有2列。我想阅读它来形成一个字典，其中键是组的名称、K1、K2或K3，值是与组名相关联的dataframe。简单的类似于read_csv的df = pd.read_csv(

浏览 1提问于2021-11-26得票数 0

回答已采纳

1回答

如何编写跨多个pandas数据帧丢弃NaN值的循环

、、、、

我用python编写了以下代码，以便将多个csv文件读取到独立dfs中的pandas中： dfs = [] for f in filenames: df = pd.read_csv(f, encoding= 'unicode_escape') dfs.append(df) 它工作得很好，我可以索引我创建的dfs对象来访问不同的数据帧，如下所示： dfs[0], dfs[1], etc 但是，数据帧中包含NaN值，我正在尝试编写第二个循环，该循环将遍历并删除它们。我确信这会起作用，然而，它没有： for df in dfs: df.dropna() 手机运行了

浏览 10提问于2020-05-16得票数 1

回答已采纳

2回答

使用.at在Pandas DataFrame中设置值，无法理解的类型错误

、、、

我正在为一些ML构建一个熊猫数据帧。X Dataframe有一个由我的各种数据文件中的所有现有日期组成的日期索引： all_index=set() for table in data: for date in table.index.values: all_index.add(date) 然后，我构建我的数据变量，我想在其中合并我拥有的每个数据： temp2= np.empty((len(all_index),1,)) temp2[:]=np.nan X=pd.DataFrame(temp2, all_index) 当然，现在我想用数据填充它(数据是1df，稍后将是D

浏览 39提问于2019-01-13得票数 1

回答已采纳

3回答

在数据帧连接时保留分类数据类型

、、

我有两个数据帧，它们具有相同的列名和数据类型，如下所示： A object B category C category 每个数据帧中的类别并不相同。当正常连接时，pandas输出： A object B object C object 这是根据的预期行为。但是，我希望保持分类，并希望联合类别，因此我尝试了跨数据帧中的列的union_categoricals，这两列都是分类的。cdf和df是我的两个数据帧。 for column in df:

浏览 48提问于2017-08-12得票数 17

回答已采纳

1回答

在python中将300个CSV文件转换为一个2D数组

、、、、

我有大约300个CSV格式的数据。我想用Python把它们转换成二维数组。每个CSV文件都有一列，其中包含大约150,000个条目。CSV的头部是标签。转换为数组后，数组的第一行应该是第一个CSV文件，数组的第二行应该是第二个CSV文件，依此类推。最后，我想要有一个300行150,000列的数组。第一列应包含标签。我希望你能帮助我解决这个问题。非常感谢。到目前为止，我已经编写了遍历包含csv文件的文件夹的代码 def CSV_File_Loop(Path_Fil): files = [join(Path_File,f) for f in listdir(Path_file) if

浏览 14提问于2019-10-22得票数 1

回答已采纳

3回答

将PySpark数据过滤为数据格式列表

、、、、

我有一个PySpark数据格式，我想根据某些列中的唯一值进行筛选。 from pyspark.sql import SparkSession spark_session = SparkSession.builder.enableHiveSupport().getOrCreate() columns = ["language","users_count","apple"] data = [("Java", 1, 0.0), ("Scala", 4, -4.0), ("Java", 1, 0.0)]

浏览 15提问于2022-07-13得票数 1

1回答

遍历csv列以创建多个python数据帧

、、、

我正在尝试使用excel csv文件的列创建多个数据框。这就是我所能做到的 import pandas as pd file = pd.read_csv('file.csv') df = pd.DataFrame(file) cols = df.columns #column names are 'Date', 'Stock 1', 'Stock 2', etc - I have 1000 columns for i in range(len(cols)): df[i] = df[['Date',b(

浏览 2提问于2016-12-20得票数 0

2回答

按特定列中的值频率限制DataFrame行

、、

基本上，我有一个基本的dataframe，在这个dataframe中有一个'Streaming‘列。我希望将结果限制为每个服务提供商的前5条记录。换句话说，我想把这个数据从可能的数千条节目记录限制到每条流媒体服务的最后5条。 import pandas as pd import numpy as np data = {'Show Name': ['GameOfThrones', 'StrangerThings', 'Casual', ...], 'Streaming Service':

浏览 10提问于2022-09-08得票数 -1

1回答

按列和连接结果计算大熊猫DataFrame组的最小最大值中值

、、

我有一个熊猫DataFrame，我想在一个列上执行最小，最大，平均，中值的计算，用A，B和C列对它们进行分组，然后我想将结果合并到初始的DataFrame。当我计算中间值时，我成功地使用了低音： pandas_df: pd.DataFrame = my_pandas_sql.pull_data_from_mysqldb(query=sql_string) median_px = pandas_df.groupby(['ZIP', 'Updated', 'Buy/Rent'])[['Px/SQM']].apply(np.median

浏览 1提问于2019-08-06得票数 3

回答已采纳

1回答

如何在多个df.min()上分布式应用df.min()和df.max()

、、、

我有一个DataFrames列表，所有这些列都是相同的，并且希望将所有这些列中的值规范化为0，1，同时保持DataFrames之间的值的相对缩放。对于单个DataFrame，我只需做： df = (df - df.min()) / (df.max() - df.min()) 但是，如何获得跨所有DataFrames的每一列的最小和最大值，然后对每个单独的DataFrame应用相同的公式，使用每个列的总最小值和最大值？下面是一个包含2个DataFrames的示例列表，每个DataFrame都是单独标准化的： import numpy as np import pandas as pd df

浏览 0提问于2018-01-18得票数 1

回答已采纳

2回答

如何将目录路径作为另一列添加到dataframe中？

、、

我正在使用这个python脚本在我的文件夹的子目录中获取具有特定名称的csv文件，并将它们读入dataframe，我一直试图将它们的目录路径作为另一列添加到dataframe中，但是我经常遇到错误。 import pandas as pd import glob import os path = 'main/directory/path' file_extension = '.csv' csv_file_list = [] for root, dirs, files in os.walk(path): for name in files:

浏览 6提问于2022-10-03得票数 0

回答已采纳

2回答

Pandas df重新排序列似乎可以在循环中工作，但事实并非如此。我到底错过了什么？

、、、

所以我完全不明白为什么会发生这样的事情：我有8个不同的Pandas数据帧，具有相同的列。我希望在所有这些列上均匀地重新排列列。所以我创建了一个列表，并尝试这样做： original_cols = [1, 48, 49, 50, 51, 52] new_cols = [48, 49, 50, 51, 52, 1] list_of_dfs = [df1, df2, df3...., df8] for df in list_of_dfs: df = df[new_cols] 当我查看任何数据帧时，我仍然得到旧的列顺序，为什么？我插入了一条print语句，如下所示，循环完成了我想要的操

浏览 25提问于2020-01-04得票数 0

1回答

将多个numpy数组批量转换为pandas DataFrames

、、

下面的脚本将多个方阵转换为pandas DataFrames，首先手动转换，然后作为循环函数，并以相同的方式标记它们的行和列。 import numpy as np import pandas as pd from numpy.random import rand A1 = rand(3,3) A2 = A1*2 A3 = A1*3 #example square matrices, no math pattern implied labels = ['a','b','c'] 手动转换： A1 = pd.DataFrame(A1, inde

浏览 126提问于2021-01-10得票数 0

回答已采纳

1回答

连接所有名称以df开头的数据帧

、、

我有多个数据帧(具有完全相同的结构，相同的变量...)它们都是以"df_“开头的。我想要做的是将所有这些数据帧连接成一个。我可以手动完成，但我有许多数据帧，它们的名称可以更改。 frames = [df_24_10000, df_48_10000, df_64_20000, df_82_30000] result = pd.concat(frames) 是否可以连接所有以"df_“开头的数据帧？

浏览 9提问于2019-05-29得票数 0

回答已采纳

1回答

如何通过列表值命名在for循环中开发的每个数据帧

、、

我有一个pandas数据帧，我想根据列中的唯一值过滤到10个不同的数据帧。我有一个这些值的列表，并希望根据过滤的名称动态地命名每个过滤的数据帧。下面是一些示例代码： import pandas as pd df = {'value':[1,1,1,1,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,5,5,5,5,5], 'value2':['a','a','a','a','b','b','c','c',&

浏览 11提问于2020-09-15得票数 0

回答已采纳

1回答

将值附加到循环中的列

、

我有各种包含数据的文件。我希望从每个文件中提取一个特定的列，并创建一个包含所有提取数据的列的新的dataframe。例如，我有3个文件： A B C 1 2 3 4 5 6 A B C 7 8 9 8 7 6 A B C 5 4 3 2 1 0 新的dataframe应该只包含来自C列的值： C 3 6 9 6 3 0 因此，第一个文件的列应该复制到新的dataframe，来自第二个文件的列应该是新dataframe的附录。到目前为止，我的代码如下所示： import pandas as pd import glob for filename in glob.glob('

浏览 0提问于2018-05-15得票数 0

回答已采纳

2回答

如何将不同行值赋给新列

、、

我正在尝试向Pandas中的DataFrame添加一个列'C_End'，如下所示： df = pd.DataFrame({'ID':[123,123,123,456,456,789], 'C_ID':[8,10,35,36,40,7], 'C_Type':['New','Renew','Renew','New','Term','New'],

浏览 5提问于2019-01-03得票数 4

回答已采纳

3回答

在环中修改DataFrames

、、、

鉴于这一数据框架： import pandas as pd df=pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]}) df A B C 0 1 4 7 1 2 5 8 2 3 6 9 我想创建3个新的数据框架；每列一个。我可以这样一次这样做： a=pd.DataFrame(df[['A']]) a A 0 1 1 2 2 3 但是，我不想对每一列都这样做，而是在一个循环中这样做。以下是我尝试过的： a=b=

浏览 1提问于2017-08-04得票数 0

回答已采纳

2回答

熊猫在不同指数上的DataFrame

、、、

一般问题我有一个任意的pandas.DataFrame列表(让我们使用2来保持示例的清晰性)，我想在一个Index上将它们放在Index上：既不是inner，也不是现有DataFrames的outer连接。是一个不同的单独的Index，但是只有在所有的DataFrame中都有日期。例如，以以下2个DataFrame(注意Index形状的不同)为例： In [01]: d1 = pandas.DataFrame( numpy.random.randn(15, 4), columns = ['a

浏览 1提问于2015-01-14得票数 1

回答已采纳

1回答

动态第三名和使用大熊猫的百分比

、、、、

我有一个数据文件，如下所示 id,Name,country,amount,qty 1,ABC,USA,123,4500 1,ABC,USA,156,3210 1,BCE,USA,687,2137 1,DEF,UK,456,1236 1,ABC,nan,216,324 1,DEF,nan,12678,11241 1,nan,nan,637,213 1,BCE,nan,213,543 1,XYZ,KOREA,432,321 1,XYZ,AUS,231,321 sf = pd.read_clipboard(sep=',') 我想做以下几件事 ( a)根据每个id和其他选定列(如Na

浏览 3提问于2022-05-26得票数 1

回答已采纳