pandas在合并后创建新列_Pandas:合并数据帧而不创建新列_合并创建新列的两个pandas数据帧 - 腾讯云开发者社区

、、、

我有两个看起来类似的数据格式，我想将df1中的一列除以来自df2的一列。以下是一些样本数据： dict1 = {'category': {0: 0.0, 1: 1.0, 2: 0.0, 3: 0.0, 4: 1.0}, 'Id': {0: 24108, 1: 24307, 2: 24307, 3: 24411, 4: 24411}, 'count': {0: 3, 1: 2, 2: 33, 3: 98, 4: 33}} df1 = pd.DataFrame(dict1) dict2 = {'Id': {0: 24108,

浏览 1提问于2022-07-27得票数 1

回答已采纳

1回答

如何将多个.CSV文件合并为相同的列名，但每个文件有不同的日期？

、、

我有n个.CVS文件的股票利润损失数据.每个.CVS文件包含两个列-符号和P&l。我想要创建一个主.CVS文件，其中一个列将是符号，然后是n个列，其中P&l数据以列名作为文件名，即日期。就像. import pandas as pd import glob import os path = "C:/Users/Arunava Datta/Desktop/trendline_equity/" file_names = glob.glob(path+"*.csv") names = [] for file_name in file_names

浏览 3提问于2022-09-24得票数 0

1回答

如何在我的dataframe中创建一个新变量，用dataframe名称填充值？

、、、

我有一堆数据集，每个数据集都有相同的标题，每个数据集都指向不同的国家。我正在尝试在每个pandas数据帧中创建一个新列，其中填充了我的数据帧名称(这是国家的名称！) 我该怎么做呢？编辑：我没有提到我创建了数据集 us = pd.concat([coeff, pvalues], axis = 1).reset_index() us.columns = ['Factor',"Coeff","P-value"]

浏览 15提问于2019-01-10得票数 0

回答已采纳

2回答

如何强制pdfplumber根据上面行的列数提取表格？

、

我正在尝试用python包pdfplumber从PDF文档中提取一个表。该表有四列和多行。第一行是标题，第二行只有一个合并的单元格，然后值被正常保存(例如) pdfplumber能够检索表格，但如果有四列，它会生成6列，并根据列保存值。 Table as shown in PDF document ? 我尝试使用不同的表格设置，包括“垂直策略”：“线”，但这产生了相同的结果。 # Python 2.7.16 import pandas as pd import pdfplumber path = 'file_path' pdf = pdfplumber.open(

浏览 47提问于2019-10-09得票数 0

1回答

如何使用熊猫dataframe向基于另一个df中匹配列的数据标记为1或0的dataframe添加列

、、

我正在为机器学习算法标记一些医疗保险数据集，使用Pandas数据作为欺诈性或非欺骗性数据。标签包括将DMPOES数据集中的NPI编号与LEIE数据集中的NPI编号相匹配。每个数据集都包含一个名为"NPI“的列。我需要能够找出DMEPOS数据集中的每一行是否有一个匹配的NPI在LEIE数据集中。接下来，我需要向DMPOES数据集添加一列(可能命名为“欺诈性”，表示该行是否具有欺骗性，使用1表示欺诈性，使用0表示不欺诈性。这是我写的代码(不是很多，但应该给出我在Pandas中使用的总体方向。 import pandas as pd import numpy as np #Read fil

浏览 4提问于2021-03-28得票数 0

1回答

用时间戳交错Pandas Dataframes

、

我有2个Pandas DataFrame，每个都包含2列。其中一列是时间戳列t，另一列包含传感器读数。现在我想要创建一个包含4个列的DataFrame，它被交织在时间戳列上。示例：第一个Dataframe： +----+----+ | t1 | s1 | +----+----+ | 0 | 1 | | 2 | 3 | | 3 | 3 | | 5 | 2 | +----+----+ 第二个DataFrame： +----+----+ | t2 | s2 | +----+----+ | 1 | 5 | | 2 | 3 | | 4 | 3 | +----+----+

浏览 0提问于2015-05-04得票数 0

回答已采纳

1回答

缺少季度数据的熊猫数据滞后值及差异

、、、、

虽然Pandas具有时间序列功能，但我仍在努力处理不完整时间序列数据的数据。看下面的图片，下面的图片有完整的数据，上面有空白。这两个图片都显示正确的值。红色是我想用黑色数据计算的列。列Cumm_Issd显示该年累计发行的股票，MV为市值。我想计算一下每季度发行的股票(IssdQtr)，市值的季度变化(D_MV_Q)和去年的MV (L_MV_Y)。有关底层cvs数据，请参阅完整数据的和空白数据的。有两家公司1020180和1020201。然而，当我尝试Pandas shift方法时，当存在空白时它会失败，请尝试使用csv文件和下面的代码。所有列(DiffEq, Dif1MV, Lag4M

浏览 0提问于2017-03-20得票数 2

回答已采纳

2回答

我们可以基于文本匹配合并两个数据帧吗？

、、

我有一个如下所示的DF： ID Rating Bin Price 0 864890 AA+ 4 97.14 1 691634 AA+ 4 14.21 2 792845 AA+ 3 101.25 3 506251 SP 3 100.31 4 689977 AA+ 3 97.37 ... ... ... ... 249995 873393 AA+ 5 110.42 249996 495709 AA+ 7 105.47 249997 508123 AA+ 7 104.55 249998 650062

浏览 29提问于2020-01-28得票数 0

回答已采纳

2回答

从DataFrame提取指定区域

、

我想操作以下cvs文件： "Day" "Hour" "X1" "X2" "X3" "X4" "X5" 2015-01-01 00:00 1 2 3 4 5 ..... 以下各点： "Day Hour" "X2" "X3" "X5" "2015-01-01 00:00" 2 3 5 ..... 它只是将两列组合在一起，并使用一系列列。我试过以下几点： csv = pand

浏览 4提问于2015-07-24得票数 1

回答已采纳

1回答

如何在python中基于两种条件进行合并？

、、

我想使用复合ID (car，ID)创建一个连接，如果两个ID在第一个df上都匹配，则使用test列值创建一个新列 # Import pandas library import pandas as pd # initialize list of lists data1 = [['ford', 1010], ['chevy', 1515], ['toyota', 1515]] # Create the pandas DataFrame df_1 = pd.DataFrame(data1, columns = ['Car

浏览 8提问于2021-02-05得票数 0

回答已采纳

1回答

使用Pandas连接和追加循环中的列

、、

我希望将循环中生成的表中的列附加到dataframe中。我本来希望用pandas.merge来完成这个任务，但它似乎并不适合我。我的代码： from datetime import date from datetime import timedelta import pandas import numpy import pyodbc date1 = date(2017, 1, 1) #Starting Date date2 = date(2017, 1, 10) #Ending Date DateDelta = date2 - date1 DateAdd = DateDelta.day

浏览 1提问于2017-05-03得票数 0

回答已采纳

2回答

如何在满足条件的情况下更改dataframe中的单值？

、、

据我所知，我目前更改pandas数据框中的值的方法还远远不是最优的，并且确实损害了我的工作流程。示例:我想检查是否在另一个数据帧中找到了一个名称，如果是，使用第一个数据帧中搜索到的名称的iloc放入该数据帧中的值： for idx in id_list_of_names: name = df["name"].iloc[idx] if name in df_two["name"].values: df["value"].iloc[idx] = df_two["value"][d

浏览 13提问于2019-05-09得票数 1

1回答

合并视图，还是反之亦然？

我认为你不能从一个视图中合并，或者反之亦然，这是正确的吗？我的用例是：我有一个条目表，可以是活动的或非活动的。我想要在地图上显示活动的图标，图标取决于列值。因此，我的计划是只查看活动条目，然后与从列值到标签代码的查找表合并。从概念上讲，相反的顺序也同样有效。但这两种方法实际上都不起作用。我根本不能从合并创建视图，并且当我尝试从视图合并时，视图表合并列选择器是灰色的，所以我不能选择它的合并列。这是不是完全不起作用呢？或者我错过了正确的方法？

浏览 0提问于2013-01-20得票数 0

回答已采纳

1回答

Python tabula-py错误(熊猫错误？)

、、、

在网上阅读了一些文章之后，我决定使用tabula从pdf文件中提取表格。我们使用Anaconda，我刚刚安装了tabula 1.1.1。我想从一个简单的脚本开始，看看它将如何处理一个包含一些文本和两个表("table_p16.pdf")的单一页面pdf文件。守则： from tabula import read_pdf df = read_pdf("table_p16.pdf") 错误：拾起-Djava.security.properties=c:\Windows\Sun\Java\Deployment\sam.security :JAVA_TOOL_O

浏览 2提问于2018-07-13得票数 0

1回答

合并Pandas Dataframe中列的值

、、

在我开始之前，我的免责声明是，我对Python非常陌生，我一直在构建一个flask应用程序，以努力了解更多，所以我的问题可能很愚蠢，但请帮帮我。我有一个Pandas Dataframe，是通过在flask应用程序上读取csv或excel文档创建的。用户上传文档，因此每次上传时数据帧和列名都会发生变化。用户还从html multiselect对象中选择他们想要合并的列，该对象以python列表的形式将所选的列从用户返回到应用程序脚本。我目前拥有的是： df=pd.read_csv(file) columns=df.columns.values 和 selected_col=request.

浏览 9提问于2020-05-11得票数 0

1回答

在Panda中平均两个相同格式的数据帧

、

我有两个从CSV文件加载的pandas数据帧。每个CSV都有两列，列A是一个id，在两个CSV中具有相同的值和顺序。列B是一个数值。我需要创建一个新的CSV，A列与前两个相同，B列是两个初始CSV的平均值。我正在创建两个数据帧，如下所示 df1=pd.read_csv(path).set_index('A') df2=pd.read_csv(otherPath).set_index('A') 如果我这样做了 newDf = (df1['B'] + df2['B'])/2 newDf.to_csv(...) 则newDF在A列

浏览 10提问于2020-01-20得票数 0

回答已采纳

1回答

如何根据其他构造从不同的表中选择列，以创建新的dataframe python

、、、、

我有两个DataFrames，两个国家都是1--首先是183行，2--第二行是156行--它们都有相互导入的信息，我需要第一列的一列和第二列的一列，我的目标是创建一个单一的Dataframe，包含我需要的两个列，以及两个数据名通信的包含的名称。这就是我所做的，我得到的信息 for i in range(183) : for j in range(156): if df['Country'][i]==df_happy['Country or region'][j]: df.drop(i,axis=0,inplace

浏览 3提问于2020-10-31得票数 0

2回答

无法从Pandas DataFrame合并所有所需的列

、、

我是一个初学者，使用木星笔记本中的Pandas进行临床数据集的工作。我的数据中有一列包含普查域代码，我正在尝试将我的数据与一个大的传输数据文件合并，该文件中也有一个包含人口普查域代码的列。最初，我只想从那个传输文件中得到另外两个列，所以，在我下载了该文件之后，我删除了所有其他列，除了我想要添加到我的文件和人口普查栏中的两个列。这是我使用的代码： df_my_data = pd.read_excel("my_data.xlsx") df_transportation_data = pd.read_excel("transportation_data.xlsx

浏览 16提问于2022-07-31得票数 1

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

、

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

1回答

pd.merge。错误: ValueError:错误号码

、

在“供应商”df中，我试图创建一个名为“非PO类别”的列，该列将根据列“唯一”中的值从df“类别”创建“类别”。以下是外勤部： import pandas as pd suppliers = pd.DataFrame({'Vendor Number': ['260508', '260525', '260549', '260561','260579','260587'], 'Unique': ['26050822015

浏览 1提问于2020-12-15得票数 1

回答已采纳

1回答

使用pandas合并excel表格

、、

我有一个使用python和pandas的快速脚本，它应该比较两个excel表，获取我需要的信息，并创建一个新文件。但是，当它创建新文件时，或者如果我只是为了测试而打印它，那么根据我合并的位置(右边的左边)，其中一列是空的。 import pandas as pd base_data = pd.read_excel("UpdatedList.xls") - #this sheet has Names and clock number today_data = pd.read_excel("LocationUP.xlsx") - #this sheet h

浏览 0提问于2021-02-12得票数 2

1回答

用不同的left_on和right_on长度列表合并两个数据帧

、、

我有以下问题。我有两个数据框架，并希望根据第一个数据框架中的两个列和第二个数据框架中的一个列合并它们： import pandas as pd new1 = pd.DataFrame({0:['a','b','c'], 1:['q1','q2','q3'], 2:['t3','t2','t1']}) new2 = pd.DataFrame({0:['aq1','bq2','cq3'], 1:['

浏览 3提问于2017-05-09得票数 5

回答已采纳

1回答

迭代熊猫dataframe列，并根据条件创建新列。

、

我是Pandas的新手，我在开发代码时遇到了一些问题。我有这样一只熊猫：我要做的是创建一个新列“每米重量”，然后检查“设计部分”列中的每个元素，如果该元素等于“区段名称”列中的元素之一，则“每米权重”列的值将是“单位长度权重”中的相应元素。有些事情是这样的：我该怎么做？

浏览 7提问于2022-08-08得票数 -1

回答已采纳

2回答

打印组合字符串列而不在pandas中创建新列？

、

我使用的是pandas 0.18。我有一个数据帧，看起来像这样： >> df = pd.DataFrame({'ods': {0: 'A86016', 1: 'L81042', 2: 'C84013', 3: 'G82228', 4: 'C81083'}, 'id': {0: np.nan, 1: 463061.0, 2: np.nan, 3: 462941.0, 4: np.nan}, &#

浏览 0提问于2016-05-11得票数 1

1回答

从熊猫数据中选择行，其中两个列匹配成对的列表

、

我正在尝试从一个dataframe创建一个布尔掩码(或索引列表)，以指示多列与列表中的某些组合匹配的位置。下面是一个例子： import pandas as pd df = pd.DataFrame({'A': ['alice', 'bob' , 'charlie' , 'dave' , 'dave'], 'B': ['andy' , 'bridget', 'charlotte',

浏览 1提问于2016-07-19得票数 6

回答已采纳

1回答

Python数据处理 | 合并文件夹下所有csv文件?

、、、、

将文件夹下所有csv文件合并（文件夹内的csv中同名数据可能不在同一列），自动合并同名列的数据，保留列第一行名称，如何实现?

浏览 91提问于2023-12-21

1回答

Python Pandas条件行合并

、、

我刚接触过蟒蛇和熊猫，在过去的几周里我一直在寻找这个答案，但我碰上了一面砖墙。不过，我通常会在网上或其他地方找到我的答案--这次我运气不好。问题：我有一个excel文件，我需要循环通过它来创建防火墙脚本。 A列，第1行，第2行，第3行合并并包含一个主机名列B，第1行，第2行，第3行未合并，每一行包含一个IP地址如何编写条件，说明A列是否有任何合并行，然后检查和合并B列中同一行的行？我的守则： import pandas as pd df = pd.read_excel('file.xlsx',sheetname="sheet_name") df1 =

浏览 0提问于2018-04-29得票数 3

回答已采纳

2回答

将数据从工作表导入Server

、、

我正在尝试将数据从MS (Pro Plus 2013)导入到Server 2014。每次我尝试这样做，我都会得到下面的错误。表中的列被设置为nvarchar(50)，而在Excel中，任何列都没有超过30个字符。我一次又一次地尝试重新创建Excel电子表格，只是为了确保我做的一切都是正确的。我就是不能把数据导入。以下是我收到的错误：验证(错误)消息：警告0x802092a7:数据流任务1:截断可能是由于将数据从长度为255的数据流列"Agent_First_Name“插入到长度为50的数据库列"Agent_First_Name”。( Server导入和导出向导

浏览 1提问于2015-05-03得票数 0

回答已采纳

3回答

使用python从数据框创建多列

、、、

我有一个csv文件，如下所示：我正在尝试为每个标题创建列，并尝试为每种类型的genre_and_votes创建列，以便输出如下所示：我的代码如下： import pandas as pd df = pd.read_csv("C:\\Users\\mysite\\Desktop\\practice\\book1.csv") #print(df) print(df['Title'].values,df['genre_and_votes'].values) 现在对于上面的代码，它创建了一个df，但不能为每个流派和投票创建coulm

浏览 2提问于2021-09-14得票数 1

2回答

在Pandas中基于另外两个列的值创建一个新列

、、

我想在Pandas dataset中基于另外两个列的值创建一个新列。 +-----------+----------+ | Column_1 | Column_2 | +-----------+----------+ | a | c | +-----------+----------+ | b | d | +-----------+----------+ 现在，new_column应该如下所示： +-----------+----------+------------+ | Column_1 | Column_2 | new_co

浏览 1提问于2020-12-08得票数 0

2回答

通过添加新列向csv添加数据

、、、

我想使用python中的pandas模块，将一些来自红移表的数据附加到csv文件中。通过python，我可以使用psycopg2模块成功地连接和检索红移表中的行。现在，我在csv上存储按日期划分的数据。因此，我需要首先在csv中创建一个新的date列，然后追加在该新列中检索到的数据。我使用以下命令从红移表中读取： conn=psycopg2.connect( host='my_db_hostname', port=`portnumber`, user='username', password='password', dbname='db

浏览 8提问于2021-07-30得票数 0

回答已采纳

1回答

使用[]而不是点访问Dataframe列时的“SettingsWithCopyWarning”

、、

当从两个现有列创建新列时，为什么pandas要抛出一个SettingsWithCopyWarning A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead 跑步时 df['c'] = df['a'] - df['b'] 但跑的时候不行 df.c = df['a'] - df['b'] 此外，c列是使用df['c'

浏览 6提问于2015-10-04得票数 1

1回答

Create function用于在特定列上合并给定数量的数据帧

、、、、

我想创建一个函数，它接受数量不确定的数据帧，然后在给定列上合并它们，这实际上是最左边的列。我应该使用*args这样的东西吗？ import pandas as pd def merge_given_dfs(*args): pd.merge(*args,left_on='name') merge_given_dfs(df1,df2,df3,df4) 谢谢!

浏览 16提问于2020-10-24得票数 0

1回答

在pandas中合并两个数据集时释放内存

、、

我有两个巨大的表作为pandas对象，它们很难放入内存中，我需要将它们组合到第三个表中： df = pd.melt(df, id_vars='index', value_vars=cell_ids, var_name='cell_id', value_name='expr') df_raw = pd.melt(df_raw, id_vars='index', value_vars=cell_ids, var_name='cell_id', value_name

浏览 0提问于2018-10-18得票数 0

3回答

在两个数组中查找重复的值，Python

、、

我有两个数组(A和B)，每个数组大约有50000个值。每个值代表一个ID。我想创建一个有三列的pandas数据帧，col1:来自数组A的值，col2:来自数组B的值，col3:标签为“唯一”或“重复”的字符串。在每个数组中，ID:s是唯一的。数组的长度不同。所以我不能做这样的事情来开始。 a = np.array([1, 2, 3, 4, 5]) a = np.array([5, 6, 7, 8, 9, 10]) pd.DataFrame({'a':a, 'a':b}) 我当时正在考虑创建一个不同的pandas数据帧，也有三列。一个是ID，另一个是ID来自的

浏览 80提问于2021-01-28得票数 2

回答已采纳

1回答

如何在pandas中做"(df1 & not df2)“数据帧合并？

、、、、

我有2个具有公共列/键(x，y)的pandas dataframes df1 & df2。我想在键(x，y)上进行"(df1 & not df2)“式的合并，这意味着我希望我的代码只在df1中返回包含(x，y)行的数据帧&而不是在df2中。 SAS具有相同的功能 data final; merge df1(in=a) df2(in=b); by x y; if a & not b; run; 谁能优雅地在熊猫中复制相同的功能？如果我们能在merge()中指定how="left-right“，那就太好了。

浏览 0提问于2015-09-20得票数 16

回答已采纳

1回答

加入Pandas on Between

、、

我希望使用pandas dataframes在python中重新创建一个我通常在SQL中运行的连接(但不能，因为我们的presto版本不会运行jsonb列，我需要用jsonb列来过滤其中一个表)： SELECT t1.a, t1.b FROM t1 JOIN df2 ON t1.a = t2.a AND t1.b BETWEEN t2.c AND t2.d 有没有办法用python中的dataframe而不是SQL中的表来设置它？

浏览 12提问于2021-05-08得票数 0

回答已采纳

1回答

TypeError:空“DataFrame”：在国家/地区shp文件中绘制Mirai感染时，在Geopandas中没有要绘制的数字数据。

、、、

我已经创建了一个包含3列的地理数据框架:国家代码、感染率和几何形状。通过将http://www.naturalearthdata.com/downloads/10m-cultural-vectors/中的shapefile导入到地理数据框并将其与感染数据框合并，即可生成地理数据框 Infections.head(5)返回以下内容： Country_Code Infection_Rate 0 CHN 0.00088 1 VNM 0.00661 2 BRA 0.00240 3 KOR 0.00732 4 RUS 0.00156 按如下方式导入geodataframe：

浏览 14提问于2019-10-10得票数 1

回答已采纳

1回答

MySQL工作台-将模式“部署”到实际数据库中

、、

这里有个菜鸟在找我的路。因此，我如何“传输、部署或任何正确的术语”--我用Workbench创建的数据库表、字段等等--进入真正的数据库？我所拥有的dB目前正在本地WAMP安装中，但我也在一个真正的web服务器上安装了它。非常感谢，亚历克斯编辑:我希望使用MySQL工作台“绘制”数据库表、列和数据库正常工作所需的所有其他信息，然后将其传输到我的服务器上。也就是说，我希望避免使用笨重的phpMyAdmin为我的应用程序创建数据库，而是使用Workbench在我的PC上创建数据库，然后将所有这些传输到实际的生产服务器上。谢谢!

浏览 0提问于2015-01-11得票数 0

1回答

如果在另一数据帧的列中找到ID匹配，则更新数据帧中一列的值

、、、、

我有两个数据帧。第二数据帧是从第一数据帧派生的。我更新了第二个dataframe中的一列，然后希望将更新后的值放回第一个dataframe中。我尝试过"merge"，但它给出了两个后缀为"_x“和"_y”的列。 import pandas lotQtyQueryForDF = pandas.read_sql_query(refreshQuery,conForInfo) dataFrameOfLots = pandas.DataFrame(lotQtyQueryForDF,columns=['Customer','Stage',&

浏览 19提问于2020-05-27得票数 1

回答已采纳

1回答

Pandas:合并数组太大了，怎么分块合并？

、

在尝试使用pandas合并两个数据帧时，我收到了这样的消息："ValueError: array太大了。“我估计合并后的表将有大约50亿行，这对于我的8 8GB的计算机来说可能太多了(这是仅受我的RAM的限制还是内置于pandas系统中？)。我知道一旦我有了合并表，我将计算一个新的列，然后过滤行，在组中寻找最大值。因此，最终的输出表将只有250万行。我如何分解这个问题，以便可以在较小的部分上执行此合并方法并构建输出表，而不会遇到RAM限制？下面的方法对于这些小数据可以正常工作，但对于较大的真实数据则失败： import pandas as pd import numpy as n

浏览 1提问于2014-07-31得票数 3

2回答

Pandas DataFrame从其他DataFrame添加两列的列

、、

我正在和Python Pandas一起学习数据科学。但是，我不擅长处理数据。所以我需要一些帮助。 df1 >>> df1 stamp id col1 col2 0 100000 1 100 60 1 100000 2 100 30 2 100001 1 10 10 3 100001 1 20 30 4 100001 2 20 10 5 100001 2 20 90 6 100001 3 30 10 7 100002 1 300

浏览 21提问于2020-06-20得票数 1

1回答

如何在通过groupby.apply创建新列时避免临时变量

的结果，我想在dataframe newcol中创建一个新列df。 df.groupby('keycol').apply(somefunc) 显而易见的是： df['newcol'] = df.groupby('keycol').apply(somefunc) 不起作用:要么df['newcol']包含所有nan(这肯定不是RHS的结果)，要么引发一些异常(异常的细节因somefunc返回的不同而大不相同)。我尝试过以上的许多变体，包括一些类似的东西 import pandas as pd df['newcol'

浏览 4提问于2014-11-11得票数 2

1回答

如果csv文件具有相同的列标题，则合并csv文件；如果未拆分，则合并csv文件

、、、

我有一个包含几个csv文件(5k+)的文件夹，要使用它们，最好有相同的变量名和列数。但事实并非如此。为了继续进行清理，我想根据它们的列创建一些子文件夹。例如，如果两个或多个csv具有相同的列和变量名，则使用它们创建一个子文件夹。到目前为止，我找到了如何组合所有文件，但我不知道将条件与匹配的列子文件夹放在哪里。 import glob import pandas as pd extension = 'csv' all_filenames = [i for i in glob.glob('*.{}'.format(extension))] col_

浏览 51提问于2021-09-23得票数 1

回答已采纳

1回答

带有SettingWithCopyWarning的Pandas/Python中的df.loc消息

、、、、

我花了几个小时搜索Pandas文档和其他几个网站，但是我不知道我的代码在哪里不工作。我的UDF： def indice(dfb, lb, ub): dfb['isOutlier'] = ~dfb['valor_unitario'].between(lb, ub) dfb = dfb[~dfb.isOutlier] dfb['indice'] = (dfb['valor_unitario'] - lb) / (ub - lb) * 2000 df = df.astype({'indice&

浏览 1提问于2021-05-03得票数 0

回答已采纳

1回答

如何在开放细化中按区段转换单元数据？

我有一个数据表，如下所示： Name | Date-Freq | Date-Amount | Date-Freq | Date-Amount A | 4 | 3000 | 8 | 9000 B | 5 | 4000 | 9 | 7000 C | 6 | 5000 | 10 | 8000 我想让它看起来像这样 Name | Date | Freq | Amount A | July 2014 | 4

浏览 0提问于2015-10-23得票数 1

回答已采纳

2回答

如何添加与CSV文件相关的列中的值(Pandas)

、、

我对编程非常陌生，所以提前向您道歉。我的计算机上有一个名为SouthKoreaRoads2的CSV文件，下图是该文件的示例(名称、年份和长度)： ? 使用以下代码，我基于原始数据创建了一个新表，但只包括年份小于1975的行(包含这些行的列称为简化日期)。 import pandas as pd import os SouthKoreaRoads2 = pd.read_csv("SouthKoreaRoads2.csv") SouthKoreaRoads2[SouthKoreaRoads2['Simplified Date'] < 1975] 现在，

浏览 22提问于2021-07-22得票数 1

1回答

将多个数据帧连接在一起，并确保正确的数字进入同一列

、、

我有几个数据帧，它们都有一个"Dirty Price“和"Factor”，我想在同一列中包含它们。当我尝试这样做时，当我将第二个数据帧连接在一起，然后pandas创建了一个新的"Dirty Price_x“和"Factor_x”，但是我不想让我的新列合并到与我指定的条件匹配的同一列中。这是我所做的： df = df.merge(gs[['CUSIP', 'temp_Counterparty','Dirty Price','Factor']], how = 'left', on =

浏览 11提问于2020-04-22得票数 1

回答已采纳

2回答

熊猫合并给KeyError

、、、

我有两个Dataframes df_general和df_award，它们共享一个名为ProjectNumber的列。我想把他们合并。我试着用dropna()删除所有的行，它确实删除了它们- df_award['ProjectNumber'].replace(' ', np.nan, inplace=True) df_award.dropna(subset=['ProjectNumber'], inplace=True) df_award.head() 然后像这样合并两个Dataframes (因为我只想从第一个表中得到一个列，从第二个表中只需

浏览 1提问于2018-10-26得票数 0

回答已采纳

3回答

与Excel中的Pandas索引匹配替代

、、、、

在下表中，我有一个日期列表。我正在尝试索引第二个数据帧，并在第一个数据帧中提取相应的值。我想创建D列。我也引用了，并且这两列实际上是相同的类型(Str) print(data) A B 1/1/17 15 1/2/17 16 1/3/17 14 1/4/17 15 1/5/17 16 1/6/17 14 1/7/17 15 1/8/17 16 1/9/17 14 print(lookup) C D 1/4/17 15 1/7/17 15 1/8/17 16 所以基

浏览 1提问于2018-03-02得票数 0