pandas:基于多列合并两个文件_Pandas合并多列_基于多列pandas中的值合并列 - 腾讯云开发者社区

python、pandas、dataframe、merge、multi-index

我想合并两个数据帧，df1和df2，它们有多个索引列： mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['variable', 'year']) mi2 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2019')], names=['variable', 'yea

浏览 61提问于2020-12-15得票数 0

回答已采纳

1回答

如何从Pandas中的列标题中为列变量“Date”分配日期值

python、pandas

我有以下的数据输入，我正在通过熊猫阅读。我想用手机“结束的一个月……”并放入一个新形成的'Date‘列，并将两个输入文件一起附加到一个dataframe中。这就是我迄今尝试过的..。 import pandas as pd import glob import os ### List Source Files That I need to Import### path = os.getcwd() files = os.listdir(path) ### Loading Files by Variable ### data = pd.Data

浏览 0提问于2018-07-12得票数 0

回答已采纳

1回答

如何将多个.CSV文件合并为相同的列名，但每个文件有不同的日期？

python、pandas、csv

我有n个.CVS文件的股票利润损失数据.每个.CVS文件包含两个列-符号和P&l。我想要创建一个主.CVS文件，其中一个列将是符号，然后是n个列，其中P&l数据以列名作为文件名，即日期。就像. import pandas as pd import glob import os path = "C:/Users/Arunava Datta/Desktop/trendline_equity/" file_names = glob.glob(path+"*.csv") names = [] for file_name in file_names

浏览 3提问于2022-09-24得票数 0

2回答

如何使用concat或merge合并两个数据帧？

python、pandas

我正在尝试合并看起来像这样的两个数据框：https://i.imgur.com/ZCPzx7V.png 我应该写些什么来合并这两者呢？我经历过这种情况，但仍然收到错误： https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html https://www.datacamp.com/community/tutorials/joining-dataframes-pandas

浏览 17提问于2020-03-24得票数 0

3回答

如何用python合并.csv文件？

python、excel、pandas、csv、merge

我们不得不合并许多CSV文件，但没有找到任何工作方法(通过MS Excel，通过Python和Pandas，...)。所有的文件都有相同的结构，你可以在附加的照片中看到。在内容方面不需要做任何更改，只需在一个大型CSV中添加所有文件的所有列即可。期待您的想法！Structure of .csv files

浏览 33提问于2020-04-17得票数 0

2回答

使用Pandas [with key column]将CSV与不同的列组合

python、pandas、csv、dataframe、concat

我尝试在Python中组合两个CSV文件，每个CSV文件都有唯一的列，但这两个CSV文件共享一个公共键列。我一直在寻找StackOverflow/Google/Pandas文档，但没有找到我想要的东西。Pandas文档页面上提供的merge和concat示例与我试图实现的不同，所以我不确定我所要求的在Pandas中是否可行。我已经将两个CSV文件中的选定列读入到单独的数据帧中，现在我想要做的是基于键列将这两个数据帧合并为一个数据帧。 Example CSV 1: Key Make Model 501 Audi A3 502 Audi A4 503 Audi

浏览 22提问于2019-04-12得票数 2

1回答

使用pandas合并excel表格

python、excel、pandas

我有一个使用python和pandas的快速脚本，它应该比较两个excel表，获取我需要的信息，并创建一个新文件。但是，当它创建新文件时，或者如果我只是为了测试而打印它，那么根据我合并的位置(右边的左边)，其中一列是空的。 import pandas as pd base_data = pd.read_excel("UpdatedList.xls") - #this sheet has Names and clock number today_data = pd.read_excel("LocationUP.xlsx") - #this sheet h

浏览 0提问于2021-02-12得票数 2

1回答

如何根据其他构造从不同的表中选择列，以创建新的dataframe python

python、pandas、dataframe、data-science、data-analysis

我有两个DataFrames，两个国家都是1--首先是183行，2--第二行是156行--它们都有相互导入的信息，我需要第一列的一列和第二列的一列，我的目标是创建一个单一的Dataframe，包含我需要的两个列，以及两个数据名通信的包含的名称。这就是我所做的，我得到的信息 for i in range(183) : for j in range(156): if df['Country'][i]==df_happy['Country or region'][j]: df.drop(i,axis=0,inplace

浏览 3提问于2020-10-31得票数 0

2回答

无法从Pandas DataFrame合并所有所需的列

python、pandas、merge

我是一个初学者，使用木星笔记本中的Pandas进行临床数据集的工作。我的数据中有一列包含普查域代码，我正在尝试将我的数据与一个大的传输数据文件合并，该文件中也有一个包含人口普查域代码的列。最初，我只想从那个传输文件中得到另外两个列，所以，在我下载了该文件之后，我删除了所有其他列，除了我想要添加到我的文件和人口普查栏中的两个列。这是我使用的代码： df_my_data = pd.read_excel("my_data.xlsx") df_transportation_data = pd.read_excel("transportation_data.xlsx

浏览 16提问于2022-07-31得票数 1

1回答

从列表中查找每个项目到List2中的项。如果有匹配，则返回这样的值，如果不删除整行

python、iteration

我有两个列表，它们是从两个不同的dataframes的列创建的。这两个数据文件具有以下结构： In [73][dev]: cw.shape Out[73]: (4666, 13) In [74][dev]: ml.shape Out[74]: (815, 5) 这两个列表是标识符对象，用于将数据与另一个数据进行匹配。我的意图在概念上相当于Excel中的一个vlookup，即查找来自列表ID的项是否在

浏览 3提问于2022-03-10得票数 0

2回答

熊猫合并给KeyError

python-3.x、pandas、dataframe、data-science

我有两个Dataframes df_general和df_award，它们共享一个名为ProjectNumber的列。我想把他们合并。我试着用dropna()删除所有的行，它确实删除了它们- df_award['ProjectNumber'].replace(' ', np.nan, inplace=True) df_award.dropna(subset=['ProjectNumber'], inplace=True) df_award.head() 然后像这样合并两个Dataframes (因为我只想从第一个表中得到一个列，从第二个表中只需

浏览 1提问于2018-10-26得票数 0

回答已采纳

1回答

在Python中合并具有数百万行的两个表

python、join、merge、pandas、pytables

我正在使用Python进行一些数据分析。我有两个表，第一个(让我们称它为'A')有1000万行和10列，第二个('B')有7300万行和2列。它们有一个具有公共ids的列，我想基于该列使这两个表相交。特别是，我想要表的内部连接。我无法将表B作为pandas数据帧加载到内存中，以便在pandas上使用正常的合并功能。我尝试在块上读取表B的文件，将每个块与A相交，并将这些交集连接起来(从内部连接输出)。这在速度上是可以的，但有时这会给我带来问题，并导致分段错误……不，太棒了。这个错误很难重现，但它发生在两台不同的机器上(Mac、OS、X、v10.6(雪豹)和UNI

浏览 0提问于2013-01-31得票数 13

回答已采纳

2回答

Pandas使用其他数据帧更新数据帧

python、pandas、csv、numpy

我正在尝试使用第二个csv文件中的数据修改csv文件。这两个文件都有sku列，但它们并不完全匹配。这两个文件也都有一个价格列。我需要使用skus匹配的第二个文件中的新价格更新第一个文件。这感觉很简单，但今天我的大脑少了一个档次。到目前为止，我有： oldDf = pandas.read_csv('oldData.csv') newDf = pandas.read_csv('newData.csv') oldDf = oldDf.assign(newPrice = oldDf['LIST PRICE']) oldDf['newPrice

浏览 0提问于2019-01-23得票数 1

1回答

熊猫组合不同日期指数的两个数据

python、datetime、pandas

假设我已经从两个独立的文件中提取了csv数据，其中包含了熊猫自动提取的日期索引，这是最初的列之一。 import pandas as pd df1 = pd.io.parsers.read_csv(data1, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A']) df2 = pd.io.parsers.read_csv(data2, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A&#

浏览 5提问于2014-05-12得票数 1

回答已采纳

1回答

Python :合并列表列上的两个Pandas Dataframe

python、pandas、dataframe、merge、jupyter

我需要根据一列名为"authors“的列表找到两个pandas数据帧之间的交集。但我得到的却是这个错误：

浏览 3提问于2017-06-23得票数 0

4回答

大熊猫:基于两种条件的搜索和匹配

python、pandas、dataframe

我正在使用下面的代码对一个.csv文件进行搜索，并在两个文件中匹配一个列，并获取我想要的另一列，并将其添加为一个新列。然而，我试图使匹配基于两列而不是一列。有办法这样做吗？ import pandas as pd df1 = pd.read_csv("matchone.csv") df2 = pd.read_csv("comingfrom.csv") def lookup_prod(ip): for row in df2.itertuples(): if ip in row[1]: return row[3]

浏览 7提问于2022-09-18得票数 2

1回答

表未被识别

python、pandas、tabula、python-camelot

import pandas as pd from tabula import read_pdf FileName="Filepath" DF3=read_pdf(FileName,multiple_tables=True,options="--pages 'all'", lattice= True) print DF3 import pandas as pd import camelot FileName="Filepath" tables = camelot.read_pdf(FileName,pages='1-en

浏览 10提问于2019-02-28得票数 0

4回答

Python中的DataFrame切片失败

python、python-3.x、pandas、dataframe、slice

我想用Python分割我的数据。切片数据的基本任务会给我带来意想不到的错误。我的代码是： import pandas as pd test_file = pd.read_csv("C:/Users/Lenovo/Desktop/testfile.csv") test_select = test_file[["Category", "Shop"]] print(test_select[1,1]) 代码print(test_select[1,1])应该显示第二列的第二行。错误信息： pandas._libs.hashtable.PyObjec

浏览 0提问于2018-12-15得票数 1

回答已采纳

1回答

熊猫KeyError同时从另一个DataFrame中添加多个列

python、pandas、jupyter-notebook、keyerror

我得到了一个巨大的csv和积压数据。我想从其中获取一些列，并将它们添加到另一个DataFrame中。看起来是这样的： Backlog = r'C:\Users\Desktop\personalized reports\Backlog Case\R1_Ext_Report.csv' df_backlog = pd.read_csv(Backlog, sep=',') df2 = df_backlog['PROMOTION CODE', 'MODEL DESCRIPTION'] 以上列的名称与csv中的名称完全相同。如果我使用单个列(

浏览 1提问于2019-02-04得票数 1

回答已采纳

1回答

将dataframe一列一列地从另一个dataframe划分

python、pandas、dataframe、numpy

我有两个看起来类似的数据格式，我想将df1中的一列除以来自df2的一列。以下是一些样本数据： dict1 = {'category': {0: 0.0, 1: 1.0, 2: 0.0, 3: 0.0, 4: 1.0}, 'Id': {0: 24108, 1: 24307, 2: 24307, 3: 24411, 4: 24411}, 'count': {0: 3, 1: 2, 2: 33, 3: 98, 4: 33}} df1 = pd.DataFrame(dict1) dict2 = {'Id': {0: 24108,

浏览 1提问于2022-07-27得票数 1

回答已采纳

1回答

缺少季度数据的熊猫数据滞后值及差异

python、pandas、dataframe、time-series、financial

虽然Pandas具有时间序列功能，但我仍在努力处理不完整时间序列数据的数据。看下面的图片，下面的图片有完整的数据，上面有空白。这两个图片都显示正确的值。红色是我想用黑色数据计算的列。列Cumm_Issd显示该年累计发行的股票，MV为市值。我想计算一下每季度发行的股票(IssdQtr)，市值的季度变化(D_MV_Q)和去年的MV (L_MV_Y)。有关底层cvs数据，请参阅完整数据的和空白数据的。有两家公司1020180和1020201。然而，当我尝试Pandas shift方法时，当存在空白时它会失败，请尝试使用csv文件和下面的代码。所有列(DiffEq, Dif1MV, Lag4M

浏览 0提问于2017-03-20得票数 2

回答已采纳

1回答

Python tabula-py错误(熊猫错误？)

python、pandas、pdf、tabula

在网上阅读了一些文章之后，我决定使用tabula从pdf文件中提取表格。我们使用Anaconda，我刚刚安装了tabula 1.1.1。我想从一个简单的脚本开始，看看它将如何处理一个包含一些文本和两个表("table_p16.pdf")的单一页面pdf文件。守则： from tabula import read_pdf df = read_pdf("table_p16.pdf") 错误：拾起-Djava.security.properties=c:\Windows\Sun\Java\Deployment\sam.security :JAVA_TOOL_O

浏览 2提问于2018-07-13得票数 0

1回答

Python Pandas用于匹配具有重叠坐标的行

python、pandas、dataframe

我是一名python新手，正在尝试解决使用熊猫的问题。我有两个.csv文件，它们是作为pandas数据帧导入的。其中一个文件是包含ID号、起始和结束坐标行的文件： ID Start End 1 45 99 3 27 29 6 13 23 19 11 44 我的第二个文件有一个代码列，以及开始和结束坐标： Code Start End ss13d 67 100 dfv45 55 100 aal33 101 222 mm0ww 24 28 我希望找到在这两个文件之间没有特定顺序重叠的开始和结束坐标，这样结果就

浏览 19提问于2020-04-09得票数 1

回答已采纳

1回答

熊猫:比较大数据和小数据

pandas、dataframe、large-data

我有两个数据，我想比较熊猫，一个太大，不适合记忆，另一个更小，适合记忆。 dfSmall: cat1 cat2 foo bar foo tiger foo spam bar spam (5000 rows) dfLarge: cat1 cat2 cat3 foo dog green foo tiger blue foo snake green foo bird pink bar dog orange ... (>1 million rows) 我使用过dask.dat

浏览 0提问于2018-04-30得票数 1

回答已采纳

1回答

合并两个表

ssis

我有两个excel源。考虑第一个有5列(F1，F2，F3，F4，F5)，第二个有两个列(F6，F7)。我需要将它转移到数据库中的一个表中，该表包含所有这七列。我应该使用哪种转换来实现这一点。谢谢

浏览 0提问于2009-07-17得票数 0

2回答

使用熊猫组合excel文件数据

python、excel、pandas、dataframe、glob

因此，我目前正在进行一个项目，该项目将excel文件中包含的数据用于绘制光谱(即一列中的波长，另一列中的吸光度)。有数百个这种性质的excel文件，我希望将它们压缩为一个文件。这主要是因为A列(波长)对所有文件都是相同的，并且只有文件之间的吸光度机会。因此，我想从目录中的第一个文件中获取A和B列，将它们写入新的excel工作表，然后从所有剩余的工作表中只取B列，并将它们打印到相同的输出excel文件中。我目前的代码是： import os import pandas as pd from pandas import ExcelWriter from pandas import ExcelFil

浏览 0提问于2018-11-16得票数 0

回答已采纳

1回答

如何使用条件将数据从一个excel文件复制到另一个excel文件？

python-3.x、pandas

我有两个excel文件是one.xlxs and two.xlxs。两个excel文件中的列名id, mail, name, gender, age, name相同，但在two.xlxs中混杂在一起。两行(id and mail)包含两个文件的数据。我想将数据从one.xlxs复制到two.xlxs。但是在two.xlxs上不应该干扰列的排列。数据将基于两行(id and mail)进行复制。例如:如果id和mail在两个文件上匹配，则应将数据复制到相应的列中。参考图片为one.xlxs，two.xlxs和result_two.xlxs(根据要求的结果)。我已经在网上搜索过了，但我没有得到任

浏览 37提问于2021-09-04得票数 2

回答已采纳

1回答

如何将多个hdf5文件聚合到一个映像中

python、pandas、hdf5

我有几个(多达几百个) hdf5文件，其中包含并行模拟的结果:每个计算节点创建一个独立的hdf5文件，以避免任何同步问题。有没有任何方法来创建hdf5文件中所有数据的“映像”，比如，这个“映像”看起来像是拥有所有数据，但实际上，它将提供来自其他文件的数据？我要找的是： "data-node0.h5" spike/PopulationA -> pandas data frame columns=[0,3,6,9] "data-node1.h5" spike/PopulationA -> pandas data f

浏览 4提问于2017-10-21得票数 2

1回答

如何在熊猫获得ValueError中混合多个数据

python、pandas、merge

在使用Anaconda3 Spyder的Pandas中，我正在运行以下DataFrame合并摘录：我有两个数据格式，其结构如下： aur.columns ['Date','No','Clos'] bal.columns ['Date','No','Clos'] 两者都是Pandas DataFrames 我需要将它们合并到具有相同结构的另一个数据框架中： merg.columns ['Date','No','Clos'] 它们之间常见的列是“D

浏览 5提问于2017-11-22得票数 2

回答已采纳

1回答

熊猫在列索引或命名栏上合并而不知道有多少

python、pandas

我不知道如何解决我的问题。我想合并两个数据文件： show = pd.merge(df1, df2, how='left', on=0) 但是，由于每次调用函数时，这两个数据格式都有很大的变化，所以我不知道有多少列，所以我无法命名它们。合并函数需要列名才能工作。我试着只提供列号，但没有起作用： raise KeyError(key) KeyError: '0' 是否可以不使用列名来合并数据文件。或者--我是否可以在不知道有多少列的情况下命名列呢？ @jezrael仍然显示一个错误： Traceback (most recent call last): Fil

浏览 4提问于2021-03-10得票数 0

回答已采纳

1回答

在潘达斯，合并怎么这么快？即使我还没有按索引排序呢？

performance、pandas、merge

我正在合并熊猫中的两个数据集，并希望加快这个过程，所以我在用于合并的列中对这两个数据集进行了排序。(以前，这些列根本没有排序。)排序没有造成明显的速度差异，两者都花了大约8秒。如果我手动合并两堆纸，比如说，它们的页码，我会首先按页码对它们进行排序。否则，我将不得不做很多来回翻转之间的堆栈。我写了一个测试来比较这两个过程。它按随机顺序生成两个帧，每个帧有一百万行。然后，它将生成第一列上已排序的另外两个列。然后，它合并前两个，最后，合并后两个。数据生成过程太慢了，以至于我没有时间尝试更多的行--但是合并仍然是在零感知的时间内进行的，即使没有排序。 import pandas as pd im

浏览 0提问于2018-03-20得票数 6

1回答

使用合并的Excel列中的元组列名选择pandas列失败

python、excel、pandas、multi-index

我有一个数据帧，其中的列名是元组。这样做的原因是，数据帧是基于复杂的Excel电子表格，其中列标题由不同大小的合并单元格组成，因此在MultiIndex中，几乎每一列都有一个或多个级别的nan条目，这使得选择和写入数据变得困难。我在过去多次使用相同的解决方案，没有出现问题，例如，MultiIndex头('SCN', nan, nan, nan, nan)将被转换为元组('SCN',)，然后我们将MultiIndex更改为正常的元组索引。然而，由于奇怪的KeyErrors和TypeErrors，这一次我似乎不能对数据帧做太多事情： test.columns Out

浏览 3提问于2021-02-24得票数 1

1回答

熊猫合并-把所有的连接列数据放在一个输出列下而不是两个输出列下？

python、join、merge、rename

我有两个CSV文件，有以下模式： CSV1栏： "Id","First","Last","Email","Company" CSV2栏： "PersonId","FirstName","LastName","Em","FavoriteFood" 如果我将它们分别加载到Pandas DataFrame中并执行newdf = df1.merge(df2, how='outer', left_on=['Last'

浏览 0提问于2016-08-25得票数 0

1回答

使用列表作为索引时出现越界错误

python-2.7、pandas

我有两个文件:一个是单列(称为pred)，没有头，另一个有两列: ID和IsClick (它有头)。我的目标是使用列ID作为pred的索引。 import pandas as pd import numpy as np def LinesInFile(path): with open(path) as f: for linecount, line in enumerate(f): pass f.close() print 'Found ' + str(linecount) + ' lines'

浏览 2提问于2015-07-13得票数 0

1回答

熊猫-合并文档-默认键是什么？

pandas、merge

试图理解pandas.merge方法的行为。它似乎使用了术语key而没有定义它。将DataFrame或命名系列对象与数据库样式的联接合并. 命名系列对象被视为具有单个命名列的DataFrame。连接是在列或索引上完成的。如果在列上联接列，则将忽略DataFrame索引。否则，如果将索引或列上的索引连接起来，则会传递索引。在执行交叉合并时，不允许进行合并的列规范。如果两个键列都包含键为空值的行，则这些行将相互匹配。这与通常的SQL行为不同，可能导致意外的结果。合并方法使用的默认键是什么？文件记录在哪里？上面还写着The join is done on column

浏览 6提问于2022-02-23得票数 0

1回答

Pandas中的合并问题

python、pandas

有人能帮我解决这个类型的错误吗？我正在运行以下代码。我正在尝试合并列"Issue_Year“上的两个数据格式 data_locked = data_locked.merge(rate_data_t.iloc[1],on = "Issue_Year",how='left') 我得到了以下错误： File "C:\Users\ED397JT\AppData\Local\Temp/ipykernel_38396/1094145651.py", line 1, in <module> data_locked =

浏览 1提问于2022-03-30得票数 0

1回答

如何在python中基于两种条件进行合并？

python、pandas、merge

我想使用复合ID (car，ID)创建一个连接，如果两个ID在第一个df上都匹配，则使用test列值创建一个新列 # Import pandas library import pandas as pd # initialize list of lists data1 = [['ford', 1010], ['chevy', 1515], ['toyota', 1515]] # Create the pandas DataFrame df_1 = pd.DataFrame(data1, columns = ['Car

浏览 8提问于2021-02-05得票数 0

回答已采纳

1回答

pandas:基于多列合并两个文件

python、pandas、csv

我有两个文件，其中有3个公共列-日期，KeywordId，AdGroupId。我想基于这些列合并这两个文件，以便对于第一个文件中具有特定日期、关键字if、adgroupid的每一行，如果第二个文件中存在具有相同日期、关键字if、adgroupid的相应行，则附加第二个文件中存在的其余值，如果不是，则在其余列中附加null或-。第一个文件(这里是df1)有59,000,000行。第二个文件大约有10,000,000行。我使用了下面的代码 import pandas as pd df1 = pd.read_csv(r"C:\Users\Rakshit Lal\Desktop\QVC

浏览 18提问于2020-07-27得票数 2

回答已采纳

2回答

如何在将数据与其他数据框合并时避免数据框中的列过少？

python、pandas、dataframe

我有两个数据帧df1和df2。 df1 = A B C D 1 2 3 7 . . df2 = A E F G 1 5 4 5 . . 当我通常想要使用pandas合并两个数据框中的特定列时，我会这样做： import pandas as pd df3 = pd.merge(df1[[A,B]],df2[[A,G]], on='A', how='inner') 然而，我感兴趣的是如何避免数据框中的几列并合并其余列。例如，我希望在合并时避免df1中的列C和D，以及df2中的E和F列，这样得到的df3只有A,B,G列。这是逆向工程

浏览 11提问于2020-10-10得票数 3

回答已采纳

2回答

在可选列或缺少列时，在Python/Pandas中查询数据帧

python、pandas、dataframe

我正在用Python/Pandas开发一个脚本来比较两个数据格式的内容。这两个数据文件都包含固定列表中列的任何组合，例如： "Case Name", "MAC", "Machine Name", "OS", "Exec Time", "RSS" 某些列的组合被用作唯一的键，但其中一些列可能有时缺少。另外，两个数据文件都包含(和遗漏)相同的列(以避免额外的复杂性)。因此，如果我从另一个dataframe获得一个密钥，那么我想从一个dataframe中检索一个行(我确定该键匹配每个dataframe

浏览 3提问于2021-10-29得票数 1

回答已采纳

1回答

生成新列名的pd.merge

python、pandas

合并两个数据文件，它们有一些公共的和一些不同的列名。结果在新列名中，这两种名称都不在，而是将每个列中的名称字符串组合在一起。 2个数据文件： df.columns有‘粒子’，‘框架’，'x旧‘，'y’旧‘corrected_traj.columns’有‘粒子’，‘框架’，'x'，'y‘ 两个dataframe都没有“frame_x”或“frame_y”。然而，当我试图合并时，我最终没有一个名为“frame”的列，而是两个新列“frame_x”和“frame_y”。当前两个数据格式索引都没有命名，尽管它们被链接到帧号。我一直试图避免与索引和列号相同的错

浏览 3提问于2019-09-02得票数 2

回答已采纳

1回答

MS Word邮件合并，多列成行，动态表

ms-word、mailmerge

我正在为邮件合并创建一个使用Word的发票模板。在我的源excel表中，每一行代表不同的发票，但每张发票可以有一个或两个项目。我想在我的Word文档内的动态表中列出这些项目。因此，如果特定发票有一个项目，我希望表有一行，如果发票有两个项目，我希望表有两行。我的源excel中的列有: InvoiceNumber、Date、InvoiceItem1Value、InvoiceItem2Value。因此，最后两列表示我的发票项，如果它们都填满了，那么输出文档中的表将有两行，每行包含一个值。如果只填充一列，则输出表将只有一行，其中包含来自该填充列的值。你能告诉我怎么做吗？

浏览 10提问于2017-06-22得票数 0

1回答

数据文件间合并函数中的键错误

python、pandas、dataframe、merge

我有个问题。我有两个数据集如下， df1 Sl No Address 1 1111 2 2222 3 2345 4 7890 5 0987 6 3456 7 1233 df2 email Add. AA A123 AA 1111 AA 99999 BB a9999 BB 345689 BB 345699 CC 1233 我试图基于address列合并这两个数据，并将名为email的列带到df1中。我已经重命名了该列，并将合并函数传递为下面。 df2.rena

浏览 7提问于2022-06-03得票数 0

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

python、pandas

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

2回答

即使密钥存在，KeyError也是如此

pandas、merge、keyerror

我正在尝试使用pd.merge合并两个数据帧。如果两个dataframe中都存在公司名称，我想从dataframe 2添加'Phone‘列。每次运行代码时，我都会得到KeyError='Company‘，即使这是我要合并的列名。我尝试过的东西： pd.merge(northstar,julie['Phone'], on='Company') northstar.merge(julie['Phone'], on 'Company') pd.merge('Company','Title'

浏览 0提问于2019-07-30得票数 0

1回答

熊猫在两列上合并使用日期和另一列

python、pandas、pandasql

你好，试图合并两个数据帧和和访问计数按日期和upc。事务数据(日期、upc、sales) 200 k行x3列访问计数(日期、upc、访问计数)2 million+行x3列我试过了 df3 = pandas.merge(df1,df2, on = ['upc','date'], how = 'left') 结果: merge执行，但不按日期或upc进行汇总。我也试过 df3 = pandas.merge(df1,df2, left_on = ['date'], right_on ['upc'

浏览 3提问于2017-12-30得票数 3

3回答

在熊猫中合并两个没有列名的数据(熊猫是新的)

python、pandas

短解释如果数据中有重复的列名，请确保在读取文件时重命名一列。如果您的数据中有NaN等，请删除这些。然后使用下面正确的答案进行合并。可能是个很简单的问题。我使用pandas.read_csv()阅读了两个数据集。我的数据在两个独立的csv中。使用以下代码： import mibian import pandas as pd underlying = pd.read_csv("txt1.csv", names=['dt1','price']); options =

浏览 3提问于2014-04-17得票数 4

回答已采纳

1回答

Pandas -合并具有时间差的行(当datetime为索引时)

python、excel、pandas、merge、timestamp

我找到了一些任务，用Pandas开发自己，但我在我使用的数据文件中发现了一些意想不到的错误。我真的想自己解决这个问题，但我不知道该怎么做。基本上我有一个excel文件，有列- PayType，钱，日期。在PayType的列中，我有4种不同类型的支付。支付租车费用，支付汽车服务费，还有2个都不重要。基本上，在支付汽车租金的每一项上，都会自动扣除手续费，这是完全同时发生的。我使用了透视表和划分的PayTypes作为列，因为我想要计算这些费用的百分比。透视表之前：enter image description here 时间差示例：enter image description here 透视

浏览 24提问于2020-09-11得票数 0

2回答

熊猫合并- CSV列数据偏移/错位

python、pandas、csv

我有一个合并的两个数据文件，在查看创建的CSV文件时，这些值不是从顶部行开始的。 import pandas as pd df_ifOperStatus = pd.read_csv('WG_ifOperStatus.csv') df_IfDescr = pd.read_csv('TEST_ifDescr.csv') merge = df_IfDescr.merge(df_ifOperStatus, left_on='Desc', right_on='if', how='left') merge.to_csv(&

浏览 7提问于2022-08-13得票数 0

回答已采纳

1回答

如何使用熊猫dataframe向基于另一个df中匹配列的数据标记为1或0的dataframe添加列

python、pandas、dataframe

我正在为机器学习算法标记一些医疗保险数据集，使用Pandas数据作为欺诈性或非欺骗性数据。标签包括将DMPOES数据集中的NPI编号与LEIE数据集中的NPI编号相匹配。每个数据集都包含一个名为"NPI“的列。我需要能够找出DMEPOS数据集中的每一行是否有一个匹配的NPI在LEIE数据集中。接下来，我需要向DMPOES数据集添加一列(可能命名为“欺诈性”，表示该行是否具有欺骗性，使用1表示欺诈性，使用0表示不欺诈性。这是我写的代码(不是很多，但应该给出我在Pandas中使用的总体方向。 import pandas as pd import numpy as np #Read fil

浏览 4提问于2021-03-28得票数 0