将pandas数据帧与对象合并_将pandas数据帧与来自csv的数据帧合并_Probelem与Pandas数据帧合并 - 腾讯云开发者社区

、

我正在使用pandas.merge合并两个数据帧。即使在指定how = left选项后，我发现合并后的数据框的行数比原始数据框的行数大。这一切为什么要发生？ panel = pd.read_csv(file1, encoding ='cp932') before_len = len(panel) prof_2000 = pd.read_csv(file2, encoding ='cp932').drop_duplicates() temp_2000 = pd.merge(panel, prof_2000, left_on='Candidate_u&#

浏览 0提问于2016-05-08得票数 30

回答已采纳

1回答

使用modin.pandas合并两个pandas数据帧可以得到ValueError

、、、

为了让我的pandas代码更快，我安装了modin并尝试使用它。之前工作过的两个数据帧的合并给出了以下错误： ValueError: can not merge DataFrame with instance of type <class 'pandas.core.frame.DataFrame'> 以下是两个数据帧的信息： printing event_df.info <class 'pandas.core.frame.DataFrame'> RangeIndex: 1980101 entries, 0 to 1980100 Data

浏览 9提问于2019-11-18得票数 0

2回答

追加在for循环中生成的pandas数据帧

、

我在for循环中访问一系列Excel文件。然后，我将excel文件中的数据读取到pandas数据帧中。我想不出如何将这些数据帧附加在一起，然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。这是我尝试过的： for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data = pandas.DataFrame.append(data) # requires at least two arguments appended_data.to_excel(&

浏览 2提问于2015-02-23得票数 111

回答已采纳

2回答

如何在Pandas中展平groupby操作的结果？

、

使用Pandas数据帧，有没有一种方法可以扁平化groupby操作的结果，而不必使用临时数据帧，然后将其合并到原始数据帧中？假设我需要创建一个依赖于聚合操作的"result“列，就像这个场景： import pandas as pd df = pd.DataFrame({'box': [1,1,1,2,2,3,3,3,3], 'item': ['apple', 'durian', 'pear', 'orange', 'banana', 'apple',

浏览 82提问于2020-05-04得票数 2

回答已采纳

1回答

如何在Databricks中将数据框导出为excel

、、、、

我想在一个excel表格中编写多个数据帧，无论是熊猫、考拉还是pyspark，并像xlwx一样做一些奇特的事情(改变单元格的大小或颜色等)，然后保存到S3存储桶中。我尝试过pandas.to_csv(s3.....test.xlsx)，但这不是我想要的。

浏览 17提问于2020-02-08得票数 0

1回答

范畴序列上的Pandas DataFrames合并

、、、

我试图了解熊猫是否支持在分类数据(即DataFrames“类别”)的列上合并dtype=。我大部分的数据都是用R做的，但是我想用Python/熊猫做更多的工作。在R中，合并因素(类似于范畴dtype)会导致类型强制，通常是对字符的强制。这允许一个数据帧将一个by变量(join列)指定为一个因子(分类)，而另一个数据帧的by变量是一个字符串。熊猫是否在合并/加入之前对分类数据进行类似的强制字符串？我是否应该期望合并在分类上是健壮的？我在哪里可以找到关于熊猫(自动)类型强制的文档？简单的例子： +++对非绝对/非标量向量进行相等测试是错误的： In [52]: import pandas as

浏览 3提问于2014-11-27得票数 1

回答已采纳

2回答

将Pandas Dataframe写入DBF文件？

、、、

我正在使用shapefile，它将属性数据存储在DBF文件中。我需要使用Pandas操作属性，并将新的DBF数据写回磁盘。不幸的是，Pandas数据帧没有df.to_dbf方法(而R有)。我到处寻找，但似乎没有看到任何明显的方法来完成这项任务。如何将pandas数据帧保存为DBF文件？

浏览 208提问于2017-07-04得票数 4

回答已采纳

1回答

在潘达斯，合并怎么这么快？即使我还没有按索引排序呢？

、、

我正在合并熊猫中的两个数据集，并希望加快这个过程，所以我在用于合并的列中对这两个数据集进行了排序。(以前，这些列根本没有排序。)排序没有造成明显的速度差异，两者都花了大约8秒。如果我手动合并两堆纸，比如说，它们的页码，我会首先按页码对它们进行排序。否则，我将不得不做很多来回翻转之间的堆栈。我写了一个测试来比较这两个过程。它按随机顺序生成两个帧，每个帧有一百万行。然后，它将生成第一列上已排序的另外两个列。然后，它合并前两个，最后，合并后两个。数据生成过程太慢了，以至于我没有时间尝试更多的行--但是合并仍然是在零感知的时间内进行的，即使没有排序。 import pandas as pd im

浏览 0提问于2018-03-20得票数 6

1回答

表未被识别

、、、

import pandas as pd from tabula import read_pdf FileName="Filepath" DF3=read_pdf(FileName,multiple_tables=True,options="--pages 'all'", lattice= True) print DF3 import pandas as pd import camelot FileName="Filepath" tables = camelot.read_pdf(FileName,pages='1-en

浏览 10提问于2019-02-28得票数 0

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

1回答

Python :合并列表列上的两个Pandas Dataframe

、、、、

我需要根据一列名为"authors“的列表找到两个pandas数据帧之间的交集。但我得到的却是这个错误：

浏览 3提问于2017-06-23得票数 0

1回答

Pandas外部合并列序列不固定

、

我正在尝试使用pandas合并两个数据帧。我正在进行数据帧的外部合并。我的数据框有以下列： DF1: (ID, X) DF2: (ID, Y, Z) 当我合并这些数据框时，输出数据框中列的顺序发生了变化。对于某些迭代，我得到了 DF_OUTPUT: (ID, X, Y, Z) 有时是这样的： DF_OUTPUT: (X, ID, Y, Z) 如何在输出数据框中保留列的顺序？

浏览 2提问于2018-11-27得票数 0

1回答

字符串(对象)数据的to_sql内存不足错误

、、、

我正在使用to_sql将pandas数据帧写入SQL server数据库。数据帧很小(1列，100行)。然而，我得到了一个错误： cursor.executemany(statement, parameters) MemoryError 该列的dataType为object (即string)。如果我将dataType转换为INT，则代码执行时不会出现错误。为什么对象数据会导致内存不足错误?我如何修复它？

浏览 3提问于2020-09-19得票数 0

1回答

在pyspark中保持至少有一个元素满足条件的组

、、

我一直在尝试用pyspark重现一些在Pandas中很容易做到的东西，但我现在已经挣扎了一段时间。假设我有以下数据帧： df = pd.DataFrame({'a':[1,2,2,1,1,2], 'b':[12,5,1,19,2,7]}) print(df) a b 0 1 12 1 2 5 2 2 1 3 1 19 4 1 2 5 2 7 和列表 l = [5,1] 我尝试做的是按a进行分组，如果b中的任何元素都在列表中，则为该组中的所有值返回True。然后，我们可以使用结果来索引数据帧。与此相对应的Pandas是：

浏览 8提问于2020-11-04得票数 2

回答已采纳

1回答

无法将合并的Dask dataframe转换为pandas dataframe -出现错误"Unalignable boolean Series provided as indexer“

、、

我正在尝试合并3个Dask数据帧并相应地查询它们。数据帧是从formula1数据的SQL表的.csv文件创建的。表格 laptimes: raceId, driverId, lap, position, time races: raceId, year, round drivers: driverId, forename, surname 下面的laptimes表与races和drivers表具有外键关系。我已经读入，合并了数据帧，并尝试查询数据帧： from dask import dataframe as df import pandas as pd pd.set_option("

浏览 82提问于2021-10-05得票数 2

2回答

如何用Pandas合并两个数据帧？

、、、

我正在使用Pandas合并两个从Psychopy获得的数据帧。 y = ["key_resp_0.keys", "key_resp_0.rt"] #some columns I want in my final dataframe df = pd.DataFrame(myData) columns = df.columns.values.tolist() df2 = df.reindex(columns = y, fill_value='') df3 = pd.merge(df2,df) 这是我得到的错误： type object argume

浏览 0提问于2019-12-03得票数 0

1回答

在Databricks中使用Pyspark更新数据库表

、、、

我在Azure SQL Server数据库中有一个表，该表是从我的Dataframe填充的。我想使用pyspark / pandas基于多条件数据库来更新这个表。我是PySpark / Databricks / Pandas的新手，有人能告诉我如何更新表吗？我已经将数据插入到表中-我可以想到的一种解决方案是将表中的数据加载到数据帧中，然后将新文件合并到相同的数据帧中，然后从表中删除数据并插入此数据帧。如果这是正确的方法，那么在上述场景中，我们如何从数据库表中删除数据？

浏览 2提问于2020-04-20得票数 0

1回答

合并回原始pandas数据帧中的新计算

、

假设我有一个名为'df‘的Pandas数据帧，如下所示： X Y Z 0 -3 6 -7 1 -4 -10 -1 2 9 -10 -9 3 5 0 -8 4 -2 1 -8 我想在df中的一些行之外创建一个新的框架： new_df = df.loc[(df['X'] == -3) & (df['X'] == 9)] 然后我修改新的数据框： new_df.Y = 150 有没有一种简单的方法可以将我的新数据帧重新插入到旧帧中，只替换我在新帧中修改的那些值？所以最后，我会得到原始的'df‘，它看起来像这样：

浏览 0提问于2016-12-10得票数 1

1回答

从编程的角度来看，什么是数据帧？

、、

几个数据科学包，例如Python的Pandas，都有一个“数据帧”，所有其他功能都基于这个“数据帧”。从编程的角度来看，到底什么是数据帧？

浏览 1提问于2021-10-20得票数 0

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

、、

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

1回答

我如何基于一个公共的列，研究站点“名称”来组合2个熊猫数据帧？

、

我是Python和一般编程的新手。我正在尝试用python自动化一些地下水模型输出数据的处理。一个pandas数据帧测量了具有不同类型的多个列的数据流(左)，另一个对数据流进行了建模(右)。我尝试在列"Name“上使用pd.merge，以便将正确的建模输出值链接到相应的测量站点值。当我使用下面的脚本时，我得到相应的错误： left = measured_df right = modeled_df combined_df = pd.merge(left, right, on= 'Name') ValueError:列标签'Name‘不是唯一的。对于多索引，标签

浏览 8提问于2020-03-31得票数 2

回答已采纳

1回答

Dask:合并后写入csv非常慢(python)

、、

我有一个小的Pandas数据帧(2000行，35列)，我将它与一个大的Dask数据帧(600万行，550列)合并在一起。我将小Pandas数据帧转换为Dask数据帧，并使用以下代码进行合并： final_df=dd.merge(left=small_df,right=big_df,how='inner',on=('var1','var2','var3')) 合并操作非常快，但运行这些代码需要一段时间： final_df.head() 或者： final_ddf.to_csv('file.csv',header=T

浏览 28提问于2020-07-16得票数 0

回答已采纳

1回答

Pandas数据帧和字典的深度副本

、、、

我正在创建一个小的Pandas数据帧： df = pd.DataFrame(data={'colA': [["a", "b", "c"]]}) 我把那个df拷贝了一遍。我使用的不是Pandas方法，而是通用Python，对吧？ import copy df_copy = copy.deepcopy(df) 一个df_copy.head()提供以下内容： ? 然后我将这些值放入字典中： mydict = df_copy.to_dict() 字典看起来是这样的： ? 最后，我删除了列表中的一项： mydict['colA&#

浏览 42提问于2020-01-10得票数 3

回答已采纳

1回答

使用Pandas查找其他两个数据帧中的重复项和唯一元素？

、、

我有两个从XML数据创建的数据帧；它们有每个文件的文件名和路径的列表，包括一些额外的元数据。像这样的东西 filename - filepath - meta1 - meta2 - meta3 基本上，每个数据帧中的文件可能在另一个数据帧中具有相同的文件名，但它们将位于不同的路径中。我正在尝试比较这两个数据帧，以找出哪些文件在这两个数据帧中是唯一的，以及哪些文件名在这两个数据帧中是通用的。我将只查看文件名；因此，如果一个文件存在于两个数据帧上，即使路径不同，我也会将它们视为重复。在指定我只想使用filename列之后，我开始研究各种Pandas方法，并找到了适用于我的示例的drop_dup

浏览 28提问于2020-11-09得票数 0

1回答

将数据从S3读取到pandas的最佳方法

、、、、

我有两个CSV文件，一个大约60 GB，另一个在S3中大约是70 GB。我需要将这两个CSV文件加载到pandas数据帧中，并对数据执行连接和合并等操作。我有一个EC2实例，它有足够的内存供两个数据帧一次加载到内存中。从S3到pandas数据帧读取这么大的文件的最佳方式是什么？另外，在我对数据帧执行了所需的操作之后，输出的数据帧应该被重新上传到S3。将巨大的csv文件上传到S3的最佳方式是什么？

浏览 5提问于2020-05-06得票数 0

1回答

如何使用Python比较太大而无法放入内存的数据帧？

、、、

我有可能很大的数据帧，大约有10列和1e6行，具有不同的维度。假设行在两个数据帧中都是唯一的。由于这些数据帧不能加载到内存中，我如何找到一个数据帧中存在于另一个数据帧中的所有行？我目前只处理较小的数据帧，但我很快就会弄清楚这一点。我非常喜欢使用pandas，但我愿意使用不同的包(xarray?)如果有显著的好处。如果您推荐一个不同的包，请提供一些代码来进行比较。下面是我如何与内存中适合的pandas数据帧进行比较： import pandas as pd def row_intersection(df1, df2): noNA = df2.fillna(0) retur

浏览 23提问于2021-09-02得票数 0

回答已采纳

1回答

将DataFrame的最后一列附加到另一个DataFrame

、、

我有一个大的csv文件，我把它转换成一个pandas.DataFrame。之后，我将这个数据分割成几个较小的数据，处理它们并将它们转换回一个csv文件。在处理步骤中，我需要将原始数据帧的最后一列附加到较小的数据帧。我试着用df.iloc[:,-1]和df.ix[:,-1]做这件事。当我这么做时： rating_column = df.iloc[:,-1] #get last column from original dataframe print(rating_column) 我得到了正确的结果： timestamp 2

浏览 0提问于2015-07-23得票数 1

回答已采纳

1回答

Pandas:读取具有不同分隔符的CSV文件-合并错误

、、、、

我有4个单独的CSV文件，我希望读入Pandas。我想将这些CSV文件合并到一个数据帧中。问题是CSV文件中的列包含以下内容：、；|和空格。因此，在读取不同的CSV文件时，我必须使用不同的分隔符，并进行一些转换以使其格式正确。每个CSV文件都包含一个“ID”列。当我合并我的数据帧时，它没有正确地完成，并且我在已经合并的列中得到了'NaN‘。您是否必须使用相同的分隔符才能正确合并数据帧？

浏览 10提问于2017-06-28得票数 0

回答已采纳

1回答

IBM :将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame

、、、

我对IBM中的ibmdbpy.frame.IdaDataFrame类型有问题。我有两张数据。第一个类型是ibmdbpy.frame.IdaDataFrame，第二个类型是pandas.core.frame.DataFrame。我想在Python中合并这两个数据格式。是否可以将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame？

浏览 2提问于2017-02-06得票数 2

回答已采纳

2回答

即使密钥存在，KeyError也是如此

、、

我正在尝试使用pd.merge合并两个数据帧。如果两个dataframe中都存在公司名称，我想从dataframe 2添加'Phone‘列。每次运行代码时，我都会得到KeyError='Company‘，即使这是我要合并的列名。我尝试过的东西： pd.merge(northstar,julie['Phone'], on='Company') northstar.merge(julie['Phone'], on 'Company') pd.merge('Company','Title'

浏览 0提问于2019-07-30得票数 0

1回答

在Pandas中合并索引上的数据帧效率更高

、、、

为什么在索引上合并Pandas中的数据帧比在列上合并数据帧更有效(更快)？ import pandas as pd # Dataframes share the ID column df = pd.DataFrame({'ID': [0, 1, 2, 3, 4], 'Job': ['teacher', 'scientist', 'manager', 'teacher', 'nurse']}) df2 = pd.DataFrame({'

浏览 1提问于2018-06-21得票数 18

2回答

如何将Pandas DataFrame中的每一列与其他列相乘？

、

给定一个pandas数据帧，我想将每一列与其他列逐一相乘，然后将每个新列作为新列返回给该数据帧。例如 A B C 1 2 3 2 4 4 1 2 5 然后 A B C A*B A*C B*C 1 2 2 2 3 6 2 4 8 8 8 16 1 2 2 2 5 10

浏览 0提问于2015-03-24得票数 2

2回答

如何在满足条件的情况下更改dataframe中的单值？

、、

据我所知，我目前更改pandas数据框中的值的方法还远远不是最优的，并且确实损害了我的工作流程。示例:我想检查是否在另一个数据帧中找到了一个名称，如果是，使用第一个数据帧中搜索到的名称的iloc放入该数据帧中的值： for idx in id_list_of_names: name = df["name"].iloc[idx] if name in df_two["name"].values: df["value"].iloc[idx] = df_two["value"][d

浏览 13提问于2019-05-09得票数 1

1回答

存储在dataframe中的计算dask延迟对象

、、、

我正在寻找最好的方法来计算存储在数据帧中的许多dask delayed指令。我不确定是否应该将pandas数据帧转换为包含delayed对象的dask数据帧，或者是否应该对pandas数据帧的所有值调用compute调用。我非常感谢大家的建议，因为我在通过嵌套的for循环传递delayed对象的逻辑上遇到了问题。 import numpy as np import pandas as pd from scipy.stats import hypergeom from dask import delayed, compute steps = 5 sample = [int(x) for x

浏览 10提问于2019-08-10得票数 0

1回答

在pandas中合并两个数据帧，给出“内核似乎已经死了，它将自动重启”。使用Jupyter notebook

、、、、

我想使用pandas中的合并功能合并两个数据帧。当我想在公共列上这样做时，jupyter notebook给我以下错误：“内核看起来已经死了。它将自动重新启动。”每个数据帧大约为50k行。但是，当我尝试同样的事情，每个数据帧只有50行时，它工作得很好。我想知道有没有人有建议。

浏览 18提问于2020-10-27得票数 0

2回答

合并两个具有不同列名的数据帧，并从结果中排除等效键。

、、

我有两个熊猫数据帧，它们共享相同的密钥，但每个对象的名称不同。 df = pd.DataFrame({"ID":[1,2,3], "Flag":[0,0,1]}) results = pd.DataFrame({"client_id":[1,2,3], "score":[600,700,800]}) df.columns Index(['ID', 'Flag']) results.columns Index(['client_id', 'score']) 我想将它们合

浏览 0提问于2019-08-28得票数 1

回答已采纳

1回答

如何在我的dataframe中创建一个新变量，用dataframe名称填充值？

、、、

我有一堆数据集，每个数据集都有相同的标题，每个数据集都指向不同的国家。我正在尝试在每个pandas数据帧中创建一个新列，其中填充了我的数据帧名称(这是国家的名称！) 我该怎么做呢？编辑：我没有提到我创建了数据集 us = pd.concat([coeff, pvalues], axis = 1).reset_index() us.columns = ['Factor',"Coeff","P-value"]

浏览 15提问于2019-01-10得票数 0

回答已采纳

1回答

在不带row.names的相同长度的数据帧中添加带row.names的数值列表对象

、、、、

我使用mclust包在一个非丢失的数据帧上执行了一个操作。非缺失数据框是通过使用select函数使用dplyr包创建的。因此，row.names在传递给mclust函数的数据帧中显示为一个向量。接下来，我从这个函数中提取了一些临界值(案例‘分类’)，如下所示： class<-functionobject$classification 因此，分类值的数字列表与row.names相关联。当我尝试在不使用row.names的情况下将这个值列表追加到相同长度(相同大小写)的新数据帧时，似乎丢失了重要的排序。我知道这一点，因为当我在新数据帧中比较其他变量的分类组时，它们不等于使用这些相同变量

浏览 26提问于2020-01-12得票数 0

2回答

从多个子文件夹加载未知数量的文件

、、

我在多个子文件夹中获取了不同数量的检测器数据，基本上我需要将它们组合到一个pandas数据帧中。我想知道有没有什么聪明的方法来做这个？使用查找。-name *.cvs | wc -l 给出:例如，1464个文件然后，我必须将其加载到数据帧中。目录结构可能类似于： sub-sub-sub-data / main folder-sub-sub-sub-data \ sub-sub-sub-data tldr:如何将未知数量的数据从多个不同的子文件夹加载到单个pandas数据帧中

浏览 0提问于2020-06-26得票数 0

1回答

Create function用于在特定列上合并给定数量的数据帧

、、、、

我想创建一个函数，它接受数量不确定的数据帧，然后在给定列上合并它们，这实际上是最左边的列。我应该使用*args这样的东西吗？ import pandas as pd def merge_given_dfs(*args): pd.merge(*args,left_on='name') merge_given_dfs(df1,df2,df3,df4) 谢谢!

浏览 16提问于2020-10-24得票数 0

1回答

python pandas数据帧合并

、、

我想在python中使用for循环合并csv文件中的一些数据帧。但是结果是空的。为什么会这样呢？这是我的代码。 result = pandas.DataFrame(columns = ['col_A', 'col_B']) for i in range(0, 5): #col_A is integer for numbering, col_B is float in range 0 to 1 temp = pandas.DataFrame([[0, 0.5132443], [1, 0.12436421], [2, 0.12341162]], co

浏览 1提问于2017-05-27得票数 0

3回答

熊猫-用相同的列名合并两个DataFrames，并在一个单元格中合并两个DataFrames的信息。

、、、

我在第一列中有两个具有相同列名和相同in的数据帧。在第一个数据帧中，我有int信息，在第二个str中。下面是它们的样子的一个例子： ID Cat1 Cat2 Cat3 1 1 1 0 2 0 2 1 3 0 0 5 ID Cat1 Cat2 Cat3 1 text text text 2 text text text 3 text text text 我希望将它们合并到一个Data

浏览 2提问于2020-03-01得票数 0

回答已采纳

2回答

Python Pandas合并Dataframe以仅获取唯一值

、、

我是使用Pandas的新手，我想合并两个数据帧，以便只从第一个数据帧中获得唯一的值。下面我给出了一个例子： df1 = ['Apple', 'Banana', 'Carrot', 'Squash', 'Watermelon'] df1 = pd.DataFrame(df1) df2 = ['Apple', 'Cucumber', 'Raddish', 'Watermelon'] df2 = pd.DataFrame(df2) Result desi

浏览 1提问于2021-02-17得票数 0

2回答

与WHERE子句连接的Pandas类比

、、

我正在python的pandas中连接两个数据帧(A和B)。目标是接收来自B的所有纯行( A.client_id为null的A.client_id=B.client_id上的sql模拟-右连接B) 在pandas中，我只知道进行合并操作，但我不知道如何设置条件(where子句)： x=pd.merge(A,B,how='right',on=['client_id','client_id']

浏览 1提问于2016-11-29得票数 6

回答已采纳

1回答

使用合并的Excel列中的元组列名选择pandas列失败

、、、

我有一个数据帧，其中的列名是元组。这样做的原因是，数据帧是基于复杂的Excel电子表格，其中列标题由不同大小的合并单元格组成，因此在MultiIndex中，几乎每一列都有一个或多个级别的nan条目，这使得选择和写入数据变得困难。我在过去多次使用相同的解决方案，没有出现问题，例如，MultiIndex头('SCN', nan, nan, nan, nan)将被转换为元组('SCN',)，然后我们将MultiIndex更改为正常的元组索引。然而，由于奇怪的KeyErrors和TypeErrors，这一次我似乎不能对数据帧做太多事情： test.columns Out

浏览 3提问于2021-02-24得票数 1

1回答

如何在tkinter中显示pandas数据

、、、

我从python中的csv文件创建了一个pandas数据帧。如何在tkinter窗口中显示此数据帧。 import pandas as pd methods = pd.read_csv('metode.csv') methods = methods.drop(methods.columns[[0]], axis=1)

浏览 3提问于2019-10-29得票数 0

2回答

通过合并多个长度未知的数据帧来创建数据帧

、、、

我正在尝试对棒球场地的F/x数据进行一些分析。所有的俯仰数据都存储在一个pandas数据帧中，其中包含像“俯仰速度”和“X位置”这样的列。我有一个包装器函数(使用pandas.query)，对于给定的音高，它将找到具有类似速度和位置的其他音高。此函数返回未知大小的pandas数据帧。我想在大量的投球上使用这个函数；例如，查找与在一场比赛中投出的投球相似的所有投球。我有一个函数可以正确地做到这一点，但它相当慢(可能是因为它不断地调整resampled_pitches的大小)： def get_pitches_from_templates(template_pitches, all_pitches

浏览 1提问于2015-03-07得票数 0

1回答

连接多个数据帧，同时保留主数据帧的行数

、、、、

我有一个pandas数据帧，我用它来创建另外两个数据帧。在创建两个数据帧之后，我希望将这两个数据帧与原始数据帧合并，保留原始数据帧的计数。有没有更简单的方法呢？原始数据帧示例： ? 第一个数据帧示例： ? 第二个数据帧示例： ? 最终输出应如下所示： ? 当我尝试这样做时，我得到的行数要么是原来的两倍，要么是行数的一半。

浏览 13提问于2021-06-24得票数 0

1回答

具有不同形状的pandas.where

、、

我正在读有关pandas dataframe where函数的文章。但我想比较两个形状不同的数据帧，例如： >>>print(df1.shape) (10495, 12) >>>print(df2.shape) (10488, 12) 有没有类似于where的函数来处理这种情况？最好的

浏览 16提问于2020-01-15得票数 0

1回答

在两个pandas数据帧中查找匹配值，并从匹配行中返回一个值

、、、

很难用一种清晰准确的方式来表达这个问题，所以希望下面的内容能帮助我更好地理解我的问题。我有两个pandas数据帧，在这个例子中简化了，它们是： df1 = 'CENSUS_ID' 60014001001 60014002001 df2 = 'GEO_ID' 'MED_INCOME' 60014001001 177417 60014002001 166313 60014002002 132400 60014003001 161964 我想在df1中添加一个名为'MED_INCOME‘的列，方法是在df2中

浏览 17提问于2019-01-22得票数 1

回答已采纳