Pandas DataFrame有条件地合并_Pandas有条件地合并数据帧_python pandas -有条件地合并数据 - 腾讯云开发者社区

python、merge、pandas

我正在尝试将几个文件从csv导入到单个DataFrame中，并在尝试添加第三个DataFrame时得到以下错误。 AssertionError: cannot create BlockManager._ref_locs because block [ObjectBlock: [CompletionDate, Categories, DateEntered_x, <lots more columns here>...], dtype=object)] does not have _ref_locs set 守则是： project = pandas.read_csv(read_csv

浏览 9提问于2013-08-11得票数 1

回答已采纳

1回答

python pandas数据帧合并

python、pandas、dataframe

我想在python中使用for循环合并csv文件中的一些数据帧。但是结果是空的。为什么会这样呢？这是我的代码。 result = pandas.DataFrame(columns = ['col_A', 'col_B']) for i in range(0, 5): #col_A is integer for numbering, col_B is float in range 0 to 1 temp = pandas.DataFrame([[0, 0.5132443], [1, 0.12436421], [2, 0.12341162]], co

浏览 1提问于2017-05-27得票数 0

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

python、pandas

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

1回答

寻找有条件应用于大熊猫数据的函数

python、pandas

我正在研究如何将函数应用于熊猫数据栏中的一个列。但是我只想在满足条件的情况下应用这个函数。 import pandas as pd def example_function(a, b): return a + b data = dict( A = [1, 2], B = [4, 5], C = ["A", "B"], ) example_df = pd.DataFrame(data=data) 因此，我想使用来自A和B的值应用example_function，只有在C列中有"B"的情况下。有什么想法吗？

浏览 2提问于2022-04-13得票数 0

1回答

合并从csv文件导入的Dask数据文件

python、pandas、dataframe、pyspark、dask

我需要导入大型数据集并合并它们。我知道还有其他类似的问题，但我找不到具体问题的答案。使用dask，我似乎能够将大型数据集读入数据格式，但我无法将其与另一个数据格式合并。 import dask.dataframe as dd import pandas as pd #I have to do this with dask since with pandas I get mem issue and kills the python ps = dd.read_csv('*.dsv',sep='|',low_memory=False) mx = dd.read_cs

浏览 3提问于2017-10-15得票数 3

回答已采纳

1回答

在Pandas DataFrame中条件连接两列的最佳/简明方法

python、pandas、dataframe、concatenation

我尝试在Pandas DataFrame中有条件地连接两列。我找到了一个相关的，我在下面改编了它--但似乎应该有一种更简洁的方法来做到这一点。在带有dplyr或data.table的R中，这是一行相对简单的代码。 import pandas as pd import numpy as np data = {"Product": ["Shorts", "T-Shirt", "Jacket", "Cap"], "Color": ["Red", "Blue

浏览 2提问于2021-11-25得票数 0

1回答

使用modin.pandas合并两个pandas数据帧可以得到ValueError

pandas、dataframe、merge、modin

为了让我的pandas代码更快，我安装了modin并尝试使用它。之前工作过的两个数据帧的合并给出了以下错误： ValueError: can not merge DataFrame with instance of type <class 'pandas.core.frame.DataFrame'> 以下是两个数据帧的信息： printing event_df.info <class 'pandas.core.frame.DataFrame'> RangeIndex: 1980101 entries, 0 to 1980100 Data

浏览 9提问于2019-11-18得票数 0

2回答

在使用iterrows()时修改数据不起作用

python、pandas

我正在使用iterrows()来遍历数据帧。使用for循环和嵌套的if语句，我能够识别出我想要更改的单元格。我使用了一条print语句来验证我是否能够更改数据，但是当我打印出数据帧时，信息没有改变。我能够在较小的数据框架上做到这一点。有什么想法吗？我原来的代码是这样的： data.loc[(data.ID.isin([10,45])) & (data.source.notnull()), 'ID'] = 50 但我需要添加以下内容： data.loc[(data.ID.isin([23,45])) & (data.source.notnull()), '

浏览 1提问于2019-04-05得票数 1

回答已采纳

1回答

如何在python中基于两种条件进行合并？

python、pandas、merge

我想使用复合ID (car，ID)创建一个连接，如果两个ID在第一个df上都匹配，则使用test列值创建一个新列 # Import pandas library import pandas as pd # initialize list of lists data1 = [['ford', 1010], ['chevy', 1515], ['toyota', 1515]] # Create the pandas DataFrame df_1 = pd.DataFrame(data1, columns = ['Car

浏览 8提问于2021-02-05得票数 0

回答已采纳

1回答

处理文件夹中的每个CSV文件

python、pandas

我正在尝试从特定文件夹导入一组CSV文件，并分别处理每个CSV文件(并打印每个处理后的CSV文件的结果)。下面的代码读取感兴趣的CSV文件，但是当我实际尝试处理数据(代码的最后两行)时，我只收到一个结果，该结果对应于代码读取的最后一个文件。我想，问题是，代码可能会计算每个CSV文件的输出，但是，它会覆盖实际结果。 import os, glob import pandas as pd path = "J:\Tre\Data\CSVS" for files in glob.glob("*_monday_*.csv"): dataframe = pd

浏览 0提问于2015-02-17得票数 0

1回答

如何组合具有相同列和数据类型的Pandas DataFrames

python、pandas、dataframe

我有三个数据文件，我需要合并，但我没有任何尝试工作。我一直在尝试每一件事，但都没有效果。到目前为止，这就是我所拥有的： # DataFrame columns columns = ["exchange", "symbol", "name"] # Create NYSE dataFrame NYSE = list(zip(NYSE_symbols, NYSE_companies)) NYSE = [("NYSE", ) + elem for elem in NYSE] NYSE_df = pd.DataFrame([x for x

浏览 9提问于2021-12-01得票数 1

回答已采纳

5回答

熊猫合并如何保持秩序？

python、pandas

我在pandas中有两个DataFrames，试图合并它们。但是熊猫一直在改变顺序。我试过设置索引，重置它们，无论我做什么，我都不能得到返回的输出，使行的顺序相同。有什么窍门吗？注意，我们从贷款顺序'a，b，c‘开始，但在合并之后，它是’a，c，b‘。 import pandas loans = [ 'a', 'b', 'c' ] states = [ 'OR', 'CA', 'OR' ] x = pandas.DataFrame({ 'loan' : loans,

浏览 0提问于2013-11-26得票数 34

1回答

Dask两个conesquent级联导致一个CancelledError

python、dask

在对dataframes使用两次concat之后，我得到了一个意想不到的行为，如下所示： import dask.dataframe as dd import pandas as pd ddf1 = dd.from_pandas(pd.DataFrame({'A': range(10), 'B': [1,3,5,7,9,11,13,15,17,19]}), npartitions=4) ddf2 = dd.from_pandas(pd.DataFrame({'A': range(10), 'B': range(10)}), np

浏览 4提问于2017-03-22得票数 1

回答已采纳

1回答

用Pandas + xlsxwriter删除索引的边框

python、excel、xlsxwriter

似乎xlsxwriter会自动添加熊猫df索引的边框。在写入数据之后，如何删除边框？当我试着用这样的方法 worksheet.set_column('A:A', None, test_format) #test_format just makes borders = 0 它要么删除这些值，要么什么也不做. 下面是一个示例设置： import xlsxwriter import pandas as pd # Create a test df df = pd.DataFrame({'Name': ['Tesla','Tesla',

浏览 4提问于2020-04-22得票数 1

回答已采纳

1回答

合并到南-窃听器是我想要的行为。我应该担心未来的修正吗？

python、pandas、dataframe、nan

在Pandas，pd.Nan != pd.Nan，然而现在，合并到dataframe，南将合并在一起。正如问题中所报告的那样，正常的行为应该是不对此进行合并。讨论了这个问题。来自It_is_chris：合并示例df = pd.DataFrame({' col1 ':np.nan，'match'，' col2 ':1,2}) df2 = pd.DataFrame({'col1':np.nan，'no match'，' col3 ':3,4}) pd.merge(df，df2，on='c

浏览 1提问于2022-02-18得票数 1

回答已采纳

2回答

如何使用concat或merge合并两个数据帧？

python、pandas

我正在尝试合并看起来像这样的两个数据框：https://i.imgur.com/ZCPzx7V.png 我应该写些什么来合并这两者呢？我经历过这种情况，但仍然收到错误： https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html https://www.datacamp.com/community/tutorials/joining-dataframes-pandas

浏览 17提问于2020-03-24得票数 0

2回答

熊猫蟒蛇亲子层次得到父母

python、pandas、dataframe、parent-child

所以我有以下数据 import pandas as pd df = pd.DataFrame({'ID': [ 0 , 1 , 2 , 3 ], 'name': ['A', 'B', 'C', 'D'], 'parent': [ '', 'A', 'A', 'B']}) 现在，正如您所看到的，这里有一个父-子层次结构。然而，不幸的

浏览 13提问于2022-06-17得票数 1

回答已采纳

2回答

Dataframe与两个不同列中的匹配键合并

python、pandas、merge、inner-join

我想merge两个DataFrames，但是在第二个DataFrame中匹配的键分散在两个不同的列中。合并这两个DF的最佳方法是什么？ import pandas as pd data1 = {'key': ['abc','efg', 'xyz', 'sdf']} data2 = {'key1' : ['abc','sss','ggg','ccc'], 'key2' : ['aaa'

浏览 20提问于2020-11-21得票数 0

回答已采纳

2回答

在可选列或缺少列时，在Python/Pandas中查询数据帧

python、pandas、dataframe

我正在用Python/Pandas开发一个脚本来比较两个数据格式的内容。这两个数据文件都包含固定列表中列的任何组合，例如： "Case Name", "MAC", "Machine Name", "OS", "Exec Time", "RSS" 某些列的组合被用作唯一的键，但其中一些列可能有时缺少。另外，两个数据文件都包含(和遗漏)相同的列(以避免额外的复杂性)。因此，如果我从另一个dataframe获得一个密钥，那么我想从一个dataframe中检索一个行(我确定该键匹配每个dataframe

浏览 3提问于2021-10-29得票数 1

回答已采纳

1回答

熊猫在Python的合并中降低索引？

python、pandas

我使用merge(..., how='left')合并两个数据格式，因为我只想保留与“左”数据格式匹配的条目。问题是合并操作似乎删除了我最左边的dataframe的索引，如下所示： import pandas df1 = pandas.DataFrame([{"id": 1, "name": "bob"}, {"id": 10, "name": "

浏览 4提问于2013-03-27得票数 9

1回答

在Pandas中合并索引上的数据帧效率更高

python、pandas、dataframe、merge

为什么在索引上合并Pandas中的数据帧比在列上合并数据帧更有效(更快)？ import pandas as pd # Dataframes share the ID column df = pd.DataFrame({'ID': [0, 1, 2, 3, 4], 'Job': ['teacher', 'scientist', 'manager', 'teacher', 'nurse']}) df2 = pd.DataFrame({'

浏览 1提问于2018-06-21得票数 18

2回答

如何用Pandas合并两个数据帧？

python、pandas、dataframe、merge

我正在使用Pandas合并两个从Psychopy获得的数据帧。 y = ["key_resp_0.keys", "key_resp_0.rt"] #some columns I want in my final dataframe df = pd.DataFrame(myData) columns = df.columns.values.tolist() df2 = df.reindex(columns = y, fill_value='') df3 = pd.merge(df2,df) 这是我得到的错误： type object argume

浏览 0提问于2019-12-03得票数 0

1回答

ValueError:不能将DataFrame与<class 'str'>类型的实例合并

python、python-3.x、pandas

我正在尝试合并两个具有相同列‘值’的数据集，但它给了我一个错误:无法将DataFrame与类型的实例合并 import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np from matplotlib.pyplot import pie, axis, show from pandas import Series, DataFrame class Dataset(): def __init__(self, input): self.choice

浏览 0提问于2018-03-10得票数 0

回答已采纳

1回答

在Pandas中连接，但保留重复的列名

python、pandas、numpy

在连接pandas中的数据帧列表时，有没有办法保留重复的列。例如，我创建了一个数据帧列表： import pandas as pd Label1 = ['A', 'B', 'C', 'A'] Label2 = ['A', 'C', 'D', 'E'] Label3 = ['A', 'B', 'C', 'D', 'E'] row1 = [1, 2, 3, 5] row2 = [2,4,5

浏览 97提问于2021-07-12得票数 0

2回答

带有后缀的pandas中的嵌套合并

python、pandas

我正在尝试合并pandas中的多个dataframe，并在生成的dataframe中保持列标签的整齐。下面是我的测试用例： import pandas as pd df1 = pd.DataFrame(data = [[1,1],[3,1],[5,1]], columns = ['key','val']) df2 = pd.DataFrame(data = [[1,2],[3,2],[7,2]], columns = ['key','val']) df3 = pd.DataFrame(data = [[1,3],[2,3],[4,

浏览 10提问于2017-03-11得票数 5

回答已采纳

1回答

如何像python pandas那样在spark dataframe中按列获取配对？

scala、apache-spark、apache-spark-sql

你好~我是spark的菜鸟。我想在dataframe中使用一个列来获得配对，每一列中的每一项(“all_mv_id”)都能让其他人像这样组成配对：之前： +---------+ |all_mv_id| +---------+ | 131| | 121| | 2223| | 123412| | 3982| +---------+ 之后： +------+------+ | id_1| id_2| +------+------+ | 131| 121| | 131| 2223| | 131|123412| | 131| 3982

浏览 1提问于2019-09-23得票数 1

1回答

IBM :将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame

python、pandas、data-science-experience、watson-studio

我对IBM中的ibmdbpy.frame.IdaDataFrame类型有问题。我有两张数据。第一个类型是ibmdbpy.frame.IdaDataFrame，第二个类型是pandas.core.frame.DataFrame。我想在Python中合并这两个数据格式。是否可以将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame？

浏览 2提问于2017-02-06得票数 2

回答已采纳

1回答

将字典保存到.XLSX中

python、excel、dictionary

使用Python + Pandas，是否有一种快速简便的方法将Dict (由键的文件名和值的几列数据组成)保存到.XLSX文件中？经过一些研究之后，我尝试使用以下代码将其转换为Pandas DataFrame (因为我知道您可以使用Pandas DataFrame编写一个.XLSX文件)： import pandas as pd import glob f_list = glob.glob("C:\\Users\\me\\dt\\xx\\*.xlsx") sheets = {f: pd.read_excel(f) for f in f_list} new_df = pd.D

浏览 4提问于2015-10-09得票数 3

2回答

如何合并这两个DataFrames

python、mysql、pandas

import pandas as pd left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], 'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}) right = pd.DataFrame({'key': ['K0', 'K1'],}) #left df

浏览 0提问于2017-03-01得票数 2

回答已采纳

1回答

在潘达斯，合并怎么这么快？即使我还没有按索引排序呢？

performance、pandas、merge

我正在合并熊猫中的两个数据集，并希望加快这个过程，所以我在用于合并的列中对这两个数据集进行了排序。(以前，这些列根本没有排序。)排序没有造成明显的速度差异，两者都花了大约8秒。如果我手动合并两堆纸，比如说，它们的页码，我会首先按页码对它们进行排序。否则，我将不得不做很多来回翻转之间的堆栈。我写了一个测试来比较这两个过程。它按随机顺序生成两个帧，每个帧有一百万行。然后，它将生成第一列上已排序的另外两个列。然后，它合并前两个，最后，合并后两个。数据生成过程太慢了，以至于我没有时间尝试更多的行--但是合并仍然是在零感知的时间内进行的，即使没有排序。 import pandas as pd im

浏览 0提问于2018-03-20得票数 6

1回答

熊猫数据栏中的多个条件

python、pandas

我试图从单个dataframe列中选择一个子集，我需要帮助在单个列上应用两个条件。例如，如何选择下表中的"Tom“和"Chris”？ import pandas as pd dic={"Name":["Chris","Tom","Steven"], "Age":[12,34,55]} dic={"Name":["Chris","Tom","Steven"], "Age":[12,34,55]} df=pd.DataFra

浏览 3提问于2017-09-12得票数 2

2回答

如何通过比较列从一个python pandas数据帧中筛选出另一个数据帧中的行？

python、filter、pandas、merge

我尝试从一个dataframe中排除行，这也出现在另一个dataframe中： import pandas df = pandas.DataFrame({'A': ['Chr1', 'Chr1', 'Chr1','Chr1', 'Chr1', 'Chr1','Chr2','Chr2'], 'B': [10,20,30,40,50,60,15,20]}) errors = pandas.DataFrame({'A':

浏览 2提问于2014-07-10得票数 5

2回答

合并两个具有不同列名的数据帧，并从结果中排除等效键。

python、pandas、merge

我有两个熊猫数据帧，它们共享相同的密钥，但每个对象的名称不同。 df = pd.DataFrame({"ID":[1,2,3], "Flag":[0,0,1]}) results = pd.DataFrame({"client_id":[1,2,3], "score":[600,700,800]}) df.columns Index(['ID', 'Flag']) results.columns Index(['client_id', 'score']) 我想将它们合

浏览 0提问于2019-08-28得票数 1

回答已采纳

1回答

如何在pandas中分配内存

pandas、dynamic-memory-allocation

我读了大约30000个文件。每个文件都是一个具有相同数量的列和行数的csv。因此，我确切地知道矩阵的大小。我所做的是： #allocate a pandas Dataframe data_n=pd.Dataframe() for i in range(0,30000): #read the file and storeit to a temporary Dataframe tmp_n=pd.DataFrame({'Ping':Counter_4eh*m256,'SN':SN_4eh*m256,'Frequency':CF_4

浏览 10提问于2019-01-29得票数 0

回答已采纳

1回答

当不存在公共记录时，Pandas merge将删除添加的列

python、sql、pandas、merge、jupyter-notebook

我留下了基于键的连接数据帧A到B。合并后，我发现在右边的dataframe上没有任何记录与右边的dataframe具有相同的键，但是右边的表中的列仍然被添加。如果没有公共记录，如何阻止Pandas添加新列？

浏览 0提问于2019-07-24得票数 0

6回答

从熊猫数据中提取值

python、pandas、extract、overlap

我正在使用Pandas，并希望从多个数据文件中提取值。例如，有三个数据格式如下所示。 df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1'], 'B': ['B0', 'B1']}) df2 = pd.DataFrame({'key': ['K1', 'K22'

浏览 9提问于2017-03-22得票数 1

回答已采纳

1回答

如何在一系列行的熊猫数据栏上矢量化？

python、pandas、numpy、dataframe

所以我有一个带有y行的x列的Pandas DataFrame。DataFrame中的数据是float64值。我试图计算两列之间的斜率相关性，但是对于单个列的范围(例如，列有25000行，我只想要介于5-10之间的值，这些值恰好在2000-4000行中)。为了做到这一点，我将以下面的psuedocode演示的方式进行迭代： for i in range(i, len(df['Column 1'])) if df.loc[i, 'Column 1'] <= 10.0 & df.loc[i, 'Column 1'] >= 5

浏览 2提问于2020-06-29得票数 0

回答已采纳

1回答

Python Pandas合并将不起作用

python、pandas、dataframe、merge

我有两个Python Pandas DataFrames： Inventory_Info (20行)： Group, Facility, Unit, Room, HardwareAddress 'Generic Hospital Group', 'Generic Hospital', 'Generic Hospital Ward', 'Generic Hospital Room', 5715 Data (47行)： Serial_Number, Last_Server_Check, Num_Check_Ins, HardwareA

浏览 2提问于2017-01-19得票数 0

1回答

用时间戳交错Pandas Dataframes

python、pandas

我有2个Pandas DataFrame，每个都包含2列。其中一列是时间戳列t，另一列包含传感器读数。现在我想要创建一个包含4个列的DataFrame，它被交织在时间戳列上。示例：第一个Dataframe： +----+----+ | t1 | s1 | +----+----+ | 0 | 1 | | 2 | 3 | | 3 | 3 | | 5 | 2 | +----+----+ 第二个DataFrame： +----+----+ | t2 | s2 | +----+----+ | 1 | 5 | | 2 | 3 | | 4 | 3 | +----+----+

浏览 0提问于2015-05-04得票数 0

回答已采纳

1回答

将dataframe一列一列地从另一个dataframe划分

python、pandas、dataframe、numpy

我有两个看起来类似的数据格式，我想将df1中的一列除以来自df2的一列。以下是一些样本数据： dict1 = {'category': {0: 0.0, 1: 1.0, 2: 0.0, 3: 0.0, 4: 1.0}, 'Id': {0: 24108, 1: 24307, 2: 24307, 3: 24411, 4: 24411}, 'count': {0: 3, 1: 2, 2: 33, 3: 98, 4: 33}} df1 = pd.DataFrame(dict1) dict2 = {'Id': {0: 24108,

浏览 1提问于2022-07-27得票数 1

回答已采纳

1回答

将函数应用于大熊猫

python、function、numpy、pandas

我想将函数GetPermittedFAR映射到我的dataframe(df)，这样我就可以测试在cols zonedist1 ==中的一个值，一个特定的值，我可以构建新的cols，比如df['FAR_Permitted']等等。我尝试过各种map()等方法，但没有让它起作用。我觉得这应该是件很简单的事吗？理想情况下，我会使用一个简单的列表理解/ lambda，因为我有许多这样的测试条件值，因此可以创建col数据。 import pandas as pd import numpy as np def GetPermittedFAR(): if df['zon

浏览 0提问于2016-03-08得票数 2

回答已采纳

1回答

从pandas dataframe列中删除前n-1个零

python、pandas、dataframe

df_in是样本数据帧，df_out是预期输出。如何删除前5个零，使我有一个零和所有其他元素。 import pandas as pd df_in = pd.DataFrame({'a':[0,0,0,0,0,0,1,2]}) df_out=pd.DataFrame({'a':[0,1,2]}) 提前谢谢。

浏览 5提问于2019-04-22得票数 0

回答已采纳

1回答

更快的熊猫应用modin.pandas

python、pandas、nlp、modin

尝试使用modin.pandas来使用此应用函数的所有核心 from nltk.sentiment.vader import SentimentIntensityAnalyzer sid = SentimentIntensityAnalyzer() # sentiment Score of essay data = data.merge(data.essay.apply(lambda s: pd.Series({'neg':sid.polarity_scores(s)['neg'],

浏览 0提问于2020-01-11得票数 2

回答已采纳

1回答

如何使用Python中的简单比较运算符来验证所有列是否合并在合并的DataFrame中？

python、pandas、dataframe

在这里，我创建两个数据文件，然后合并它们。现在，如何使用Python中的简单比较运算符来验证所有列是否合并在合并的DataFrame中？ import pandas as pd # elements of first dataset first_Set = {'Prod': ['Laptop', 'Mobile Phone', 'Desktop', 'LED'], 'Price_1': [25000, 8000, 20000,

浏览 4提问于2022-02-27得票数 0

2回答

熊猫是如何合并的？

pandas、merge

我不知道代码是如何工作的。同样的方法我得到了不同的结果。我试图运行木星笔记本中的代码，但不知道如何运行。我不明白“foo”、“bar”、“baz”、“foo”和“A”、“B”、“C”、“D”两种类型的键有什么区别有人能解释一下吗？非常感谢！ ```https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html df1 = pd.DataFrame({'lkey'：'foo'，'bar'，'baz'，'foo

浏览 0提问于2019-10-31得票数 1

回答已采纳

3回答

如何将Dask.DataFrame转换为pd.DataFrame？

python、pandas、dask

如何将生成的dask.DataFrame转换为pandas.DataFrame (假设我已经完成了繁重的任务，只想将sklearn应用到聚合结果中)？

浏览 27提问于2016-08-18得票数 43

回答已采纳

1回答

范畴序列上的Pandas DataFrames合并

python、join、pandas、merge

我试图了解熊猫是否支持在分类数据(即DataFrames“类别”)的列上合并dtype=。我大部分的数据都是用R做的，但是我想用Python/熊猫做更多的工作。在R中，合并因素(类似于范畴dtype)会导致类型强制，通常是对字符的强制。这允许一个数据帧将一个by变量(join列)指定为一个因子(分类)，而另一个数据帧的by变量是一个字符串。熊猫是否在合并/加入之前对分类数据进行类似的强制字符串？我是否应该期望合并在分类上是健壮的？我在哪里可以找到关于熊猫(自动)类型强制的文档？简单的例子： +++对非绝对/非标量向量进行相等测试是错误的： In [52]: import pandas as

浏览 3提问于2014-11-27得票数 1

回答已采纳

1回答

从dataframe更新postgresql中表空的最快方法

python、postgresql、pandas、dataframe、merge

我有一个pandas dataframe和匹配的postgresql表，其中两个表中的每个单元格要么为null，要么为时间戳。对于表中单元格值等于null的每个单元格，并且相应的dataframe单元格值是时间戳，我希望更新表格单元格值。做这件事最快的方法是什么？目前，我正在将整个表拉入一个dataframe中，比较python中的两个dataframe (单元格)，将这些值输入到第三个dataframe(称为DFC)，然后销毁旧表并从DFC构建一个新表。这似乎是低效的。示例： **Data Frame** **Postgres Table** A B

浏览 0提问于2018-04-12得票数 0

1回答

在不干扰Pandas查询的情况下，在海图中获取LaTeX符号

python、pandas、seaborn

我构造了这样一个DataFrame： import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df = pd.DataFrame({ "x": [0, 1, 0, 1], "y": [1, 2, 1.5, 3], "sigma": [1, 1, 2, 2], }) 它支持漂亮的query特性： # OK! pts = df.query("sigma < 2") print(pts) 和情节： sns.line

浏览 3提问于2019-09-11得票数 1

1回答

用整数映射Pandas Dataframe中的字符串值

python、pandas、dataframe

在Pandas DataFrame中，如何用整数在一列中映射字符串。我在DataFrame中有大约500个字符串，需要用以'1‘开头的整数替换它们。样品DataFrame. Request count 547 GET /online/WebResource.axd 37506 424 GET /online/2/2/22001.aspx 13315 699 POST /online/2/6/1/261001.aspx 13236 546

浏览 10提问于2014-03-12得票数 7

回答已采纳