数据帧追加和drop_duplicates问题_追加数据帧时出现问题_多变量循环和追加数据帧 - 腾讯云开发者社区

python、pandas

以这种方式合并到python数据帧的最快方法是什么？我有两个具有类似结构的数据框架(都有一个主键id和一些值列)。我想要做的是基于id合并这两个数据帧。根据熊猫的操作，有什么方法可以做到吗？我现在是如何实现它的，如下所示： import pandas as pd a = pd.DataFrame({'id': [1,2,3], 'letter': ['a', 'b', 'c']}) b = pd.DataFrame({'id': [1,3,4], 'letter': ['A

浏览 0提问于2018-09-19得票数 3

回答已采纳

1回答

Pandas合并同名不同行的DataFrame列

python、pandas、dataframe、merge、multiple-columns

我想合并两个数据帧。两者具有相同的列名，但行数不同。然后，较小数据帧中的值应替换其他数据帧中的值到目前为止，我尝试使用pd.merge pd.merge(df1, df2, how='left', on='NodeID) 但是我不知道如何告诉merge命令将来自正确数据帧的值用于列'X‘和'Y’。 df1 = pd.DataFrame(data={'NodeID': [1, 2, 3, 4, 5], 'X': [0, 0, 0, 0, 0], 'Y': [0, 0, 0, 0, 0]}) df2 =

浏览 31提问于2019-08-29得票数 0

2回答

排序和过滤Pandas Dataframe

python、pandas

我正在尝试过滤和排序Pandas数据帧来清理我的数据。我已经在StackOverflow上找过了，但似乎找不到能给我提供所需的排序和过滤的方法。我正在处理的数据看起来像这样： | Name 1 | Name 2 | Score | | ------ | ------ | ----- | | Amy | Jack | 2.456 | | Amy | Jack | 3.234 | | Amy | Jack | 5.124 | | ... | ... | ... | | Max | Jane | 8.569 | | Max | Jane | 4.654 | | Max | Jane |

浏览 8提问于2021-04-16得票数 1

3回答

Pandas，如果名称超过20个字符，则删除重复的名称行

python、python-3.x、pandas、dataframe

我有一个名为df的数据帧： Name State Down NY Down NY Down NY Next In NJ Next In NJ Next In NJ 我希望能够删除基于名称的重复行，仅当名称长度超过5个字符时。使用drop_duplicates可以做到这一点吗？

浏览 30提问于2021-09-09得票数 2

回答已采纳

2回答

当它们都共享相同的日期时，是否获取列中值最高的行？

python、pandas

我正在开发一个库存搜索系统，其中一个功能是返回日期范围内的所有行。问题是，有多个行共享相同的日期，但每个ID都是唯一的和不同的。ID越高，条目越晚。数据帧如下所示： id, date, item1, item2, .... 1, 8-11-2018, 10, 10, ... 2, 8-11-2018, 10, 10, ... 3, 8-11-2018, 10, 10, ... 4, 8-13-2018, 10, 10, ... 5, 8-13-2018, 10, 10, ... 6, 8-14-2018, 10, 10, ... 因此，如果我的日期范围是2018年8月11日到2018年8月

浏览 4提问于2018-08-12得票数 2

回答已采纳

1回答

比较两个数据帧并使用pandas或其他包导出不匹配的数据？

python-3.x、pandas、dataframe、random

我有两个数据帧，一个是另一个的子集(如下图所示)。我不确定pandas是否可以比较两个数据帧，过滤不在子集中的数据，并将其导出为数据帧。或者，有没有包可以完成这类任务？子集数据帧是从RandomUnderSampler生成的，但RandomUnderSampler没有导出未选中数据的功能。欢迎提出任何意见。 ?

浏览 14提问于2021-08-13得票数 0

回答已采纳

1回答

Python -查找两个数据帧之间的行差异

python、python-3.x、pandas、dataframe

我有两个数据帧，它们的列数相同，分别是d1和d2。注意: d1和d2可能有不同的行数。注意: d1和d2可能不会被索引到每个数据帧中的同一行。检查两个数据帧是否具有相同数据的最佳方法是什么？我当前的解决方案包括将两个数据帧添加到一起并删除任何匹配的行。 d_combined = d1.append(d2) d_discrepancy = d_combined.drop_duplicates(keep=False) print(d_discrepancy) 我是python和pandas库的新手。因为我将使用具有数百万行和8-10列的数据帧，有没有更快、更有效的方法来检查差异？还可以显示结

浏览 1提问于2017-08-15得票数 1

1回答

如何将Pandas系列中的值添加到无重复的Dataframe列

python、pandas、dataframe、series

我有一个名为‘df’的数据帧： Value Num 0 alpha 5 1 bravo 6 2 charlie 7 和一个名为‘Series _to_add’的序列： New Value 0 alpha 1 bravo 2 delta 我如何将序列的唯一值组合到现有的数据帧中，以获得如下所示： Value Num 0 alpha 5 1 bravo 6 2 charlie 7 3 delta nan

浏览 9提问于2020-06-30得票数 0

回答已采纳

1回答

尝试使用其他行中的值填充NaN时收到"InvalidIndexError:重新索引仅对唯一值索引对象有效“

python、pandas、dictionary、fillna

我只在熊猫中使用一个数据框。当我在此数据帧的一个子集(6行，其中一些包含NaN )上执行以下操作时，不会发生此错误。它做的正是我需要做的。在本例中，“Season”列中的所有NaN都正确填写。之前：代码： s = df.set_index('Description')['Season'].dropna() df['Season'] = df['Season'].fillna(df['Description'].map(s)) 之后：太棒了！这就是我希望发生的事情，一次一列。我稍后会担心其他专栏的问

浏览 10提问于2021-11-20得票数 0

1回答

Pandas (多索引)追加/合并/更新

pandas、merge、append、multi-index

嗨，我想将数据帧(顺便说一下，使用多索引)组合成一个更大的数据帧。有时需要追加数据(添加新的行或列)，有时需要更新现有数据。不知何故，我找不到一种方法来同时做到这两点。它要么是追加的(使用.append())，要么是某种更新(.merge()，.update())我试图搜索它并阅读文档，但我真的找不到它。这是一个测试代码 import pandas as pd import numpy as np zones = ['A', 'B', 'C'] # input data frames dates0 = pd.date_range('

浏览 0提问于2018-01-22得票数 0

1回答

如何正确地将要素合并/连接到另一个数据框

python、pandas、join、merge、concat

我必须使用数据帧，并且我希望将第一个数据帧的3个特征添加到第二个数据帧中，但前提是它们必须与某个键值(TicketNr)匹配。该密钥不是唯一的，并且可以在两个数据帧中多次出现。我尝试过不同版本的concat，merge和join，但我不能按我需要的方式进行。我不想向dataframe中添加任何行，只想添加这三列。我想这幅图概括了我的问题。谁能帮我找出正确的代码？ ?

浏览 14提问于2020-09-02得票数 0

1回答

如何将三个数据帧合并为一个，并删除重复的数据帧？

python、python-3.x、pandas、dataframe

我正在尝试将三个数据帧合并为一个，之后我也尝试删除重复的数据帧，但没有得到结果。你能教我怎么做吗？我给您的是df1、df2和df3中的记录总数。示例： df1 -- 18151 df2 -- 184 df3 -- 77425392 所有的数据帧也具有相同的报头。预期输出： df_final = pd.concat([df3, df2, df1], axis=1, ignore_index=True) df_final -- 77443727 我正在尝试删除重复也使用此代码，但不工作。 df_final = df_final[['SOURCE_ID', 'SOUR

浏览 13提问于2020-06-05得票数 0

1回答

基于id列中的值应用于数据帧的自定义函数

python、python-3.x、pandas、dataframe

我得到了一个包含多个列的数据帧，包括一个用户ID (id)和一个时间戳(startTime)。我想检查每个用户我的数据(df行)跨越了多少天。我目前正在通过将df拆分为'id'，然后在循环中为每个子集dfs计算以下内容： days = len(df.startTime.dt.date.unique()) 如何在不拆分数据帧的情况下更有效地执行此操作？我正在处理相当大的数据帧，我担心这将花费太多的时间。我已经研究了groupby函数，但我并没有深入研究。我试过这样的方法： result = df.groupby('id').agg({'days'

浏览 0提问于2018-08-15得票数 0

回答已采纳

2回答

如何添加两个数据帧

python、pandas、dataframe

您好，我正在尝试将一个数据帧附加到另一个数据帧 Name roll_no House John A_1 Red Mark A_2 Green Twain N_1 Yellow Mark A_2 Red

浏览 29提问于2020-08-16得票数 0

1回答

Pandas -比较两个Dataframe并找出差异

python、pandas

我有两个Dataframe和一些销售数据，如下所示： df1： prod_id,sale_date,new 101,2019-01-01,101_2019-01-01 101,2019-01-02,101_2019-01-02 101,2019-01-03,101_2019-01-03 101,2019-01-04,101_2019-01-04 df2： prod_id,sale_date 101,2019-01-01,101_2019-01-01 101,2019-01-04,101_2019-01-04 我正在尝试比较上面的两个数据帧，以查找与df1相比，df2中缺少的日期我已经尝试做了

浏览 0提问于2019-01-14得票数 1

1回答

python中具有N/A值的列的group by

python、pandas、pandas-groupby

我有一个数据帧： x y z city 0 -0.459476 NaN NaN hyd 0 NaN 20.439870 NaN hyd 0 NaN NaN 1.142743 hyd 0 N/A

浏览 0提问于2018-06-04得票数 3

1回答

根据df_A和df_A之间的差异，一致地将新行追加到数据帧df_B

python、pandas、dataframe、pandas-groupby、dask

我每天每10分钟就有一次转储的数据帧。示例 2019-08-28 06:00:13 SCHOOL_20190828... 2019-08-28 06:10:15 SCHOOL_20190828... 2019-08-28 06:20:14 SCHOOL_20190828... 2019-08-28 06:30:13 SCHOOL_20190828... 2019-08-28 06:40:15 SCHOOL_20190828... ... ... 2019-09-28 05:10:13 SCHOOL_20190928... 2019-09-28 05:20:13 SCHOOL_20190928.

浏览 0提问于2019-10-19得票数 0

8回答

如何从另一个数据帧中删除pandas数据帧

python、pandas、dataframe、subtraction

如何从另一个数据帧中移除一个熊猫数据帧，就像集合减法一样： a=[1,2,3,4,5] b=[1,5] a-b=[2,3,4] 现在我们有两个pandas数据帧，如何从df1中删除df2： In [5]: df1=pd.DataFrame([[1,2],[3,4],[5,6]],columns=['a','b']) In [6]: df1 Out[6]: a b 0 1 2 1 3 4 2 5 6 In [9]: df2=pd.DataFrame([[1,2],[5,6]],columns=['a','b'

浏览 0提问于2016-05-19得票数 54

1回答

如何将每日时间序列数据分组为以周为单位的较小数据帧

python、pandas

我有一个数据帧，看起来像这样： open high low close weekday time 2011-11-29 2.55 2.98 2.54 2.75 1 2011-11-30 2.75 3.09 2.73 2.97 2 2011-12-01 2.97 3.14 2.93 3.06 3 2011-12-02 3.06 3.14 3.03 3.12 4 2011-12-03 3.12 3.1

浏览 0提问于2018-10-17得票数 0

1回答

Python Pandas:将一列合并到另一个数据框不会返回相同数量的行

python、python-3.x、pandas

我有两个数据帧:第一个数据帧(假设df1)有389行5列，第二个数据帧(假设df2)有10025行10列。我想将其中一列(假设列名为'description')合并到第一个数据框中。我使用pd.merge()命令来合并列，如下所示： pd.merge(df1,df2[['ID','description']],on='ID',how='left') 但是，上面的命令返回22338行。当我在stackoverflow上搜索时，我发现有一个线程请求将drop_duplicates与第二个数据帧一起使用。因此，我更改了

浏览 12提问于2020-06-05得票数 0

回答已采纳

1回答

连接两个相同的数据帧并只保留新条目

python、pandas

我有两个数据帧，除了额外的一到两行之外，它们是完全相同的。如何将它们连接到一个数据帧中，而只将新条目添加到原始数据帧中？我尝试过使用pandas来做这件事，但我只能将它们连接在一起，我想不出一种只保留新条目并将它们添加到原始条目上的方法。会很感谢你的帮助。

浏览 5提问于2020-08-28得票数 0

1回答

按日期合并多个数据框(删除重复项)

python、pandas、dataframe、merge

我正在尝试从几个数据帧中获得一个组合数据帧。基本上每个单独的数据帧都是一个月的数据。所以每个都有一个日期和一些其他值的列。然而，每个数据帧的长度并不总是相同的，其中一些日期在其中一些数据帧中重复。所以我想要做的是合并我的所有数据帧(从每个月的12个不同的数据帧中产生一年的数据)，所以我最终得到一个没有重复日期的数据帧。应该提到的是，每个数据帧中的列都是相同的。只是不同的价值观。这可以用一种简单的方式来完成吗，或者...？

浏览 13提问于2020-11-25得票数 0

回答已采纳

1回答

如何使用python根据列特定值从数据中提取行

python、pandas、group-by、pandas-groupby

目前，我有一个庞大的数据集和一个非常小的例子如下所示。我想要做的是基于shift列提取行，并为的最后3行从score列中找到最大值，然后将整行提取到一个新的数据帧中。例如:每一天有两班(白天和晚上)，每班我都想为每班最后3行找到最高分数(例如:6月26日，shift>日，我想从last 3 score of the day shift，26 jun )中找到最高分数。我不想取每一个移位最大的分数并提取那一行)，并提取整行并将其设置为新的dataframe。我想每天两班都这么做。预期的dataframe输出如下：我试图使用groupby来解决这个问题。但是，我不

浏览 3提问于2020-10-21得票数 0

5回答

从数据帧中删除反向重复项

python、pandas、dataframe

我有一个包含两列的数据框，A和B。在这种情况下，A和B的顺序并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，从数据帧中删除这些重复项的有效方法是什么？ import pandas as pd # Initial data frame. data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50], 'B': [50, 22, 35, 5, 10, 11, 21, 0]}) data A B 0 0 50 1 10

浏览 63提问于2016-11-08得票数 14

回答已采纳

2回答

在pandas中，是否根据一列中与另一列中的引用日期最近的日期来选择行？

python、pandas、date、datetime

我有一个包含开始日期和测量日期的pandas数据帧。 Start Date change Individual measured_date 0 2004-11-23 3341 Bob 2007-07-26 1 2006-06-29 3398 Bob 2007-07-26 2 1997-07-21 2277 Greg 2005-04-21 3 2000-04-11 3380 Nancy 2005-10-14 4 2000-

浏览 0提问于2018-06-29得票数 1

2回答

如何对pandas数据帧进行维度划分

python、pandas

我正在寻找一种更优雅的方式来做这件事，而不是手动执行for循环和解包…… 假设我有一个数据帧，如下所示 | id | value | date | name | | -- | ----- | ---------- | ---- | | 1 | 5 | 2021-04-05 | foo | | 1 | 6 | 2021-04-06 | foo | | 5 | 7 | 2021-04-05 | bar | | 5 | 9 | 2021-04-06 | bar | 如果我想对此进行维度分析，我可以将其分成两个不同的表。一个可能包含关于这个

浏览 14提问于2021-04-10得票数 0

回答已采纳

1回答

获取多列的匹配行--熊猫数据

python、pandas

考虑一下我的第一个数据帧df1 col1 col2 col3 0 hello q 1 1 world q 2 2 welcome r 3 3 hello t 4 和第二数据帧df2 col1 col2 col3 0 hello q 2 需要输出，如 col1 col2 col3 0 hello q 2 1 world q 2 2 welcome r 3 3 hello t 4 '

浏览 1提问于2018-04-05得票数 0

1回答

df.drop_duplicates()对数据帧不起作用

python、python-3.x

我不确定问题出在哪里，但是在我执行了一条SQL join语句之后，我用我所有的数据创建了一个数据帧。我最终得到的是一个带有重复项的数据帧。然后，我应用了df.drop_duplicates()，但我的数据帧根本不接受它，我得到了相同的结果。下面是我正在使用的数据类型的列表。这可能与此有关吗？ session id int64 screens int64 format object printer beacon object printed pages float64 instant ink

浏览 0提问于2018-08-10得票数 0

回答已采纳

1回答

循环遍历pandas数据帧并将列表的结果分配给另一个数据帧

pandas、dataframe

我有一个pandas数据帧，格式如下： values id 121 [Akjhks,Bsdfjhi,Idsfaf,Akjhks] 345 [Lkhiuy,Eqiyeri,Jewruq] 对于每个id中的唯一值，我需要获取id并将其附加到结果pandas dataframe，格式如下。 value_list Constant_# Akjhks AK Bsdfjhi AK Idsfaf AK Lkhiuy AK Eqiyeri AK Jewruq AK 我可以在valu

浏览 27提问于2021-10-12得票数 0

2回答

熊猫数据帧增量(减法)

python、pandas

我有两个非索引数据帧，如下所示: df1 John Mullen 12/08/1993 Lisa Bush 06/12/1990 Maria Murphy 30/03/1989 Seth Black 21/06/1991 和df2 John Mullen 12/08/1993 Lisa Bush 06/12/1990 Seth Black 21/06/1991 Joe Maher 28/09/1990 Debby White 03/01/1992 我希望有一个数据增量，其中只有df2中的记录，而不是df1中的记录:即

浏览 1提问于2015-11-22得票数 2

回答已采纳

1回答

pandas中的Groupby返回的行太多

python、r、pandas、tidyverse

我正在尝试使用groupby函数过滤pandas中的数据帧。其目的是为每个id获取每个变量的最早(按日期)实例。最终，我能够使用tidyr解决R中的问题，如下所示： df_mins <- df %>% group_by(id, variable) %>% slice(which.min(as.Date(date))) 我还使用pandas实现了一些类似的功能，如下所示： df.groupby(['id', 'variable'])['date'].transform(min) == df['dat

浏览 19提问于2020-06-12得票数 1

2回答

pandas数据帧的子集

python、pandas、dataframe

我有一个数据帧df，比如 Sample Percentage Attribute1 Attribute2 1_A 12.3 xxxx yyyy 1_A 5.0 aaaa bbbb 2_B 10 ccccc ddddd 对于每个样本，我希望选择百分比中具有最大值的行，并创建一个数据帧df1。如果一个样本(例如1_A)存在多个百分比，我想创建一个数据帧df2，其中包含除为df1选择的行以外的所有行。在上面的示例中: df1将具有样例行1_A和2_B，

浏览 33提问于2018-08-15得票数 0

1回答

从匹配的运动员中删除行

python、pandas、dataframe

我有一个ufc数据集，我正在练习，我想创建一个包含所有战斗机及其属性的数据帧。它目前是按照最近一次回击的顺序开始促销的。我想要删除每个战斗机除了最近的以外的所有事件。例如： index, fighter, height, age, wins, losses 0, mcgregor, 165, 31, 14,5 1, porier, 165, 30, 21, 6 2, Ferguson, 180, 38, 28, 4 3, mcgregor, 165, 30, 14, 4 <- remove this row. 谢谢你的帮助。

浏览 0提问于2021-10-09得票数 1

2回答

pandas根据分组合并行

python、pandas

假设我有一个数据帧，如下所示： col1 col2 col3 a 1 a a 98 xx a 99 xy b 1 a b 2 b b 3 c b 8 xx b 9 xy 我需要合并col3 = xx和xy中的行，这些行是按col1分组的，因此得到的数据帧如下所示： col1 col2 col3 a 1 a a 98 xz b 1

浏览 5提问于2020-02-28得票数 0

2回答

如何将数据写入csv，同时更新和删除csv中的副本？

python、pandas、csv、dataframe

我可以成功地删除重复的数据，并在现有的数据帧中更新行。当我编写这个数据文件时--一个已经有数据的csv --如何在dataframe中对csv执行相同的命令，以删除重复的数据并更新行。 df: ID email date 0 a@a.com 2018-01-22 1 b@b.com 2018-01-20 csv: ID email date 0 d@d.com 2018-01-22 我需要csv看起来像这样： csv: ID email date 0 a

浏览 1提问于2018-02-21得票数 0

回答已采纳

1回答

基于两列合并pandas数据框，两列具有相同的值对，但在两个数据框中以不同的顺序显示

python、pandas、dataframe、merge、data-cleaning

我有两个熊猫数据帧。它们具有相同的赢家和输家名称对，但它们在两个数据帧中的顺序不同。 DF1 Winner Loser RankW RankL 0 Fleishman Z. Calleri A. 170.0 26.0 1 Roddick A. Tsonga J.W. 7.0 212.0 2 Gasquet R. Volandri F. 17.0 45.0 DF2 Winner Loser WHand LHand 0 Gasquet R.

浏览 26提问于2020-03-18得票数 2

回答已采纳

1回答

使用for循环条件从多个PySpark数据帧中获取唯一列值

python、pandas、dataframe、pyspark、pyspark-sql

我有两个PySpark数据帧(DF1和DF2)，并希望遍历这两个数据帧中的一些列(colA，来自DF1的colB；来自DF2的colZ )，并获得不同的值。 DF1： colA colB colC 1 1 A 3 1 Y DF2： colX colY colZ 1 1 A21 3 4 Y33 输出： column value colA 1 colA 3 colB 1 colZ A21 colZ Y33 此方法有效，但尝试创建for循环并收集结果distinct值不起

浏览 0提问于2018-10-28得票数 0

1回答

在python中返回一对唯一的列，而不考虑列的顺序。

python、pandas

我有一个数据帧，如下所示： df = pd.DataFrame({'A':['yes','yes','yes','yes','no','no','yes','yes','yes','no'], 'B':['yes','no','no','no','yes','yes',&#

浏览 2提问于2019-11-18得票数 0

3回答

在groupby数据帧中应用唯一两次

python-2.7、pandas

我有一个数据帧df，看起来像这样： key_1, key_2, country 12, a, US 12, a, US 12, b, US 12, c, NZ 23, d, PE 23, e, PE 23, e, PE 31, f, RO 31, f, RO 42, g, VI 我对满足以下条件的2个数据帧感兴趣(请为每个数据帧提供一个过程)： 1-给定一个key_1，则存在多个唯一的key_2 AND一个唯一的国家。例如。 23, d, PE 23, e, PE 第二-给定一个key_1，存在多个唯一的key_2 AND多个唯一的国家。例如。 12, a, US 12, b, US 12,

浏览 2提问于2015-10-14得票数 3

1回答

如何检查组级的复制？

python、pandas、dataframe

如何检查复制的组并删除它们？这是我的数据框架： Group Value_1 Value_2 A 17 0.1 A 20 0.8 A 22 0.9 A 24 0.13 B 17 0.1 B 20 0.8 B 22 0.9 B 24 0.13 C

浏览 2提问于2018-10-30得票数 2

回答已采纳

1回答

将行数据移动到列(不是转置)

python、pandas

假设我有多个行的user - child关系 user_id child_id birth_date gender 0 1 1.0 2018-01-01 m 1 1 2.0 2018-01-03 f 2 1 3.0 2018-01-04 m 3 2 NaN None None 现在，我想挑选最小的和最大的孩子，并将它们放在列中 user_id kid_1_birth_date kid_1_gender kid_2_bir

浏览 3提问于2019-03-31得票数 1

回答已采纳

2回答

比较数据帧中的重复行以确定通过/失败

python、pandas、dataframe

我有一个很大的数据框架，其中可能包含许多类似的数据点。删除重复项很容易，但我也想用不同的结果进行相同的测试，并将它们合并为一个通过/失败结果。示例数据 SW Group Name Result 0.1 Group1 Test1_30Hz Pass 0.1 Group1 Test1_30Hz Fail 0.1 Group1 Test2_60Hz Pass 0.1 Group1 Test3_120Hz

浏览 7提问于2021-07-07得票数 3

回答已采纳

2回答

Pandas:从一列中为另一列中的每个唯一值获取最大值

python、pandas

如何在一列中为另一列中的每个唯一值获取最高值，并返回相同的数据帧结构。这是一个熊猫数据帧的例子？ reg.nr counter value ID2 categ date 1 37367 421 231385 93 A 20.01.2004 2 37368 428 235156 93 B 21.01.2004 3 37369 408 234251 93 C

浏览 5提问于2017-02-05得票数 7

回答已采纳

2回答

如何在pandas中连接两个相等的数据帧，通过id区分重复？

python、pandas、dataframe、concat

在python3和pandas中，我有两个结构相同的数据帧 df_posts_final_1.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 32669 entries, 0 to 32668 Data columns (total 12 columns): post_id 32479 non-null object text 31632 non-null object post_

浏览 13提问于2020-03-24得票数 0

回答已采纳

1回答

如何根据不同的过滤器过滤重复

python、python-3.x、pandas、dataframe

我有一个包含Letters、Numbers和Digits列的数据帧 df = pd.DataFrame({'Letters':['AB', 'XY', 'ZW','ZW','XY' ], 'Numbers': [1234, 4, 333, 333, 4], 'Digits': [32234, 32534, 4234, 4235, NaN]}) print(df) Letters Numbers

浏览 3提问于2019-04-16得票数 1

回答已采纳

3回答

Python Pandas:仅当列值唯一时才将Dataframe追加到另一个Dataframe

python、pandas、append、conditional

我有两个要附加在一起的数据帧。以下是示例。 df_1： Code Title 103 general checks 107 limits 421 horseshoe 319 scheduled 501 zonal df_2 Code Title 103 hello 108 lucky eight 421 little toe 319 scheduled cat 503 new item 仅当df_2中的代码号在df_1中不存在时，我才想将df_2附加到df_1。下面是我想要的数据帧： C

浏览 0提问于2018-08-22得票数 3

1回答

组内部分字符串匹配

python、merge、matching、fuzzy、fuzzywuzzy

我有一个包含组(区域)的数据，然后还提供了一个名称。我正在尝试合并两个数据帧。一个帧要小得多，它是“映射”数据帧。它为一个区域内的每个名称都有一行。另一个框架要大得多，它是“实例”数据框架。它有许多行，其中包含随区域变化的名称。我希望将来自映射帧的信息合并到实例帧中，以便每个实例都具有映射帧提供的对应信息。我研究了Fuzzy包，但没有找到在组(Area列)中实现它的方法，也没有找到如何有效地将它与包含多个字符串的单元格一起使用，并尝试基于此进行匹配。下面是一个类似数据的示例。合并需要从实例数据框中提取相关信息，以便将其映射到映射数据框。映射数据帧 Area Name A Ap

浏览 26提问于2019-04-25得票数 1

2回答

保留特定列(在timedelta64中)中的元素最接近零的行

python、pandas

我有一个有很多列的数据帧，在这个操作中有两列焦点。一列包含重复的名称，另一列包含timedelta64。我想要获取timedelta64列元素最接近于零的行。下面的示例将更好地说明该操作。任何帮助都将不胜感激！！提前感谢！！当前df Name Number Age Days Tom 23 64 83 days Tom 5 623 19 days Tom 93 14 -5 days Tom 28 12 75 days Bess

浏览 9提问于2020-07-17得票数 1

回答已采纳

1回答

从pandas dataframe列中删除前n-1个零

python、pandas、dataframe

df_in是样本数据帧，df_out是预期输出。如何删除前5个零，使我有一个零和所有其他元素。 import pandas as pd df_in = pd.DataFrame({'a':[0,0,0,0,0,0,1,2]}) df_out=pd.DataFrame({'a':[0,1,2]}) 提前谢谢。

浏览 5提问于2019-04-22得票数 0

回答已采纳

2回答

数据帧未丢弃重复项

python、pandas、dataframe

我有两个数据帧： df： id Name Number Stat 1 co 4 2 ma 98 3 sa 0 df1： id Name Number Stat 1 co 4 2 ma 98 5% 我希望将两个数据帧合并到1 (dfnew)中，并希望如下所示： id Name Number Stat 1 co 4 2 m

浏览 12提问于2020-09-10得票数 0

回答已采纳