在Spark中有熊猫combine_first的等价物？

在Spark中，熊猫（Pandas）中的combine_first方法的等价物是coalesce函数。coalesce函数用于合并多个列或多个数据集，并返回一个新的数据集，其中包含合并后的结果。

coalesce函数的优势是可以在不引入额外的依赖或库的情况下，实现类似于熊猫中combine_first方法的功能。它可以用于处理数据集中的缺失值或合并多个数据集的情况。

应用场景：

数据集合并：当需要将多个数据集合并为一个数据集时，可以使用coalesce函数。
缺失值处理：当需要处理数据集中的缺失值时，可以使用coalesce函数将缺失值填充或合并。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云提供了多个与大数据处理相关的产品和服务，其中包括：

腾讯云数据仓库（TencentDB for TDSQL）：https://cloud.tencent.com/product/tdsql
腾讯云数据湖（TencentDB for Data Lake）：https://cloud.tencent.com/product/datalake
腾讯云弹性MapReduce（EMR）：https://cloud.tencent.com/product/emr
腾讯云数据传输服务（Data Transmission Service）：https://cloud.tencent.com/product/dts
腾讯云数据集成服务（Data Integration）：https://cloud.tencent.com/product/di

请注意，以上推荐的产品和服务仅供参考，具体选择应根据实际需求和情况进行。

熊猫中的isnull(col1，col2)等价物

、、

如何将等效语句写入下面的SQL查询？ SELECT ISNULL(df2.id, df1.id) as new_id FROM dataframe1 df1 LEFT JOIN dataframe2 df2 ON df1.id = df2.id

浏览 2提问于2016-06-02得票数 2

回答已采纳

1回答

在Spark中有熊猫combine_first的等价物？

、

当满足某些条件时，我会尝试用另一个DataFrame更新。 pandas DataFrame中的combine_first函数运行良好。在Spark中有没有一个等效的方法可以有效地更新DataFrame？

浏览 10提问于2018-07-24得票数 0

回答已采纳

1回答

我有一个包含数百列的“存档”数据，每个列代表一个时间序列(S1，S2.) S1 S2 Date1 5 5 Date2 8 10 我需要更新归档文件，从几个dfs导入新数据(每个新日期我有多个"new_data“df )。因此，例如： new_data1： S3 Date3 8 new_data2： S2 S4 Date3 9 5 new_data3： S3 Date4 5 new_data4： S4 Date4 9 因此，每个new_data df共享归档df的

浏览 5提问于2022-01-28得票数 1

回答已采纳

1回答

Zeppelin:如何在PYTHONPATH中添加python文件

、

我在纱线上用Spark运行齐柏林飞艇。选项--py-files(SPARK_SUBMIT_OPTIONS)在齐柏林飞艇中不起作用。在zeppelin中有没有替代--py-files的方法。注意:我可以使用以下选项上传文件：--files，但它不会在PYTHONPATH中添加这些文件。因此，我需要一个替代zeppelin中的--py-files的方法。

浏览 0提问于2017-03-29得票数 1

1回答

Python熊猫:从累积中创建一个离散的系列

、

我有一个数据框架，其中有几组数值是累加的数列。请考虑以下几点： df = pd.DataFrame({'Cat': ['A', 'A','A','A', 'B','B','B','B'], 'Indicator': [1,2,3,4,1,2,3,4], 'Cumulative1': [1,3,6,7,2,4,6,9], 'Cumulative2': [1,3,4,6,1,5,7,12]}) In [74

浏览 1提问于2018-10-17得票数 0

回答已采纳

1回答

熊猫小组合并

、、

当前最佳Pandas用于合并面板数据的方法是什么，例如： p = pd.Panel(np.random.randn(2,5,4), items=['IBM', 'AA'], major_axis=pd.date_range('1/1/2000', periods=5), minor_axis=['Open', 'High', 'Low', 'Close']) dp = pd.Panel(np.random.randn(2,1,1), items=[&#

浏览 0提问于2016-06-30得票数 3

回答已采纳

1回答

熊猫:把小DataFrame合并成大的，用小的覆盖

、、

我正试图做一些我认为应该是一条龙的事情，但我很难把它做好。我有一个大的dataframe，我们称之为lg，而一个小的dataframe，我们称之为sm。每个dataframe都有一个start和一个end列，以及多个其他列，所有这些列在两个数据文件之间都是相同的(为了简单起见，我们将调用所有这些列type)。有时，sm将拥有与lg相同的start和end，如果是这样的话，我希望sm的type覆盖lg的type。下面是设置： lg = pd.DataFrame({'start':[1,2,3,4], 'end':[5,6,7,8], 'type'

浏览 9提问于2017-03-04得票数 3

回答已采纳

1回答

熊猫:从其他数据中填充丢失的数据

、

我有两种不同尺寸的数据： df1 = pd.DataFrame({'A':[1,2,None,4,None,6,7,8,None,10], 'B':[11,12,13,14,15,16,17,18,19,20]}) df1 A B 0 1.0 11 1 2.0 12 2 NaN 13 3 4.0 14 4 NaN 15 5 6.0 16 6 7.0 17 7 8.0 18 8 NaN 19 9 10.0 20 df2 = pd.DataFrame({'A':[2,3,4

浏览 2提问于2018-07-07得票数 0

回答已采纳

3回答

使用熊猫合并栏

、、

我试图用熊猫合并多个选择题栏，这样我就可以操纵它们了。我问题的一个例子是： C1 C2 C3 0 A A 1 B B 2 C C 3 D D 数据目前以C1和C2的形式表示，但我需要将其合并为1列，如C3所示。

浏览 3提问于2022-05-08得票数 1

回答已采纳

2回答

熊猫4列表比较

、、

我在python方面很新，有以下问题。我有一个csv文件，其中有4列。我通过读取csv文件将数据写入数据。我想比较日期1和日期2，并从date2填充date1中缺少的值。此外，还包括从Values2到Values1的值。我有一个csv文件，如下所示： Date 1;Values 1;Date 2;Values 2 07.08.2017;-0,52;07.08.2017;-0,52 04.08.2017;-1,30;04.08.2017;-1,3 03.08.2017;-0,40;03.08.2017;-0,3995 02.08.2017;-0,43;02.08.2017;-0,4285 01

浏览 1提问于2017-08-11得票数 1

回答已采纳

1回答

根据其他2列熊猫的条件创建新列

、、、

我有一个连接在一起的dataframe，它有两个相同的列和两个不同的名称。它看起来是这样的： Fuel Category Gen MW Gen MWh Time Stamp Time Zone Dual Fuel 2809.0 nan 12/09/2015 00:05 EST Hydro 2224.0 nan 12/09/2015 00:05 EST Natural Gas nan 150.00 12/09/2016 00:05 EST Nuclear

浏览 2提问于2019-02-05得票数 0

2回答

将列上的系列值映射为代替nan值的熊猫

、、、

我有一个DataFrame，它有与该工作相关的作业编号和客户名称。在某些情况下，作业编号没有客户名称，因此为null。我有一个单独的系列，它使用这些作业编号作为索引和缺少的客户名称来替换空值，基于作业编号。我不完全确定如何将其映射到原始的DataFrame列上。这是原始的DataFrame (df)： Job Number Customer 0 02123 Paul F 1 46456 nan 2 56823 Kevin T 3 62948 nan 取代nan值的系列： Job Number 46456 K

浏览 3提问于2020-02-17得票数 1

回答已采纳

2回答

熊猫数据融合问题

、

我需要合并以下两个数据文件： df1: A B C D F 0 1 a zz 10 11 1 1 a zz 15 11 2 2 b yy 20 12 3 3 c xx 30 13 4 4 d ww 40 14 5 5 e vv 50 15 6 6 f uu 60 16 7 7 g NaN 70 17 8 8 h ss 80 18 9 9 Na

浏览 1提问于2019-08-19得票数 1

回答已采纳

1回答

熊猫有条件地从另一个数据更新

、

我有两个dataframe，我需要在第一个dataframe中有条件地更新特定列。 df1 = pd.DataFrame([[1,'Foo',1,1,1,np.nan,np.nan,np.nan],[2,'Foo',2,2,2,np.nan,np.nan,np.nan],[3,'Bar',3,3,3,np.nan,np.nan,np.nan]], columns = ['Key','identifier','A','B','C','D','E&

浏览 4提问于2017-11-02得票数 0

回答已采纳

1回答

有条件大熊猫两种数据的复合地图操作

、

我有一张熊猫df的桌子。 id prod1 prod2 count 1 10 30 100 2 10 20 200 3 20 10 200 4 30 10 100 5 30 40 300 另外，我在df2中有另一张桌子 product price master_product 1000 1 10 5000 2 10 200

浏览 3提问于2016-12-14得票数 2

回答已采纳

2回答

熊猫合并而不覆盖

、、

我有两张数据。我试图将DF1中的数据合并到DF2中，而不改变DF2中以前存在的任何数据。 DF1 = Value Color 0 Red 1 White 2 Blue DF2 = Value Color 0 1 2 Brown 3 Black 4 White 5 DF3 = pd.merge(DF2, DF1, on="Value", how='left', suffixes=('_x&

浏览 2提问于2019-10-14得票数 1

回答已采纳

1回答

熊猫:合并后如何组合后缀栏？

、

背景有一个CSV包含以下格式的数据：时间戳、第1次、第2次等 Python脚本定期查询API并添加到这个CSV中。为此，CSV被加载到一个dataframe中，要添加的数据被加载到一个dataframe中。时间戳列是每个数据的索引。有时在更新CSV时，由于一些我不知道的原因，CSV中已经有一行包含与新数据中的一个行相同的时间戳。当这些行存在时，它们共享时间戳( CSV中的一个和新数据中的一个)，它们在其他列中的值总是不同的。任务如何使用Pandas将这些共享时间戳的行组合成一行？当使用merge函数合并两个数据文件时，重叠的列分

浏览 1提问于2018-01-09得票数 0

回答已采纳

2回答

熊猫根据有数据的哪一列合并两列

、

我试图根据值将两列合并为第三列。原始数据 |Time| GearUp | GearDn| |----|---------|-------| | 1 | NaN | NaN | |2 | NaN | DOWN | |3 | NaN | NaN | |4 | NaN | NaN | |5 | UP | NaN | |6 | NaN | NaN | |7 | NaN | NaN | 所需结果： Time Gear 1 NaN 2 DOWN 3 DOW

浏览 0提问于2022-08-11得票数 0

1回答

根据另一列在熊猫列中赋值

、、、

我有两个数据文件，如下所示：一个 Timestamp C1 C2 C3 1 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 0 6 0 0 0 7 0 0 0 和B Timestamp C1 C2 C3 2 0 0 0 3 v1 v2 v3 4 v4 v5 v6 7 0 0 0 我希望合并这两个数据集，并根据时间戳列将A中的零替换为B中的值，并有一个新的A数据，如下所示： Timestamp C1 C2 C3 1 0 0 0 2 0 0 0 3 v1 v2 v3 4 v4 v5 v6 5 0 0 0 6 0 0 0 7 0 0 0

浏览 0提问于2018-03-30得票数 1

回答已采纳

1回答

熊猫:添加多索引系列/包含列表的数据

、、、、

如何添加/合并两个包含作为元素的列表的多索引Series/DataFrame(在我的例子中是端口序列或时间戳序列)。特别是如何处理仅出现在一个系列/DataFrame中的索引？不幸的是，.add()-method只允许fill_value参数的浮动，而不允许空列表。我的数据： print series1 print series2 IP sessionID 195.12*.21*.11* 49 [5900] 50 [5900, 5900, 5900, 5900, ...

浏览 3提问于2015-03-12得票数 0

回答已采纳

3回答

熊猫将两个数据系列合并为一个系列

、

我需要将数据系列rateScore和rate合并为一个。这是我当前的DataFrame rateScore rate 10 NaN 4.5 11 2.5 NaN 12 4.5 NaN 13 NaN 5.0 .. 235 NaN 4.7 236 3.8 NaN 这需要是这样的： rateScore 10 4.5 11 2.5 12 4.5 13 5.0 .. 235 4.7 236 3.8

浏览 21提问于2020-03-11得票数 1

回答已采纳

1回答

获取多列的匹配行--熊猫数据

、

考虑一下我的第一个数据帧df1 col1 col2 col3 0 hello q 1 1 world q 2 2 welcome r 3 3 hello t 4 和第二数据帧df2 col1 col2 col3 0 hello q 2 需要输出，如 col1 col2 col3 0 hello q 2 1 world q 2 2 welcome r 3 3 hello t 4 '

浏览 1提问于2018-04-05得票数 0

2回答

更好的合并方法(更新\插入)熊猫数据

、、、

我有两个熊猫数据帧- df_current_data，df_new_data。我的目标是应用合并(不是熊猫合并函数，而是像‘update\insert’那样的合并)。匹配的检查是按键列进行的。我的结果需要由3个可选的行类型构建。在df_current_data中存在但在df_new_data中不存在的行-将对结果插入“如实”。在df_new_data中存在但在df_current_data中不存在的行-将对结果插入“如实”。行，它存在于df_new_data中，存在于df_current_data中--结果需要从df_new_data获取行。这是一个典型的合并-

浏览 0提问于2017-08-21得票数 6

3回答

除以两只熊猫DataFrames并保留非数字列

、

我有两只熊猫DataFrames，它们包含数值和非数值.我想一个一个除以另一个，但保留非数字列。这是一个MWE： a = pd.DataFrame( [ ['group1', 1., 2.], ['group1', 3., 4.], ['group1', 5., 6.] ], columns=['Group', 'A', 'B'] ) b = pd.DataFrame( [ ['group1&

浏览 0提问于2018-03-21得票数 5

回答已采纳

1回答

如何在包含列表和大小不同的两只熊猫数据中交换行？

、、、、

我有两种潘达数据，df1和df2。每个dataframe都有一个名为“Path”的列。每一行都有一个列表。他们是这样的： df1 Path [OAK, ORD, FLL, PBG] [OAK, SEA, FLL, PBG] [OAK, AUS, FLL, PBG] [OAK, LAS, FLL, PBG] [OAK, LAX, FLL, PBG] [OAK, DAL, FLL, PBG] [OAK, MDW, FLL, PBG] [OAK, BWI, FLL, PBG] df1构造函数是： {'Path': {0: ['OAK', 'ORD',

浏览 2提问于2020-01-03得票数 1

回答已采纳

1回答

熊猫指数匹配多个数据和多个标准

、、

我试图让python读取一个excel文件，然后从以excel文件中的行命名的.csv文件和.csv文件中的索引数据创建数据，并将它们粘贴到excel文件中。 excel文件已被放入一个dataframe中，其布局如下： Name Location Date Check_2 ... Volume VWAP $Volume Trades 0 Orange New York 20200501 X ... NaN NaN NaN NaN 1 Apple Minsk 20200504 X ..

浏览 1提问于2020-05-26得票数 1

回答已采纳

1回答

熊猫:有条件地将数据附加到列中？

、、

我有两个需要合并的数据帧。在n_df中有几个列，但相关的列是： Statement Codes Statement 1 CD.Ex-1 Statement 2 CD.Ex-2 Statement 3 CD.Ex-3 Statement 4 CD.Ex-4 Statement 5 CD.Ex-5 { "Statement": ["Statement 1", "Statement 2", "Statement 3", "Statement 4",

浏览 6提问于2021-09-14得票数 1

回答已采纳

1回答

熊猫，用MultiIndex DataFrame的价值观代替NaNs

、、、

问题我有一个带有一些NaNs的数据文件，我正试图根据另一个数据some的值来智能地填充它。我还没有找到一种有效的方法来做这件事，但我怀疑对熊猫有一种方法。极小示例 index1 = [1, 1, 1, 2, 2, 2] index2 = ['a', 'b', 'a', 'b', 'a', 'b'] # dataframe to fillna df = pd.DataFrame( np.asarray([[np.nan, 90, 90, 100, 100, np.nan], index1

浏览 0提问于2019-02-07得票数 0

回答已采纳

3回答

将字典列表映射到熊猫数据，在多个列上进行匹配

、、

这是我的数据 a b c d 1 X yellow None 1 Y yellow None 1 Z blue None 这是我收到的数据： data = [ {'a': 1, 'b': "X", 'c': 'red', 'd': True}, {'a': 1, 'b': "Z", 'c': 'purple', 'd': False}, ] 我想

浏览 3提问于2022-08-30得票数 1

回答已采纳

1回答

熊猫两个指数相同的数据融合

、

我有两个数据帧。我需要加入它们，以便将在两个数据帧中具有相同名称的索引连接为一个，并将它们的值相加。创建在其他数据帧中不存在的索引并插入它们的值。见下面的例子。 dataFrame1： index col1 col2 col3 A 3 0 4 C 4 1 2 D 3 5 6 G 3 0 0 dataFrame2 index col1 col2 col3 A 1 1 3 B 4 4 1 C 1 3

浏览 5提问于2016-04-21得票数 0

回答已采纳

1回答

Pyspark错误：“未定义的函数：'from_timestamp‘

、、、

我试图用spark.sql从配置单元视图中获取一些数据，但每次它都抛出下面的错误： pyspark.sql.utils.AnalysisException: u"Undefined function: 'from_timestamp'. This function is neither a registered temporary function nor a permanent function registered in the database 'default'.; 我在SparkSession.builder上的设置如下： spark = S

浏览 73提问于2021-01-07得票数 0

回答已采纳

4回答

熊猫用另一个NaN代替最后一项

、、、

我试图将组中的最后一行替换为另一列的值，只有当它为null时。我可以分别做这两件事，但似乎不能把它们结合起来。有人有什么想法吗？这些是单独的部分： # replace any NaN values with values from 'target' df.loc[df['target'].isnull(),'target'] = df['value'] # replace last value in groupby with value from 'target' df.loc[df.groupby('

浏览 4提问于2020-08-05得票数 4

回答已采纳

1回答

熊猫索引+匹配功能

、

我相信有其他类似标题的帖子，但我找不到一个类似我的例子。本质上，我希望在“查找”另一个数据文件的基础上填写一个数据文件。两者都有日期索引(datetimeindex) --一个是稀疏的(lookup_df)，一个是满的(target_df)。 import pandas as pd import numpy as np target_df = pd.DataFrame(data=[2]*365, index=pd.date_range('20170101', '20171231'), columns=['value']) lookup_df

浏览 2提问于2017-11-18得票数 0

1回答

如何根据大熊猫另一个数据帧中的条件更新数据帧

、、

我有两个数据框架，我想根据两个数据帧中的条件更新df_source的一列： df_source = pd.Dataframe({'Sentiment':['neg', 'neg','pos'], 'text': ['hello ', '12where', 'here [null]'], 'pred': ['neu', 'neg', 'pos')}) df2 = pd.Dataframe({'Se

浏览 5提问于2021-10-13得票数 2

回答已采纳

2回答

从其他数据熊猫中填充数据栏的NAN值

、

我有张熊猫df的桌子 main_id p_id_y score 1 1 123 0.617523 0 2 456 0.617523 0 3 789 NaN 0 4 987 NaN 1 5 654 NaN 另外，我还有另一个dataframe df2。其中有列的 p_id score 123 1.3 456

浏览 3提问于2016-12-07得票数 3

回答已采纳

1回答

添加两个熊猫系列，同时将(非数字)值保留在非匹配索引中。

、

假设我有以下两个pandas.Series对象： >>> s1 = Series([1, True, 3, 5], index=['a', 'b', 'c', 'e']) >>> s2 = Series([100, 300, 'foo', 500], index=['a', 'c', 'd', 'e']) >>> s1 a 1 b True c 3 e 5

浏览 4提问于2014-05-14得票数 3

回答已采纳

1回答

熊猫:将多个列映射到一个列

、

我有两个列，希望使用相同的字典映射到单个新列(如果字典中没有匹配的键，则返回0)。 >> codes = {'2':1, '31':1, '88':9, '99':9} >> df[['driver_action1','driver_action2']].to_dict() {'driver_action1': {0: '1', 1: '1',

浏览 4提问于2017-04-21得票数 5

回答已采纳

1回答

熊猫.replace在一个为i在范围内()

、、、

我不知道为什么我的.replace不前进到我的for循环中的下一个值。代码： import pandas as pd import numpy as np df1 = pd.read_csv("df1.csv") df2 = pd.read_csv("df2.csv") print(df1) print(df2) df3 = pd.merge(df1, df2, on='ID', how='left') print(df3) C = len(df3.index) for i in range(C): if

浏览 8提问于2022-10-24得票数 0

回答已采纳

1回答

使用部分地图更新熊猫DataFrame的列

、、、、

我有一个包含许多列的大型DataFrame。我还有一个更小的DataFrame，它有两个列--称为'label‘和'value'，这两个列都在较大的DataFrame中。我希望将较大DataFrame的“value”列替换为较小DataFrame的“value”列，因为较大的DataFrame中的行“label”与较小的DataFrame中的一行相匹配。 for循环的逻辑是： largeDF = pd.DataFrame([['a',1],['b',2],['c',3],['d',4],['e

浏览 2提问于2017-03-21得票数 1

回答已采纳

1回答

熊猫优化性能loc功能

、

我有一个> 50000行的数据集。有些数据丢失了，因此我使用一个嵌套循环和loc函数来填充缺少的值。数据集所以我所做的基本上是第二行，我会找到的所有评级的平均值，1的所有评级的平均值，除以2，并将其用作评级。在这种情况下，将是(3.25)。我写的代码： for i in data[data.rate.isna()]['name']: for j in data.location.unique(): data.loc[(data.rate.isna()) & (data.name == i) & (data.lo

浏览 1提问于2021-02-07得票数 1

回答已采纳

1回答

如何在PySpark中将函数转换为Pandas UDF？

、、、、

我在Python中有一个函数，我想适应PySpark。我对PySpark还很陌生，所以找到一种方法来实现它--无论是使用自定义框架还是在PySpark中实现--都是一个挑战。本质上，它对按数据帧分组的数据执行一系列numpy计算。我不完全确定在PySpark中做这件事的最好方法 Python代码： data = [ [1, "a", 10, 23, 33], [1, "b", 11, 25, 34], [1, "c", 12, 35, 35], [1, "d", 13, 40, 36],

浏览 1提问于2021-03-13得票数 0

1回答

熊猫在索引上附加行和覆盖

、

例如，两个数据文件如下所示 df1 index a b 0 1 1 1 1 1 df2 index a b 1 2 2 2 2 2 我想要df1.append(df2)和覆盖因此，结果可能如下合并df index a b 0 1 1 1 2 2 <= overwrite value of df2 2 2 2 熊猫有什么好办法吗？

浏览 0提问于2018-03-13得票数 5

回答已采纳

2回答

熊猫联合/联合行动加入数据仓库

、、、、

我有3个数据文件，如下所示： >>> a val1 2018-03-04 12:40:00 1 2018-03-04 12:40:01 2 2018-03-04 12:40:02 3 >>> b val2 2018-03-04 12:40:00 5 2018-03-04 12:40:01 2 2018-03-04 12:40:02 1 >>> c val2 2018-0

浏览 3提问于2019-09-23得票数 1

回答已采纳

1回答

熊猫:这是什么类型的加入？或者它是一个连接？

我正在尝试用B更新df A以生成C。 A= Name city bob a adam b mike c fred d B= Name city adam e mike f C= Name city bob a adam e mike f fred d 也许连接不是必需的？

浏览 6提问于2017-08-20得票数 0

回答已采纳

2回答

熊猫2数据帧

、

我有两个数据框架如下： Data Frame 1: Col_1 Col_2 Col_3 Col_4 Col_5 Col_6 Col_7 SAN 1 X 2 1 a 100 BAN 1 YN 5 6 b NULL QAN 1 JH 5 6 c NULL LAN 1 QK 5 6 d 200 MKL

浏览 2提问于2022-03-27得票数 0

回答已采纳

2回答

熊猫合并没有行重叠的DataFrames

、

我有两个像这样的数据：他们的柱子是一样的。因为我正在广播一个API，它们通常有一些重叠，这可以由tradeID来处理，这是唯一的。我试过了一些东西，比如： df2 = df0.join(df1, how='outer', lsuffix='_caller', rsuffix='_other') 和 df2 = df0.merge(df1, left_index=True, right_index=True) 但结果分别是：和我在找一个没有重叠的工会，有人能帮我吗？

浏览 3提问于2017-06-01得票数 2

回答已采纳

2回答

如何有条件地过滤熊猫数据

、

我有一个Pandas数据仓库，看起来是这样的： import pandas as pd df = pd.DataFrame({ 'city': ['New York','New York','New York','Los Angeles','Los Angeles','Houston','Houston','Houston'], 'airport': ['LGA', 'EWR', 'JFK

浏览 15提问于2022-10-28得票数 1

回答已采纳

1回答

熊猫x.update(y)词典DataFrames？

、、

我坐在一个可能很简单的问题面前。我有两只熊猫DataFrames，上面有一些常见的指数，如下所示： import pandas as pd x = pd.DataFrame(index=[1, 2, 3, 4], data={'d': [5, 5, 5, 5]}) y = pd.DataFrame(index=[3, 4, 5, 6], data={'d': [6, 6, 6, 6]}) 我现在要做的是通过x更新y。这对我来说意味着三件事：指数1, 2只在x中，而在y中没有。保持x中的值

浏览 0提问于2015-03-30得票数 1

回答已采纳

3回答

熊猫:有条件地更新行的麻烦

、、

我有以下DataFrame： >>>df rtt requests asn 1000 4000 100 2000 50 NaN 3000 18000 300 我的目标是将rtt除以requests就位，如果 requests不是NaN，则让rtt保持不变。我尝试过各种方法，第二行设置为NaN，如下所示： >>>df rtt requests asn 1000 40 100 2000 NaN NaN 3000 60 300 或者DataFrame根本没有更新期望的最终输出 >>>d

浏览 2提问于2017-09-11得票数 2

回答已采纳

3回答

将熊猫数据栏替换为基于特定列的另一个数据栏

、、

我有两个包含多个列( df1、df2 )的数据，我想用来自df2列的数据替换所有的df1值(除了时间列)，其中的时间值是相同的： df1: index time x y ......many other columns ( the same as df2) 0 1 1 1 1 1.1 2 2 2 1.1 3 3 3 1.1 4 4 4 1.4 5 5 5 1.5 6 6 6 1.5 7 7 df2: index time x y ....many other colu

浏览 5提问于2021-01-18得票数 0

回答已采纳