Pandas: drop_duplicates().fillna(0)不填零

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

2回答

、、、

我尝试从一个序列中删除重复项，然后用0填充NaNs。应该非常简单，但是当我将这两个函数链接在一起时，我仍然可以在期望0.0的地方获得NaN。df = pd.DataFrame({'a':[1,1,2,3,3,4], 'b':[10,20,30,40,50,60]})收益率：0 1.0 10 1 NaN

浏览 0提问于2018-01-20得票数 2

回答已采纳

1回答

pandas groupby标志记录并应用回原始数据帧

、

group': ['a','a','a','b','b','c','c','c','c','c','c','c','c'], 'input': [0,1,1,0,0,0,0

浏览 11提问于2021-05-12得票数 0

回答已采纳

1回答

Dask dataframe:获取每个排序组的第一行

、、

我有一个包含以下格式的dask数据格式：import numpy as npddf = dd.from_pandas

浏览 9提问于2020-12-22得票数 1

回答已采纳

2回答

根据条件为自定义列分配值

、、、

bb bb cat1 sc3 lllimport pandaspd.read_csv("abhorrent.csv") noDupes = df[["brand", "model name", "column1", "column2", "column3"]].drop_duplicates

浏览 3提问于2019-11-21得票数 1

回答已采纳

1回答

从零开始创建稀疏的熊猫数据，而不首先创建密集版本

、、、

我正在处理非常稀疏的数据，我希望创建以零作为缺失值的稀疏数据框架，而不需要创建一个密集的数据框架。item1": 2, "item4": 50},我可以像这样创建正确的数据格式： record, orient="index", dtype=pd.SparseDtype("in

浏览 7提问于2022-08-17得票数 0

3回答

Groupby和Sum的多级

、

我有一个初始化如下的数据帧，我想知道列'a‘中的值是否存在于列'b’中。df = pd.DataFrame({'a': [1,2,3, 1, 4, 1, 2], 'c': [10,20,40, 50, 60, 70, 100]})

浏览 0提问于2019-08-15得票数 1

1回答

在dataframe中为日期列创建按主题划分的时间点

、

举个例子： 'Date':[20191219, 20191221]}) ID Date4 3 201912196 3 201

浏览 1提问于2019-12-19得票数 0

回答已采纳

1回答

熊猫:删除python中具有不同编码方式的行

、、、

nan值被替换为零。有只有零的行和只有0和0.0值的行。如何删除这些行？根据附加的图像行号5，6(只有0.0s)，9和11 (0和0.0s)需要被删除。 all_df = pd.read_csv('source.csv')all_df.fillna(<em

浏览 1提问于2019-07-15得票数 0

回答已采纳

2回答

有没有办法自动清理pandas* DataFrames的数据？*

、、

我正在为一个机器学习项目清理我的数据，方法是分别用“Age”和“for”列的零和平均值替换缺少的值。具体代码如下：mean = train_data['Fare'].mean() def data_cleaning(df): df['Age'] = df['Age'].fillna</

浏览 26提问于2021-10-11得票数 0

4回答

添加两个pandas数据帧

、

如果该项不存在于某个dataframe中，则应将其视为零。我尝试过使用.add，但无论索引和列如何，这个函数都会求和。

浏览 0提问于2012-06-20得票数 52

回答已采纳

2回答

在pandas中填充缺失的索引

、

我有如下数据：from datetime import datetime 11月3日的缺失索引对应于一个零值，我希望它看起来像这样：y = pd.Series(x, pd.date_range('2013-11-1', periods =

浏览 1提问于2013-12-05得票数 11

回答已采纳

3回答

如何删除在某栏中使用熊猫的“南”价值观？

我有一个列，它有很多行，混合了“nan”。我只想删除'nan'，而不是包括'nan‘的整行。该列中的一些单元格有多个nans，如: nan，nan，和一些单元格有我需要的名称，例如: Jefferson，nan，nan。

浏览 10提问于2022-07-26得票数 0

回答已采纳

2回答

.toPandas()在对象列中产生预期数值列

、、、

然而，当我试图用pandas.plot()函数来绘制这个图时，它会抛出一个"TypeError:空的'DataFrame'：没有要绘制的数字数据“CAST(AMD_3 AS DECIMAL(12,2)) AS AMD_3 ,CAST(AMD_0decimal(12,2) (nullable

浏览 4提问于2015-11-02得票数 9

4回答

熊猫把副本放在清单上

、、

说我的数据是：产生的结果：0 [1, 0]2 [1,0]df.drop_duplicates() 我得到以下错误: TypeEr

浏览 0提问于2018-05-18得票数 14

回答已采纳

2回答

如何在熊猫中用不同数量的柱子连接两个框架？

、

| 2 | | 3 | 0|| 4 | 0 | |-----------当列不存在于后一个dataframe中时，我希望设置默认值为0。我怎样才能做到这一点？

浏览 2提问于2017-04-24得票数 13

回答已采纳

1回答

从上次交易日期开始计算天数，使用窗口函数实现从Pandas到Pyspark的时序实现

、、、

PANDAS中的pandas_output代码 # Calculate days since last deal for customer / master customer df['booked_date_day(['customer_nbr', 'booked_date_day']).groupby('customer_nbr')['customer_whole_days_from_last_deal'].fillnamaster_cus

浏览 35提问于2020-09-05得票数 0

2回答

pandas用函数返回的值替换0

、

我的熊猫数据帧中有一堆零。我想用函数返回的值替换它们。我正在使用fillna做类似的事情。以下是我的代码的一个简化版本，以实现可重复性：import numpy as np v = x * 2 'col2': [1,2,3]

浏览 1提问于2021-11-15得票数 0

1回答

熊猫-按函数和sum列分组，以提取其他列和为0的行。

、、

我试图在Bar_Code列中对值进行分组，并仅提取SOH、Sold_Date和成本中所有行之和为零的行。：1 00000003589823 00.00 NULL3 000000035898230000000151818

浏览 2提问于2021-12-23得票数 1

回答已采纳

6回答

如果存在新数据，则更新pandas数据帧

、、

]})df = pd.DataFrame({"name":["A", "B", "C"], "balance":[100, 400, 600]}) 有没有办法使用python和pandas

浏览 0提问于2021-04-11得票数 2

1回答

如何将dataframe转换为作为新列的列的值，并按其他列分组？

、

我有一个Excel文件如下 Output = dt.groupby(['Name','Fruits'])['QTY'].sum()

浏览 0提问于2021-09-14得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云