Pandas通过基于其他列值进行平均来删除列

文章/答案/技术大牛

发布

1回答

、

4 1 0.624772import pandasrepe, value]) data=pd.DataFrame(data, columns=['label1', 'label2', 'repetition', 'value']) 我想生成一个包含列label1、label2和value的新DataFrame，其中value取

浏览 5提问于2019-10-04得票数 1

回答已采纳

2回答

填充缺失的值并进行规范化

、、、、

我有两列神经网络的训练数据，它们都是缺失的值。(还有许多其他列不缺少值。)我还被建议通过减去每一列的平均值并除以std来规范数据。这两种方法都很好--我知道怎么做和为什么要这样做。我不明白的是如何把它们结合起来。我也可以..。填充缺失的值，然后进行规范化，但是a)我的零将不再是零(我的网络还会知道它们是一个特殊值吗？)和( b)零将在一定程度上影响平均值

浏览 0提问于2018-07-26得票数 8

1回答

如何绘制一列的平均直方图，而潘达斯中的另一列定义垃圾箱

、、、

我想为我的Pandas DataFrame的两列绘制一个直方图。虽然回收箱是由列ratio的值定义的，例如0-0.1、0.1-0.2、.、0.9-1.0，而不是像常规直方图那样的计数，但我需要绘制每个桶的其他列feet的平均值。我可能会创建另一个列，这个列是ratio列，并通过在新列上分组来计算feet的平均值。但有没有办法在不生成新列的情况下直

浏览 3提问于2020-08-03得票数 1

回答已采纳

2回答

通过跳过Python / Pandas中的某些值来计算数据

、、、

我需要计算dataframe的第一列的平均值，我可以使用mean()方法进行计算。问题是:有时，数据中有-9999个值表示缺失的观测值。我知道在计算Pandas中的平均值时，NaN值本质上是跳过的，当然-9999值不是这种情况。df=pandas.DataFrame([{2,4

浏览 7提问于2015-01-27得票数 4

回答已采纳

2回答

pandas是否获得具有特定值的行的列平均值？

、、

在pandas中，我无法根据不同列的值获取列的值的平均值。3 A 4 3 5 B 6 我想要得到的是特定城市的timeDiff平均值，比如 A：(2+3+4)/3 =3 B：(6+6)/2 =6 我知道我可以通过dfcolumnName.mean()获得列特定平均值，但我不

浏览 42提问于2021-01-13得票数 1

回答已采纳

1回答

这些文件有一个隐含的索引列(升序的未命名列)：有没有办法使用ddf.groupby()操作来根据索引值对csv文件进行分组？我的最终目标是计算每个单元格的平均值，而我一直在努力在网上寻找答案。我尝试使用groupby(axis=0)和groupby(level=0)，但在dask中返回错误。我唯一的另一个想法是使用for循环加载文件，然后显式地手动添加一个新的索引列--但这似乎是一个不必要的、代价高昂的操作。

浏览 8提问于2017-07-12得票数 1

回答已采纳

1回答

如何在pandas中找到多列的非零中值/均值？

、、、、

我有一个很长的列列表，我想要一次计算出非零中值、均值和标准差。我不能删除基于1列的带有0的行，因为同一列中另一列的值可能不是0。..... } 我知道我可以用循环编写很长的代码来一次处理

浏览 5提问于2016-08-18得票数 1

回答已采纳

1回答

在python中从cvs中删除99999个值？

、、

我正在处理一个很大的数据集(超过400列和200000行)，对于一些没有记录的值，在那个槽中有一个'-9999.99‘值。如何通过python从导入的数据中删除这些值？我在pandas中使用csv文件导入。我不想删除整个列，只是删除任何值为-9999.99的数据框，因为它没有任何意义，并且会弄乱我的平均值和标准差值。谢谢!

浏览 1提问于2020-05-28得票数 0

2回答

pandas pivot_table中的加权平均值

、

我正在尝试生成pandas数据透视表，它计算一系列数据列中的值的平均值，这些值由固定权重列中的值加权，我正在努力寻找一种优雅而有效的方法来实现这一点。1 A 20 03 B 0 0Group weight val 0 A 30

浏览 2提问于2020-02-21得票数 1

0回答

pandas在基于其他列的列中删除值

、、

有没有一种方法可以删除df中的单个条目？10 5 25113 6 7 4 10115 7 1 8 10 如果Count1 < 5，我想删除任何Value1，如果Count2 <5，我想删除任何Value2。

浏览 0提问于2017-12-09得票数 1

回答已采纳

2回答

如何根据分组对象填充数据帧中丢失的数据？

、、

我有一个包含一些列的数据集，用于对数据库进行分组。我在同一数据集中还有一些其他的数值列，其中有一些缺失的值。我想用缺失条目所在的组的平均值填充列的缺失值。Name of Pandas dataset=data Col that needs to be

浏览 4提问于2016-05-11得票数 1

回答已采纳

2回答

窗口大小为列值间隔的滚动平均值

、、

我正在尝试计算一些不完整数据的滚动平均值。我想要在第1列(英里)的值的1.0大小的窗口中对第2列中的值进行平均。我尝试过.rolling()，但(据我有限的理解)它只基于索引创建窗口，而不是基于列值。import pandas as pd [4.5, 10], [4.6,

浏览 0提问于2020-11-07得票数 3

1回答

sklearn.iterativeimputer和pandas.interpolate(方法=‘线性’)有什么不同？

、、、、

sklearn.impute.IterativeImputer(estimator='linear')和pandas.interpolate(method='linear')是如何如果任何人对此略知一二的话

浏览 9提问于2022-06-07得票数 0

1回答

将数据帧中的每行与其他行进行比较

、

我有一个数据帧，其中包含一列值(X)。 df = pd.DataFrame({'X' : [2,3,5,2]}) 对于每一行，我想找出其他行的X值的平均值(A)。 ?

浏览 20提问于2019-06-25得票数 0

回答已采纳

2回答

如何用Pandas DataFrame列范围值的绝对值/平均值替换它们？

、、、

我希望通过计算其绝对值/平均值，在每个单元格中将Pandas DataFrame列的值替换为其范围形式的值。列值:单个单元格是“46-55”，下一个单元格值是“26-35”，下一个单元格值是“100+”(不带引号) 示例输入: pandas.core.series.Series('46-55'，'26-35'，'60+&#

浏览 120提问于2019-10-09得票数 1

回答已采纳

2回答

Pandas:按平均值对列进行排序

、

我在Pandas中有一个dataframe，我想根据它的列的平均值(或通过它们的std值)对它的列进行排序(例如，获取一个新的dataframe，或一个视图)。

浏览 1提问于2013-07-18得票数 26

回答已采纳

1回答

取级数均值的最优方法

、、

有了一个由DataFrame索引组织的DateTime，什么是最好的方法来获得一个连续滚动的列在里面？2021-12-20 09:32:00 37.02021-12-20 09:34:00 73.0 我的目标是创建一个新列，其中第一个值是第一行(6)的平均值，第二行是前两行的平均值，依此类推。这是可以通过Pandas实现的，还是必须对整个DataFrame进行</

浏览 6提问于2022-01-20得票数 1

回答已采纳

2回答

熊猫平均水平并移除重复

、、

我有以下数据：df = pd.read_csv(...) x 3 .x 3z 22.基于A列的计算平均值这是我第一次使用python，对垃圾邮件很抱歉--我试着使用别人的答案，但是没有什么对我有用。

浏览 1提问于2020-11-30得票数 1

回答已采纳

1回答

数据质量改进作为预处理的一部分:估算

、、、

这些数据包含了大量的空值，我想用实值覆盖这些空值。超集有：大多数属性的一些空值它不依赖于时间用机器学习填写空白处会很整洁，有什么建议我可以这样做吗？

浏览 0提问于2019-09-04得票数 1

1回答

与每列的中位数进行比较

、、、

如何与pandas数据帧中每一列的中位数进行比较，如果值大于中位数，则结果为true；如果值小于中位数，则结果为false？现在我正在标准化，所以基本上比较每一列的0(平均值)。我想要一种方法来对median做同样的事情。

浏览 2提问于2019-06-28得票数 1

点击加载更多