pandas滚动应用返回np.nan_Pandas滚动应用乘法_滚动窗口内的Pandas滚动返回结果计数 - 腾讯云开发者社区

python、pandas、outliers

我有几个长期数据系列与空白，并希望使用低通滤波器检测异常值。理论上，(数据中位数)>3西格玛似乎是一个合适的测试，但有两个问题：数据序列太长，变化太大，所以对整个系列只使用一个中位数和标准差是行不通的，使用pandas.rolling_median和pandas.rolling_std已经帮了我很大的忙，但是现在数据缺口成了一个问题，因为在每个有效间隔的末尾都缺少滚动值，因此没有值可以比较。下面的程序说明了这个问题(如果由于随机数据而在第一次尝试中捕获了所有异常值，则可能需要再次运行)： import numpy as np import pandas as pd

浏览 2提问于2016-07-22得票数 2

回答已采纳

1回答

如何在两种不同的条件下形成滚动差异？

pandas

我在Pandas DataFrame上创建了一个新的专栏，在买卖(持有期)之间有滚动的利润。buy=1在买sell=1在卖..。买卖之间是持有期。因此，滚动利润应该是当前价格(收盘价)和最后一次买入价格(买入的收盘价=1 )之间的差额，直到头寸关闭为止。 trading_df = pd.DataFrame({'Date': ['10/1/2020', '10/2/2020', '10/3/2020', '10/4/2020', '10/5/2020', '10/6/2020', &

浏览 1提问于2021-12-20得票数 0

回答已采纳

2回答

为什么熊猫的NaN数据不能作为字典密钥使用？

python、pandas、hashtable、nan

我试图在下面的数据帧中使用values列的元素作为字典中的键。 In [1]: import numpy as np ...: import pandas as pd ...: rng = pd.date_range('2021-06-01', periods=4) ...: values = [1, -1, 0, np.nan] ...: df = pd.DataFrame(values, index=rng, columns=['values']) In [2]: df Out[2]: values 2021

浏览 1提问于2021-06-07得票数 2

回答已采纳

4回答

熊猫系列:条件滚动标准差

python、pandas、rolling-computation

我有一个从-1到+1的Pandas系列随机数： from pandas import Series from random import random x = Series([random() * 2 - 1. for i in range(1000)]) x Output: 0 -0.499376 1 -0.386884 2 0.180656 3 0.014022 4 0.409052 ... 995 -0.395711 996 -0.844389 997 -0.508483 998 -0.156028

浏览 13提问于2022-08-13得票数 2

回答已采纳

3回答

熊猫滚动条件函数

pandas、rolling-computation

我有一些困难，在熊猫使用.apply或.aggregate滚动(当然，这是正确的方式解决我的问题)。假设我有一个有A和B列的数据，如果A的值为1，我想要创建一个列C，其中包含B的滚动平均值。更广泛地说，我希望能够在滚动的基础上应用一个自定义函数，其中涉及数据数据的几列(例如，当B>x和/或C=y时，A列的滚动和)。 import pandas as pd import numpy as np df2 = pd.DataFrame({'A':[1,1,1,0,0,0,1,1,1],'B': [50,40,50,-20,20,10,10,-5,-2]}, in

浏览 5提问于2020-11-27得票数 2

回答已采纳

2回答

如果在pandas dataframe中不为空或者不为空，如何查找if值？

python、python-3.x、pandas、dataframe

如何确定一个字段在pandas数据框中是否不为空(‘’)且不为空？我正在使用if not value and pd.notna(value): 是正确的，还是有更好的API可以直接处理这个逻辑？

浏览 249提问于2021-01-13得票数 0

1回答

使用基于条件的if语句填充熊猫数据帧中缺少的值

python、pandas、if-statement、apply

我有一个Pandas数据框架，其中缺少一些值。例如，在第542行中缺少纬度的值。我的目标是基于条件CNTY_CITY_LOC，通过在Pandas中应用if elif和apply函数来填补纬度的缺失值。在我使用Pandas的apply函数应用if语句后，丢失的值将被替换，但纬度列中的所有其他值都会丢失。我做错了什么？谢谢你的帮忙

浏览 3提问于2022-05-16得票数 1

回答已采纳

3回答

如果列值为NaN，则返回布尔值。

pandas

我有多个列的Pandas DataFrame，我想检查特定的列值是否为NaN，如果是，我需要返回布尔值(真或假)。我试过了 pandas_df['col1'].isnull() 但是它返回所有带有索引和布尔值的行。

浏览 4提问于2019-05-21得票数 0

回答已采纳

1回答

熊猫:丢失数据的行数

pandas

如何查找Pandas DataFrame中丢失数据的行总数？我试过这样做： df.isnull().sum().sum() 但这是全部缺失的字段。我需要知道有多少行受到影响。

浏览 0提问于2018-02-01得票数 8

回答已采纳

3回答

检查应用于数据帧的np.nan内部函数

python、python-3.x、pandas

这是我的代码： import numpy as np import pandas as pd df_i2b2 = pd.DataFrame({'id':[1,2,3,4], 'DIAGNOSIS_CODES':["338.29; 353.6; 355.9; 722.6; 724.2; E43", "278.00; 300.00; 305.1; 353.6",

浏览 1提问于2020-07-07得票数 0

回答已采纳

1回答

我正在尝试理解None和正确的语法

python、dataframe、scikit-learn

我正在将一个excel电子表格导入到pandas中，需要确定有多少个单元格中有“无”。下面的代码片段是我复制这个问题的最佳尝试，它用一个None替换了“NONE”。但是，当我搜索None时，条件语句失败。为什么会这样呢？ import pandas as pd import numpy as np df = pd.DataFrame(np.array([['B',1,3.4], ['A','NONE',8.9],['C',3,4.6]]), columns=['Part','Quantity&

浏览 4提问于2021-09-14得票数 0

1回答

在pandas数据框的列中将NaN值更改为0时出现问题

python、pandas、dataframe、replace、nan

我正在试着理解它是如何工作的.. 我有这个df。 ticket_id address grafitti_status 0 284932 10041 roseberry, Detroit MI NaN 1 285362 18520 evergreen, Detroit MI NaN 2 285361 18520 evergreen, Detroit MI NaN 3 285338 1835 central, Detroit MI

浏览 12提问于2020-07-01得票数 0

回答已采纳

1回答

为什么一个空的DataFrame of dtype=str充满了"n"？

python、string、pandas、dataframe、nan

我不明白为什么使用dtype=str创建的系列结果如下： In [2]: pandas.Series(index=range(2), dtype=str) Out[2]: 0 NaN 1 NaN dtype: object 但是使用DataFrame创建的dtype=str结果如下： In [3]: pandas.DataFrame(index=range(2), columns=[0], dtype=str) Out[3]: 0 0 n 1 n 为什么只有字母"n“的字符串？为什么系列赛和DataFrame有这样的区别？这些文件在哪里？！

浏览 2提问于2015-02-05得票数 4

回答已采纳

2回答

np.nan与np.NaN的区别

arrays、numpy、nan

np.nan和np.Nan有什么区别吗？根据我的理解，两者都用于空值，但如果您在这里查看 import numpy as np import pandas as pd import matplotlib.pyplot as plt df = pd.DataFrame([[np.nan,2,np.nan,0],[3,4,np.nan,1],[np.nan,np.nan,np.nan,5]],columns=list('ABCD')) print(df) print(np.nan == np.NaN) 我得到以下输出： A B C D 0 NaN 2.

浏览 0提问于2018-11-22得票数 18

回答已采纳

1回答

将不同类型的缺失值转换为pandas可识别的NA

python、pandas

我有一个数据帧，它包含各种不同的值来指示缺失。我修改了它，现在它们都应该被指定为'NaN‘，如下所示： import numpy as np import pandas as pd import numpy as np data = {'Name':['Tom', 'nick', '-', 'jack'], 'Age':['20', '0', '19', ''], 'color'

浏览 6提问于2021-04-27得票数 0

3回答

有没有办法强制SimpleImputer返回熊猫数据帧？

python、pandas、numpy、scikit-learn

下面的代码 from sklearn.impute import SimpleImputer import pandas as pd df = pd.DataFrame(dict( x=[1, 2, np.nan], y=[2, np.nan, 0] )) SimpleImputer().fit_transform(df) 返回 array([[1. , 2. ], [2. , 1. ], [1.5, 0. ]]) 有没有办法使用计算机返回一个pandas dataframe而不是numpy数组？有没有一个scikit-learn的实现呢？

浏览 20提问于2020-06-04得票数 1

回答已采纳

2回答

Python pandas没有属性ols - Error (滚动OLS)

python、python-3.x、pandas、linear-regression、statsmodels

在我的评估中，我希望使用以下Python脚本对该URL：中的数据集运行滚动的1000窗口OLS regression estimation。 # /usr/bin/python -tt import numpy as np import matplotlib.pyplot as plt import pandas as pd from statsmodels.formula.api import ols df = pd.read_csv('estimated.csv', names=('x','y')) model = pd.stats.o

浏览 1提问于2017-06-23得票数 6

3回答

基于其他栏的if- of填充熊猫DataFrame的新列

python、pandas、numpy、dataframe

有一种情况是，我希望在Pandas DataFrame中创建一个新列，并根据涉及另外两个列的条件填充它。在本例中： import pandas as pd import numpy as np df = pd.DataFrame(np.array([['value1','value2'],['value',np.NaN],[np.NaN,np.NaN]]), columns=['col1','col2']) 我想要创建一个新的列，“new”，它包括1) col2中的值(如果它不是NaN else )，2) col

浏览 0提问于2019-05-13得票数 3

回答已采纳

3回答

当我在Pandas中尝试locale.atof时，float‘object没有'replace’属性是怎么回事？

python、pandas

我正在尝试将Pandas数据帧序列转换为float。我先执行locale.setlocale(locale.LC_NUMERIC, '')，然后执行df.idh.apply(locale.atof)，但它给出了上面提到的错误：AttributeError: 'float' object has no attribute 'replace'。我假设在某个时刻，它会得到类似NaN的东西，可能是其他字符串，但它不能识别它。我如何告诉apply跳过这些？

浏览 1提问于2015-08-27得票数 6

回答已采纳

2回答

把矮小的数据放进熊猫

python、arrays、numpy、multidimensional-array、pandas

我想把下面的数据放到熊猫中作进一步的分析。 import numpy as np import pandas as pd from pandas import DataFrame data = np.array([[[1, 1, 1, np.nan, 1], [np.nan, 1, 1, 1, 1]], [[2, np.nan, 2, 2, 2], [2, np.nan, 2, 2, 2]], [[3, 3, 3, np.nan, 3], [3, 3, 3, 3, np.nan]]]) pnda = pd.Series(d

浏览 2提问于2014-05-02得票数 5

回答已采纳

1回答

基于不同列的可变窗口的Pandas滚动均值

python、pandas、dataframe、rolling-computation

我想在一个窗口上执行滚动平均值，该窗口根据我的DataFrame中的列的值而变化。有谁可以帮我？这里是一个起点： import pandas as pd import numpy as np rng = np.random.default_rng() df = pd.DataFrame(rng.integers(0, 100, size=(100, 2)), columns=list('AB')) df.loc[:,'B']=df['B']//10 现在我想要得到基于B列的窗口的级数df.A的滚动平均值。例如，如果df.B[0]值为3，则my

浏览 12提问于2021-10-25得票数 0

回答已采纳

2回答

如何正确地将lambda函数应用于pandas数据框列

pandas、lambda

我有一个pandas数据框，sample，其中一个列叫做PR，我对它应用了一个lambda函数，如下所示： sample['PR'] = sample['PR'].apply(lambda x: NaN if x < 90) 然后，我得到以下语法错误消息： sample['PR'] = sample['PR'].apply(lambda x: NaN if x < 90) ^ SyntaxError: in

浏览 1提问于2016-05-25得票数 38

回答已采纳

2回答

为什么要对空元素执行pandas.apply()？

python、pandas

假设pandas.apply()函数不适用于空元素。但是，在下面的代码中不会发生这种情况。为什么会发生这种情况？ import pandas as pd df = pd.Series([[1,2],[2,3,4,5],None]) df 0 [1, 2] 1 [2, 3, 4, 5] 2 None dtype: object df.apply(lambda x: len(x)) Traceback (most recent call last): File "<stdin>", line 1, in <modu

浏览 0提问于2016-01-03得票数 6

回答已采纳

1回答

将布尔值转换为实际值时出错

python、pandas、jupyter-notebook

当在python中对我的excel数据执行很少的分析时。运行代码以根据参数获取少数数据时，遇到一个错误。我有一个excel文件，作为Python熊猫的源代码。在excel中，我们有一个名为“汇总”的列，在该列中，我需要获取那些开始/包含"FW:“的汇总的记录。代码看起来非常适合我，我确实运行了代码，并得到了布尔值的输出。将布尔值转换为完整记录时。我遇到了一个错误。 import pandas as pd import numpy as np data = pd.read_excel('Desktop/VGCS06.xlsx) data['Summary'].

浏览 0提问于2019-02-11得票数 1

回答已采纳

2回答

基于熊猫的滚动状态模型协整

python、pandas、statsmodels、rolling-computation

我有一个带有两个系列的DataFrame，我知道如何使用所有数据点来实现它们的协整. import pandas as pd import numpy as np import statsmodels.tsa.stattools as ts A = pd.Series(np.cumsum(np.random.normal(size=100)) + 50) B = pd.Series(A + 5 + np.random.normal(size=100)) ts.coint(A, B) 但是，我想通过使用滚动窗口(假设是60天)来探索这种协整是如何随着时间的推移发生变化的。我如何使用状态模型和

浏览 0提问于2018-06-19得票数 1

回答已采纳

1回答

试图理解pandas.DataFrame.mode()输出形状

python、pandas

我需要计算熊猫DataFrame的特定列行的模式。我在网上的例子中没有任何问题.以下代码工作正常： import numpy as np import pandas as pd import platform import sys print('python', platform.python_version()) print('numpy', np.__version__) print('pandas', pd.__version__) data = [[np.nan, np.nan, np.nan, np.nan, np.nan

浏览 2提问于2021-01-05得票数 0

1回答

熊猫使用多列作为“输入”应用()自定义函数

python、pandas、apply

也许看看这个快速的例子可以帮助你理解我想做的事情： import pandas as pd df = pd.DataFrame({"A": [10,20,30,50,70,40], "B": [20,30,10,15,20,30]}) def _custom_function(X): # whatever... just for the purpose of the example # but I need X to be the actual df and not a series Y = sum((X['A

浏览 3提问于2021-03-23得票数 2

回答已采纳

2回答

大熊猫滚动申请缺少数据

python、pandas、missing-data、rolling-computation

我想对丢失的数据进行滚动计算。示例代码：(为了简单起见，我给出了一个滚动和的例子，但是我想做一些更通用的事情。) foo = lambda z: z[pandas.notnull(z)].sum() x = np.arange(10, dtype="float") x[6] = np.NaN x2 = pandas.Series(x) pandas.rolling_apply(x2, 3, foo) 它产生： 0 NaN 1 NaN 2 3 3 6 4 9 5 12 6 NaN

浏览 1提问于2012-11-15得票数 13

1回答

创建一个满足定义函数的数组

python、pandas、dataframe、numpy

我正在尝试使用pandas和numpy填充数组以满足条件我使用了import numpy as np和import pandas as pd X=['e','a','b','c'] #The list of elements to multiply and fill df=pd.DataFrame([['*','e','a','b','c'],['e','e','a','b','

浏览 8提问于2021-01-17得票数 1

回答已采纳

1回答

熊猫栏浮成一串巨蟒

python、pandas、types

例如，我创建了一个名为“order_num”的新列 import pandas import numpy as np import os df=pandas.read_excel(os.getcwd() + r"/excel.xlsx", sheet=0, skiprows=0,) df['order_num']=np.nan 我想把一些价值放在新创建的列上 df.set_value(index, 'order_num', 'somestr') 出现了错误信息 ValueError:无法将字符串转换为浮动：“somestr”

浏览 1提问于2017-11-07得票数 1

回答已采纳

1回答

python -如何解析"ValueError:传递值的形状是(228，1)，索引意味着(228，7)“

python、pandas、foursquare、valueerror

我正试图完成一门课程的作业，并且很难找到我的代码的一部分才能正常工作。我正在使用foursquare API来探索波特兰的社区，并找到其中有书店(和类似的场所)的社区。我已经接近让它执行了，但是我一直在标记上面的ValueError，并且不知道如何重构我的DF，使它具有正确的形状。这是我的代码： def getNearbyVenues(names, latitudes, longitudes, limit=500): venues_list=[] for name, lat, lng in zip(names, latitudes, longitudes):

浏览 1提问于2020-01-30得票数 1

3回答

熊猫:在另一篇文章的基础上添加一个专栏

python、pandas

如果mths_since_recent_revol_delinq为null，则获得新列等于1，并获得新的数据，如下所示： +----+--------------------------------+------------------------------------+ | | mths_since_recent_revol_delinq | mths_since_recent_revol_delinq_add | +----+--------------------------------+------------------------------------+ | 0 | N

浏览 0提问于2018-07-03得票数 2

回答已采纳

1回答

具有第一个非空唯一值的groupby agg

pandas

下面的代码给出错误 import pandas as pd import numpy as np df=pd.DataFrame({"item":['a','a','b'],"item1":['b','d','c']}) df.groupby("item").agg(model_list=("item1", np.unique)) 由于项目a有两个唯一值(即b和d)，如何修改它以返回第一个非空的唯一值？

浏览 28提问于2021-03-18得票数 0

1回答

熊猫/Numpy NaN无比较

python、python-3.x、pandas、nan、nonetype

在Pandas和Numpy中，为什么比较结果是不同的？ from pandas import Series from numpy import NaN NaN不等于NaN >>> NaN == NaN False 但是列表或元组中的NaN是 >>> [NaN] == [NaN], (NaN,) == (NaN,) (True, True) 当Series与NaN又不相等时： >>> Series([NaN]) == Series([NaN]) 0 False dtype: bool 和None >>> None ==

浏览 1提问于2018-09-21得票数 8

回答已采纳

2回答

如何将累积值转换为增量值，并将其转换为带空值的熊猫数据？

python、pandas、dataframe、group-by、cumulative-sum

我有一只熊猫数据，它的累积值如下： import pandas as pd import numpy as np data = {'Date':['2017-01-27','2017-01-28','2017-01-29','2017-01-30','2017-01-31','2017-02-01','2017-02-02','2017-02-03','2017-02-04','2017-02-05'], 'K

浏览 4提问于2022-08-15得票数 2

回答已采纳

1回答

根据其他单元格的内容向列添加数据(Python/Excel)

python、excel、pandas、numpy

各位，我在努力实现库存分配的自动化。由于我不是一个经验丰富的程序员，我在创建逻辑上有困难。目标是合并两个Excel文件，并添加包含负责人/部门的列。到目前为止，我管理的是合并Excel文件并添加列"Reviser“。现在，这一栏必须由合适的人员/部门填补。这背后的逻辑并不困难，但我不知道如何用Python/Pandas等来解决这个问题。我已经尝试过用np.where来解决这个问题，但这并不能完全解决这个问题。在这里，您可以看到revisor分配背后的逻辑：分配背后的逻辑谢谢你的帮忙! 我现在的代码是： import pandas as pd import numpy as

浏览 2提问于2020-05-18得票数 0

1回答

当聚合或应用于列表或数组时，numpy sum min max函数的不同行为

python、pandas、numpy、nan、aggregation

在将相同的numpy函数作为groupby的聚合函数应用时，或者在涉及NaN值的情况下，对相同的值列表应用相同的numpy函数时，我看到不同的行为。这适用于np.sum np.min np.max和np.mean聚合函数的行为看起来与使用np.nansum、np、nanmin等相同例如 import pandas as pd import numpy as np xx = pd.DataFrame([['A', 1., 2., 3.], ['A', 3., np.nan, 4.],

浏览 13提问于2019-04-24得票数 0

回答已采纳

3回答

将Pandas系列分词扩展为列(缺少值)

python、pandas

我有一个熊猫系列，大部分元素都是字典。我想扩充字典，使它们成为专栏。当不缺少值时，这很简单： import numpy as np import pandas as pd data = pd.Series([{'Class': 'A'}, {'Class': 'B'}]) data.apply(pd.Series) 输出： Class 0 A 1 B 但是，在我的例子中，存在缺失的值。当我在缺少值时尝试.apply(pd.Series)方法时，会得到一个错误： RuntimeW

浏览 0提问于2018-02-26得票数 0

1回答

在熊猫df切片中设置值会引发SettingWithCopyWarning

python、pandas、slice

我按照指定的指令执行以下操作： df.loc[:,('ratio')][np.isinf(df.loc[:,('ratio')])] =np.nan 但我收到了SettingWithCopyWarning警告。本质上，我希望在除以零的情况下将任何inf值设置为np.nan。 <string>:265: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentatio

浏览 3提问于2016-05-24得票数 0

回答已采纳

1回答

为什么这个代码会在熊猫身上造成错误呢？

python、pandas、keyerror

我试图在Stepik上解决这个问题:名为my_stat的dataframe包含4列：session_value、group、time、n_users。在变量n_users中，我们将所有负值替换为n_users的中值(当然不包括负值)。以下是我写的： import pandas as pd import numpy as np my_stat = my_stat['session_value'].replace(np.nan, 0) my_stat.loc[my_stat['n_users'] < 0, 'n_users'] =

浏览 8提问于2021-12-24得票数 1

回答已采纳

1回答

pandas.NaT的字符串表示有时是"nan“而不是"NaT”。

python、pandas

当我将pandas.NaT转换为字符串时，结果有时是"nan"而不是"NaT"。我很抱歉，但我无法在一个MWE与示例数据再现这一点。也许这取决于DataFrame的大小？我正在使用pandas==1.3.0。我创建了一个包含日期时间对象的列的字符串表示形式，其中一些对象是NaT，如下所示： df['X'] = df.ZEIT_VON.apply(str) 让我们看看结果 >>> df_roh.loc[60:63, ['ZEIT_VON', 'X']] ZEIT_VON X 60

浏览 4提问于2022-02-16得票数 0

回答已采纳

1回答

如何消除丢失的数据

python、pandas、missing-data

，我想在名为crsp_data的文件中消除列ret和dlret中缺少的值。这是我的代码： crsp_data_ret=crsp_data['ret'].dropna() crsp_data_dlret=crsp_data['dlret'].dropna() crsp_data['retadj']=(1+crsp_data['ret'])*(1+crsp_data['dlret'])-1 但它给了我一个错误： KeyError Traceback (m

浏览 0提问于2018-07-03得票数 2

回答已采纳

1回答

处理Pandas和Numpy中丢失的数据

python-2.7、numpy、pandas、missing-data

我有以下数据样本。我想 ( a)在C栏中，取代 ( b)在D栏中，place '‘与我的尝试都没有奏效，我也不知道为什么。 import pandas from pandas import DataFrame import numpy as np df = DataFrame({'A' : ['foo', 'foo', 'foo', 'foo', 'bar', 'bar', 'bar', &

浏览 0提问于2015-09-14得票数 2

回答已采纳

1回答

找到包含win，loss列的pandas DataFrame的win百分比的最佳方法

python、pandas

我有一个具有两列('win'和'loss')的pandas DataFrame，我想要找到win百分比('win%')并将其传递给DataFrame。问题是，对于某些行，条目是0，所以对于这些行，我需要将np.nan传递给'win%'。下面的代码完成这项工作： df=pd.DataFrame([[1,2],[0,0],[2,1],[0,1]],columns=['win','loss']) df['total'] = df['win'] + df['los

浏览 9提问于2020-07-16得票数 0

回答已采纳

2回答

熊猫中的NaN Series.tolist()的行为与列表中的NaN不同

python、pandas、numpy

为什么 >> import pandas as pd >> import numpy as np >> list(pd.Series([np.nan, np.nan, 2, np.nan, 2])) == [np.nan, np.nan, 2, np.nan, 2] 还False？我在pd.Series([np.nan, np.nan, 2, np.nan, 2]).tolist()上得到了同样的结果。我试图通过以下函数来计算熊猫群对象(基本上是熊猫系列)中最常见的元素 def get_most_common(srs): ""

浏览 4提问于2020-04-08得票数 2

回答已采纳

2回答

将函数应用于NaN值并获取赋值前引用的UnboundLocalError:局部变量'val‘

python、pandas

我有一个文件，它有一个名为logo的列，有些行有图片路径，有些行是空的。我想用一张图片填充空白行，这是我的代码，并在赋值之前引用了错误UnboundLocalError:局部变量‘val def g(row): if row['logo'] == np.nan: val = str(r"path\yellow_m.png") else: pass return val operator['logo'] = operator.apply(g, axis=1) ----------------

浏览 14提问于2021-08-02得票数 0

3回答

函数将数据中的NaN值替换为相关列的平均值。

python、pandas、numpy、dataframe

编辑：这个问题不是的克隆，因为我想用列的平均值而不是数据值的平均值替换每个列的值。问题我有一个熊猫数据收集(train)，有100栏，我必须应用机器学习技术。通常，我手工制作了特性工程，但在这种情况下，我有很多专栏要处理。我想构建一个Python函数，该函数： 1)在每一列中找到NaN值(我想过df.isnull().any() ) 2)对于每个NaN值，将其替换为已找到NaN值的列的平均值。我的想法是这样的： def replace(value): for value in train: if train['value'].isnull():

浏览 1提问于2018-07-06得票数 3

回答已采纳

1回答

返回无值的Dataframe

python、pandas、indexing、multiple-columns、nan

我正在返回一个数据，从得到的字符，他们是这样活着，并预测死亡，但只有当他们有什么房子的名字。(重要人物)。我原以为它会跳过南的，但它也会把它们还给我。我附上了输出的截图。请帮帮忙。另外，我没有附加任何破坏者，所以你可以继续。 import pandas df=pandas.read_csv('character-predictions.csv') a=df[((df['actual']==1) & (df['pred']==0)) & (df['house'] !=None)] b=a[['name

浏览 3提问于2016-09-29得票数 3

回答已采纳

3回答

如何在Pandas <NA>中用NaN替换DataFrame？

python、pandas

我的DataFrame中的一些列具有<NA>的实例，这些实例的类型为pandas._libs.missing.NAType。我想用NaN替换它们，使用np.nan。我看到了一些问题，在使用<NA>时，可以替换pd.read_csv()的实例。但是，由于我的Pandas DataFrame是从火花DataFrame创建的，所以我不使用pd.read_csv()函数。请指点。

浏览 4提问于2021-09-27得票数 5

2回答