为pandas中的不同列填充不同的缺失值_同时填充pandas dataframe中相关列的缺失值_用Pandas填充缺失的值 - 腾讯云开发者社区

machine-learning、feature-extraction、kaggle、sklearn-pandas

我研究了特征工程中Kaggle的fill null方法。一些玩家用另一个对象值填充NA。例如，在性别列中有‘男性’、‘女性’和NA值。该方法是用另一个对象值填充NA，比如“中间”。在此之后，它处理没有任何null的性别属性，pandas也不会找到null。我想知道这种方法对机器学习模型的性能有很好的影响，还是对特征工程有很好的影响？除此之外，在数据集中没有知识发现的情况下，有没有其他好的方法来填充NA？

浏览 0提问于2016-12-05得票数 1

1回答

从多列概念在pandas中的列中填充na

python、pandas

我喜欢在pandas dataframe中填充na，其中dataframe中的两列都在同一行上。 A B C 2 3 5 Nan nan 7 4 7 9 Nan 4 9 12 5 8 Nan Nan 6 在上面的数据框中，我希望将列A和列B都有Nan的行替换为“不可用”。因此： A B C 2 3 5 Not available not available 7 4 7 9 Nan 4 9 12 5 8 Not available not available 6 我尝试了多种方法，但得到了不想要的结果

浏览 16提问于2020-10-12得票数 0

1回答

合并熊猫DataFrame中的两列

python、pandas、dataframe

给定以下DataFrame A B 0 -10.0 NaN 1 NaN 20.0 2 -30.0 NaN 我希望合并列A和B，用来自列B的值填充列A中的NaN单元格，然后删除列B，从而生成如下所示的DataFrame： A 0 -10.0 1 20.0 2 -30.0 我通过使用iterrows()函数解决了这个问题。完整的代码示例： import numpy as np import pandas as pd example_data = [[-10, np.NaN], [np.NaN, 20], [-30, np.NaN]] exampl

浏览 0提问于2019-05-08得票数 1

回答已采纳

2回答

填充缺失的值并进行规范化

keras、pandas、normalization、missing-data、numpy

我有两列神经网络的训练数据，它们都是缺失的值。(还有许多其他列不缺少值。) 例如 Height | Weight 180 | 70 175 | N/A N/A | N/A 我希望填充缺失的值，并将列规范化。数据是高度和权重，所以我认为一个很好的填充值应该是0或-1。这是基于Python中的深度学习一书：通常，对于神经网络，输入缺失值为0是安全的，条件是0不是有意义的值。我假设0在值为150-200的数据集中没有意义。我还被建议通过减去每一列的平均值并除以std来规范数据。这两种方法都很好--我知道怎么做和为什么要这样做。我不明白的是如何把它们结合起来。我也可

浏览 0提问于2018-07-26得票数 8

2回答

如何使用scikit learn中缺失的XGBRegressor参数

python、scikit-learn、xgboost

我正在处理一个在某些列中包含缺失值的数据集。我正在尝试使用XGBoost的Scikit-Learn包装器接口的XGBRegressor。在那里，它提供了一个名为'missing‘的参数，你可以在其中输入浮点值，否则它会将python的NaN作为默认值。因此，我需要一些帮助，比如如何使用此参数来填充数据集中列的缺失值。如果能给我提供一个简单的例子，那将是很有帮助的。

浏览 23提问于2017-02-09得票数 0

回答已采纳

1回答

用上面的数据填充空白单元格

python、pandas

我有如下数据： | ID | Name | Inv | Date | Value | PO | Type | Rate | Tax | Integ | |----------|-----------|-----|------------|-------|-----|-------|-------|-------|-------| | DEADBEEF | CHEMICALS | 321 | 19-11-2017 | 14288 | UK | State | 0.00% | 3000 | 0 | | |

浏览 0提问于2018-11-25得票数 2

回答已采纳

4回答

如何将具有(NULL)值的列更新为mysql中的“A”

mysql、default

我的表中的一个列user_form中填充了(NULL)值。现在，我想用这个代码UPDATE table_name SET user_form='A' where user_form=(NULL)将这个NULL更改为'A‘，但是没有运气。我还试图更改列默认值。但还是没有运气

浏览 5提问于2013-12-21得票数 1

回答已采纳

1回答

按列名合并两个cvs文件

python、pandas、csv

我尝试按列合并两个CVS文件，但遇到错误。 import os import pandas as pd os.chdir('/home/yovel/PycharmProjects/fantasyfinal') a = pd.read_csv("statsmerger.csv") b = pd.read_csv("team.csv") b = b.dropna(axis=1) merged = a.merge(b, on = 'player') merged.to_csv("output1.csv", index

浏览 17提问于2019-10-21得票数 0

1回答

使用Python语言中最接近的非NaN列值填充NaN

python、pandas、dataframe

我想用最接近的(从左侧开始) e列的值填充not NaN列的NaN。 a b c d e 0 1 2.0 3.0 6.0 3.0 1 3 5.0 7.0 NaN NaN 2 2 4.0 NaN NaN NaN 3 5 6.0 NaN NaN NaN 4 3 NaN NaN NaN NaN 例如，对于e的第二行，它最接近的Not NaN列是e by position，然后我们以7.0为例，在Pandas中可以这样做吗？谢谢。预期输出如下所示： a b c d e 0 1 2.0

浏览 13提问于2020-02-07得票数 1

回答已采纳

1回答

通过将x添加到前一行熊猫来填充na值

python、pandas、dataframe

我有一个数据框架，它有一个名为SAM的列，它包含以下数据 SAM 3 5 9 Nan Nan 24 40 Nan 57 现在，我想分别在12、15和43值中插入Nan (因为9+3=12、12+3=15和40+3=43)。换句话说，通过将Nan添加到上一行(也可以是Nan)来填充任何3行。我知道这可以通过遍历for循环来完成。但我们能用矢量化的方式做吗？就像ffill的一些修改版本(如果我们没有连续的NaNs，它可以在这里使用)，在pandas.fillna()中。

浏览 1提问于2016-12-14得票数 6

回答已采纳

4回答

如何处理熊猫DataFrame中的缺失值？

python、python-3.x、pandas、dataframe、missing-data

我有一个Pandas Dataframe，它有一些缺失值。我想用一些不会影响统计数据的东西来填充缺失的值，这是我将对数据执行的操作。举个例子，如果在Excel中，你尝试对一个包含5个单元格和一个空单元格的单元格求平均值，那么平均值将是5。我希望在Python中也是如此。我尝试用NaN填充，但是如果我对某一列求和，例如，结果是NaN。我也尝试用None填充，但得到了一个错误，因为我对不同的数据类型求和。有人能帮忙吗？提前谢谢你。

浏览 25提问于2019-02-11得票数 0

回答已采纳

1回答

列缺失值时对Sklearn输入计算机的预处理

python、scikit-learn、preprocessor

我试着用Imputer来表示缺失的值。我想跟踪所有缺失值的列，但因为我不知道它们中有哪些(列)已经被处理过:是否也可以返回所有缺失值的列？归责注当axis=0时，只包含fit缺失值的列在转换时被丢弃。当axis=1时，如果有无法填充缺失值的行(例如，因为它们只包含缺失的值)，则会引发异常。 import pandas as pd import numpy as np from sklearn.preprocessing import Imputer data={'b1':[1,2,3,4,5],'b2':[1,2,4,4,0],'b3'

浏览 0提问于2018-06-14得票数 1

回答已采纳

1回答

如何在C#数据帧中转发填充缺失的值

c#、dataframe、missing-data、deedle

我试图在Deedle C#数据框架中转发fill值，就像在python中使用pandas.ffill()函数一样。熊猫的前填充，允许在行索引和列索引中向前填充。我希望在Deedle中也这样做，在同一行中取最近的无缺失值，但从不同的列取，所以跨行，这在python和大熊猫中非常简单。我对C#和Deedle库都很陌生，我在文档中所能找到的就是如何在不跨数据框架的系列中转发填充值。任何帮助都是非常感谢的，我对此很陌生，而且我似乎在任何地方都找不到这个库的任何实质性示例。这是我的数据框架的一个例子，我正试图跨行转发填充值。因此，col3中缺失值的填充值将成为col2等行中的最后一个值。 ------

浏览 0提问于2019-08-18得票数 2

回答已采纳

2回答

Pandas:对NaN值进行`or`操作

python、pandas、dataframe

我有一个包含3列的DataFrame，这样每一列都可以有一个值NaN。我想根据这3个值填充第4列，以便对这些列应用or操作:如果第一列不是NaN，则获取它的值，否则检查第二列，依此类推。因为NaN值不是False，所以不能按原样使用or运算符。这是我附带的代码，但它不是Pythonic式的或者Pandas式的。有没有内置的函数可以做到这一点？或者，如果你有任何其他的建议？ import pandas as pd import numpy as np nan = np.NaN df = pd.DataFrame({"a": [nan, 1, nan], "b"

浏览 22提问于2021-07-06得票数 1

回答已采纳

3回答

用0填充缺失值或任何常数项(如-999 )之间有什么区别？

machine-learning

大多数教科书说，要填充缺失的值，使用的是均值/中值(数字)和最频繁的(分类)，但我使用的是一个数据集，它有太多的缺失值，而且我不能删除这些列，因为它们很重要。 train.isnull().sum() TransactionID 0 isFraud 0 TransactionDT 0 TransactionAmt 0 ProductCD 0 ... id_36 449555 id_37 44955

浏览 0提问于2020-03-17得票数 0

回答已采纳

1回答

excel中的合并单元格成为pandas中的NaN

python、excel、pandas

如何将这样格式的excel文件读入pandas DataFrame？ a b c d e f Type 1 22 Car Yes 2019 Train Yes Type 2 25 Car No 2018 Notype 1 Car Yes 2019 Train 第一行有三列，它们是合并的单元格(2行)，而其余的是单独的行问题是如果我用 data = pd.read_excel("excel

浏览 23提问于2019-09-02得票数 0

回答已采纳

2回答

使用Python中Panda的“loc”函数计算缺失值时出错

python、pandas、machine-learning

我试图使用Panda库的'loc‘函数在dataset中的一个列中计算缺少的值，但是代码没有成功执行。代码行如下所示。 # Impute missing data by mean weight of each sub-category in 'Item_Weight' column data.loc[miss_bool,'Item_Weight'] = data.loc[miss_bool,'Item_Identifier'].apply(lambda x: item_avg_weight[x]) 正在生成的错误如下， data.loc

浏览 0提问于2018-08-01得票数 1

2回答

从Dataframe对象-python筛选字符串和整数值

python、excel、pandas

我想在一个列中实现对excel文件的操作，该列有字符串和整数数据，但该列是对象类型。我的数据在Excel中如下所示：(字符串和数字的组合) Time Spent 3600 0 None 1800 0 我尝试了下面的代码 if (df['Time Spent']=='None').all(): df['Time Spent'] = 0 else: df['Time Spent'] = df['Time Spent'].astype('int')/3600 我所犯的错误 Index

浏览 1提问于2019-07-07得票数 3

回答已采纳

1回答

通过对包含另一列中字符串值的子集的字典进行映射来创建dataframe列。作为它的关键

python、pandas、dataframe、dictionary

我有一个字典商店，它将outlet的名称作为键，将outlet的种类作为其值 stores = {'McDonalds':'Fast food','African and Eastern Beverage':'Alcohol','Baskin Robbins': 'ice Cream'} 我有一个pandas数据帧，其中包含插座的名称和分支位置(在Merchant列中)，其中一些包含MerchantType的NaN值我需要使用商店字典填充那些具有NaN值并匹配商家类型的行的MerchantTyp

浏览 13提问于2019-02-11得票数 1

回答已采纳

1回答

从稀疏数据集中删除列和行

python、pandas

我有一个包含许多空值的稀疏Pandas数据帧，我希望对其进行过滤，以便在最终数据集中只保留具有超过10个浮点型条目的行和列。我尝试使用现有的代码片段，但似乎不起作用： df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True) 谁能告诉我在我的数据帧中删除稀疏列的最好方法是什么？

浏览 16提问于2020-06-29得票数 3

1回答

在Pandas中将分类要素转换为数值要素时出错

python、pandas、scikit-learn

我的数据帧包含一个分类特征'Street‘，它可以接受两个可能的值'Grvl’或'Pave‘中的一个。我正在尝试在拟合ML算法之前将这个分类特征转换为数值。我的代码如下所示 dataset['Street']=dataset['Street'].map({'Grvl':0,'Pave':1}).astype(int) 我已经用数据帧中出现次数最多的值填充了缺少的值 dataset['Street'].isnull().sum() 我收到以下错误 ValueError

浏览 6提问于2017-07-25得票数 1

1回答

如何检查一个dataframe列中的值是否包含在另一个完整列中？

pandas、dataframe

在我的项目中，我需要检查整个dataframe列中是否存在一些值。示例dataframe： df=pd.DataFrame([['abc', 'a'], ['def', 'x'], ['aef', 'f']]) df.columns=['a', 'b'] >>>df a b 0 abc a 1 def x 2 aef f 这个静态代码运行良好： df['a'].str.contains('f')

浏览 0提问于2019-09-25得票数 1

回答已采纳

1回答

向后填充dataframe列，其中行填充的限制是基于单元格的值，可能是使用bfill()和limit=x

python、pandas

我有一个像这样的数据文件： import pandas as pd, numpy as np df = pd.DataFrame({'Fill' : [0, 0, 0, 3, 0, 0, 0, 2, 0, 0, 1]}) df['flag'] = (df['Fill'] > 0) df = df.replace(0,np.nan) df Fill flag 0 NaN False 1 NaN False 2 NaN False 3 3.0 True 4 NaN Fa

浏览 0提问于2020-07-08得票数 1

回答已采纳

3回答

如何用不同的随机值替换单元格中的NaN值

python、pandas

我试图使用标准偏差从单个列(然后从多个列)填充空单元格。我见过几种解释，但到目前为止还没有看到任何与这个问题直接相关的解释。提前谢谢您的时间！以下是我到目前为止所拥有的：为了获得随机值，我首先计算了Math列的平均值： filename = os.path.join(os.path.dirname(__file__),'exam.csv') data = pd.read_csv(filename) math_mean = data['Math'].mean() print(math_mean) The output of that is 73.625 然后

浏览 0提问于2021-09-21得票数 1

回答已采纳

1回答

Python2.7熊猫填补丢失的数字/系列

python-2.7、pandas

这是一张短桌。 ID,NUMBER,DEVICE A,103,L A,104,L B,101,L B,102,D C,101,V C,102,V C,103,L C,104,L 这里的目标是为每个唯一的"ID“输出”设备“模式。在“数字”一栏中总共应有4个数字: 101,102,103,104。如果缺少"NUMBER“列，则在"DEVICE”列中填写"N“。例如，在"A“ID中缺少101和102，因此我们想以下列方式填写： ID,NUMBER,DEVICE A,101,N A,102,N A,103,L A,104,L 这里的目标是为每个唯一的"

浏览 3提问于2015-12-29得票数 2

回答已采纳

2回答

如何使用pandas在一些列上做ffil？

python、python-3.x、excel、pandas

如何在一些栏目上做ffil？我不需要ffil每一列，我想留下最后一列。 My input和Desired Output 这段代码将对每个列和表执行ffill操作。但我不需要对每个工作表的最后一列执行ffill操作。 import pandas as pd writer = pd.ExcelFile('C:/Users/User/Desktop/law.xlsx') writer.sheet_names excelfile = pd.ExcelWriter('C:/Users/User/Desktop/law_out.xlsx', engine='

浏览 16提问于2020-09-07得票数 1

回答已采纳

2回答

熊猫如何从另一行中插入值

python、pandas、dataframe

我有个数据： import pandas as pd data = {'fruit': ['pear','pear','banana', 'pear', 'pear','apple', 'apple', 'cherry','cherry'], 'fruit_type': ['unknown','pear','unknown', 'unknown

浏览 3提问于2021-07-26得票数 1

回答已采纳

1回答

检查两个数据帧(数据透视表)的相似性

python、pandas

我正在努力检查具有相同行和列索引的两个pandas数据透视表(填充值1和Nan)之间的相似性百分比。我想计算相同的行数，并将它们除以总行数。给出基本的例子： df1 column1 column2 column3 idx1 Nan 1 Nan idx2 1 Nan 1 idx3 Nan Nan 1 df1 column1 column2 column3 idx1 1 Nan 1 i

浏览 5提问于2021-03-09得票数 1

回答已采纳

1回答

Pandas DataFrame中值与上一行的比较

python、pandas

<code>A0</code> 我有下面的col1 DataFrame，我想创建另一个列来比较Pandas的前一行，看看该行的值是否大于前一行的值。它应该如下所示： <code>A1</code> 谢谢。

浏览 31提问于2020-11-16得票数 3

回答已采纳

5回答

让pandas.read_csv将空值作为空字符串而不是nan读取

python、csv、pandas

我正在使用pandas库来读取一些CSV数据。在我的数据中，某些列包含字符串。字符串"nan"是一个可能的值，也是一个空字符串。我设法让pandas将" NaN“读取为字符串，但我不知道如何让它不将空值读取为NaN。以下是示例数据和输出 One,Two,Three a,1,one b,2,two ,3,three d,4,nan e,5,five nan,6, g,7,seven >>> pandas.read_csv('test.csv', na_values={'One': [], "Three":

浏览 1提问于2012-06-03得票数 133

回答已采纳

2回答

熊猫组在1.1.0填充物后滴下组栏

python、pandas、pandas-groupby

我有一段熊猫代码，用于1.0.5版。下面是我的问题的一个简单的、独立的例子： import pandas as pd df = pd.DataFrame(data=[ ('bk1', 10), ('bk1', None), ('bk1', 13), ('bk1', None), ('bk2', None), ('bk2', 14), ('bk3', 12), ('bk3', None), ], colu

浏览 1提问于2020-08-05得票数 5

回答已采纳

1回答

Python3 -返回包含行级错误的丢失数据的CSV

python-3.x、pandas、csv

Python新手。我正在导入一个CSV，如果有任何数据丢失，我需要返回一个带有附加列的CSV，以指示哪些行缺少数据。我的同事建议我将CSV导入到一个数据帧中，然后创建一个带有"Comments“列的新数据帧，在其中填充对目标行的注释，并将其附加到原始数据帧中。我陷入了使用与"dfinput“匹配的正确行数填充新的dataframe "dferr”的步骤。我搜索过"pandas csv return error column where data is missing"，但没有找到任何与创建标记坏行的新CSV相关的内容。我甚至不知道提出的方法是不是最好

浏览 14提问于2019-05-28得票数 0

回答已采纳

2回答

不同栏大熊猫不同条件下的过滤

python、pandas、dataframe

Python 3.9和Pandas 1.3.4 这里是df： 1 First Name Last Name fullname 2 Freddie Mercury Freddie Mercury 3 John Lennon John Lennon 4 David Bowie David Bowie 5 John Doe 6 Joseph Joseph 7 Jovi Jovi 我的代码目前只发现f

浏览 7提问于2021-11-23得票数 1

回答已采纳

1回答

合并python中一列中的多列

python、pandas、dataframe、row

我有一个熊猫数据框架，第一列的总数在第二列中完成，第二和第三列的总数相同： Column1 Column2 Column3 0 3 1 2 2 1 6 3 7 13 我现在要做的是将所有列(1,2,3)合并为A列(忽略总价值)，如下所示： Column A 0 3 1

浏览 3提问于2021-12-16得票数 1

回答已采纳

1回答

熊猫填从最后一行符合一定的标准？

python、pandas、data-science

我有一只熊猫，它的部分看起来像这样(0是NaN的)： ... 18 19 20 197 14 28 14 198 14 0 14 200 0 0 0 201 0 0 0 202 15 23 12 203 16 0 18 204 0 0 0 205 0 0 0 ... 我需要用最后一行的值填充在特定列上有NaN的行，后者在这些列上没有NaN。在我的示例中，行200,201将使用来自第197行的值填充，而从第202行的第204 205行填充。 LE:第198行和第203行并不是在我感兴趣的所有列中都有Na

浏览 1提问于2019-03-03得票数 3

回答已采纳

2回答

熊猫从字典中提取DataFrame和嵌套字典列表

python、dictionary、pandas、dataframe

my_dict = { 'company_a': [], 'company_b': [ {'gender': 'Male', 'investor': True, 'name': 'xyz', 'title': 'Board Member'} ],

浏览 3提问于2016-04-07得票数 3

回答已采纳

2回答

具有多个缺失值的数据集的相关矩阵

data-cleaning、correlation

我是一个数据科学新手，我想使用Python/ R创建一个相关矩阵(类似于http://www.marketcalls.in/python/quick-start-guide-compute-correlation-matrix-using-nsepy-pandas-python.html)，并构建一个机器学习模型。然而，我有一些问题，并希望得到一些指导。问题1:虽然数据文件很大，有超过35万个条目，但一些列遗漏了许多值(即60%/ 70%的值丢失)。我想知道我是否应该放弃那些列/删除那些行/任何其他伟大的建议？什么是好的阈值，是否可以继续使用20%？30%？40%值的列。非常感谢。非常感谢

浏览 0提问于2017-07-27得票数 0

1回答

插值一个级数，并输出第二个(常数)级数的常数。

python、pandas、dataframe、missing-data

我试图创建一个函数，用不同的数值尺度，在多个序列中填充缺失的数字，同时为每个系列生成一个常量列。 from tika import parser import pandas as pd import numpy as np import io rawtext = parser.from_file('D:\Selenium\Texto.txt') text = rawtext['content'] f = io.StringIO(text) f.readline() data = f.read() f.readline() def fill(d): id

浏览 1提问于2020-09-13得票数 3

回答已采纳

1回答

Pandas:在进行sum()，mean()操作时忽略特定的(坏的)单元

python-3.x、pandas、dataframe

我想使用python中的pandas库对'number‘列执行sum，mean操作，但有些单元格包含错误的数据(2020-05-30)或它们是空的。如何忽略这些单元格？ number 25 1 12 2020-05-30 6 7 ... 谢谢。

浏览 2提问于2020-11-12得票数 0

1回答

Pandas dataframe评估/排名

python、pandas、ranking

我有Pandas DataFrame，在这里我导入了包含几百行的Excel电子表格。每行都是一个公司名称，在每一列中都有一些基本数据，如比率等。 Symbol Name P/BV PE NCB A AGT 4.382 42.59 0.0145 AAAP AdvAc 6.91 NaN -0.0003 AAME AtlAm 0.6205 29.55 0.0089 AAN Aaron 2.093 23.89 0.0213 更多的列和更多的行，但我认为这足以说明数据。有时，没有值的比率，所以自动有填充的NaN值。我想做的是评估每一

浏览 4提问于2017-09-18得票数 0

回答已采纳

3回答

根据其他列的条件填充空熊猫列

python、pandas、dataframe

假设我有以下玩具dataframe： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name', 'Age']) # print dataframe. df 我创建了一个空列，我想

浏览 1提问于2019-08-15得票数 4

1回答

Pandas DataFrame计数函数中重复数据和错误名称的结果

python、pandas、dataframe、count

我有一个关于Pandas DataFrame count函数的问题。我正在编写以下代码： d = {'c1': [1, 1, 1, 1, 1], 'c2': [1, 1, 1, 1, 1], 'c3': [1, 1, 1, 1, 1], 'Animal': ["Cat", "Cat", "Dog", "Cat", "Dog"]} import pandas as pd df = pd.DataFrame(data=d) 最后，我使用了DataFram

浏览 3提问于2020-10-26得票数 0

1回答

Python:用唯一的列值填充空行的Dataframe

python-3.x、pandas、dataframe、unique、fillna

获得Dataframe df State Item Space Date AAA Grape 0.125 2022-02-11 Beans 0.0 AAA Mango 0.25 2022-02-11 AAA Beetroot 0.375 2022-02-11 Carrot 0.5 需要用该列的唯一值填充行中的空值。试过df['State'].fillna(df['State'].unique(), inplace=Tru

浏览 7提问于2022-02-18得票数 0

3回答

如何按分组填写缺失值？

stata、missing-data

我有以下数据结构。在每组中，一些观察结果缺少value。我知道每个组只有一个非缺失值(在本例中，组1的值为10，组2的值为11 )。缺失观察值的位置在组内是随机的(即不能用前一个/后一个值填充缺失值)。如何通过分组用一个非缺失值来填充缺失值？ group value 1 . 1 10 1 . 2 11 2 . 2 11 我目前的解决方案是循环，但我怀疑有一些聪明的bysort可以使用。 levelsof group, local(lm_group) foreach group in `lm_group' {

浏览 3提问于2015-12-03得票数 4

2回答

熊猫- iloc与下面的细胞进行比较

python、pandas、lambda、calculated-columns

下表：使用Pandas -我希望实现desired_output列，当当前单元格下的值i不同时，这是正确的-否则为FALSE。我已经尝试了以下代码--但是会发生错误。 df['desired_output']=df.two.apply(lambda x: True if df.iloc[int(x),1]==df.iloc[int(x+1),1] else False)

浏览 4提问于2020-08-16得票数 0

回答已采纳

2回答

数字栏中的SAS、Char和数字类型

sas

我希望你能帮助解决下面的问题。我有一个带有Char列的数据集，例如“000000036”、“C”、“M”等。我想将该列转换为数字列，上面的示例显示为36、C、M等。谢谢托普

浏览 9提问于2016-11-04得票数 0

回答已采纳

1回答

寻找根据R中其他值的比率来估算缺失值的函数(寻找基于概率的)

r、imputation

我有一个超过9000个数据点的数据框，有3列有近1000个(每列)缺失值。我不是在寻找最常用的方法(value=1000)，我找到了缺失的value=1000(每一列)，我尝试在那一列中根据它们的proportion.Suppose来分配其他行的值，其中一列的"a“和"b”的比例是50:50，还有4个缺失值，我会根据2a和2b的比例来填充那些缺失值。

浏览 0提问于2019-08-05得票数 0

2回答

Pandas.DataFrame interpolate() with method='linear‘和'nearest’返回不一致的后续NaN结果

python、pandas、interpolation

我使用不同的方法探索pandas.DataFrame.interpolate()，linear和nearest，当尾部有缺失数据时，我发现这两种方法的输出不同。例如： import pandas as pd # version: '0.16.2' or '0.20.3' >>> a = pd.DataFrame({'col1': [np.nan, 1, np.nan, 3, np.nan, 5, np.nan]}) Out[1]: col1 0 NaN 1 1.0 2 NaN 3 3.0 4 Na

浏览 82提问于2019-02-21得票数 3

回答已采纳

1回答

断言不等于的相同的Dataframes - Python Pandas

python、unit-testing、pandas、dataframe、python-unittest

我正在尝试对我的代码进行单元测试。我有一个方法，给出一个MySQL查询，将结果作为一个熊猫数据返回。注意，在数据库中，created和external_id中的所有返回值都为NULL。下面是一个测试： def test_get_data(self): ### SET UP self.report._query = "SELECT * FROM floor LIMIT 3"; self.report._columns = ['id', 'facility_id', 'name', 'created

浏览 1提问于2017-06-06得票数 2

回答已采纳

1回答

熊猫检查多个最小后果准则

python、pandas、dataframe、criteria、minimum

我有一个场景，我想检查一个列(Col1)中连续的pandas数据帧行是否满足最小标准(0.6)，当起始值至少为(0.7)时，它也满足一个标准，即： Col1 0.3 0.5 0.55 0.8 = true 0.65 = true 0.9 = true 0.61 = true 0.3 0.6 0.67 0.74 = true 0.63 = true 0.61 = true 换句话说，如果值至少为0.7，或者如果值至少为0.6且之前的值至少为0.6且连续序列中的第一个值至少为0.7，则检查将为True。它将运行在一个非常大的数据集上，因此需要高效。我在想，shift()有点问题，work...b

浏览 1提问于2016-11-02得票数 0