pandas中有没有一种方法来计算一列中有多少个True或False条件。
例如:如果一个数据框有5列,并且我想选择至少有三列且值大于3的行,可以在不使用迭代器的情况下完成吗?因此,在下面的示例中,我将选择b和c行。
In [12]: df2
Out[12]:
A B C D E
a 1 2 2 8 6
b 3 6 5 8 8
c 6 2 5 5 2
我有一个包含许多空值的稀疏Pandas数据帧,我希望对其进行过滤,以便在最终数据集中只保留具有超过10个浮点型条目的行和列。我尝试使用现有的代码片段,但似乎不起作用: df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True) 谁能告诉我在我的数据帧中删除稀疏列的最好方法是什么?
我知道这是个简单的问题,但我对潘达斯很陌生。我想对每一行的单元格进行比较,以查看列中的任何单元格是否大于或小于0.00。
GOOG AAPL XOM IBM Value
2011-01-10 0.0 0.0 0.0 0.0 0.00
2011-01-13 0.0 -1500.0 0.0 4000.0 -61900.00
我知道熊猫是在迭代中建造的。但是,使用下面的代码,我收到了一个错误
for index, row in dataFrame.iterrows():
我正在使用一个包含大量原始数据的特别大的dataframe。我想我已经成功地将我感兴趣的行转换为用pct_changed()更改的%,并将其插入到dataframe中的一个新列中。
在这里,我想比较每一行,只有当百分比超过2%时,才能得到结果。我试过用条件词,但它为我的每一行打印了一行。下面是我正在使用的代码:
import pandas as pd
df=pd.read_csv("tempcsv.csv")
percentile = df['Pressure'].pct_change().fillna(0)
for row in percentile:
我目前有一个pandas dataframe,其中每一行都有一个日期范围,我想计算这个范围内符合某些条件的天数: Item | Date Start | Date End
----------------------
A | 02/01/2019 | 03/02/2019
B | 04/02/2019 | 08/02/2019 例如:2019年1月-2019年的天数或2019年的天数: Item | Date Start | Date End | Days in Jan-2019 | Days in 2019 | Days in Q1 - 2019
------------
我在Pandas中有一个DataFrame,它的列'register'可以是0,也可以是正数,如果'register'中的该行或前面的7行中的任何一行不是0,我希望创建一个新的列'Working',它是1。我试着对它们进行迭代,但是由于它是一个很大的DataFrame,所以工作非常慢。这是我的密码:
df['working'] = 0
for i in range(len(df['register'])):
if df['register'][i] != 0 or \
(i&
我正在使用Pandas操作一个包含多个行和列的csv文件,如下所示
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 .
我有请求日期和提货日期列。它们是相似的,但不是相同的。我目前使用两个独立的查询和pandas来连接这两个数据帧。我使用SQLAlchemy在Flask中运行,因此WHERE中的所有内容都将传递给变量。在DB浏览器中测试过原始SQL之后,我使用text()方法来运行它。我尝试着单独使用sql来获得我想要的输出,但是没有取得任何进展。 SELECT r.PUDate, COUNT(r.PUDate) as trips
FROM requests r
WHERE PULoc IN ("list of location ID's")
AND r.'TO' IN
我有一个函数,可以在熊猫DataFrame上迭代,并在特定的列中删除连续重复的行。之后,我尝试在列表中返回该列的运行和,但我似乎得到了一个关键错误。我不知道这意味着什么。
最低限度守则:
dropRows = [] #stores rows indices to drop
#Sanitize the data to get rid of consecutive duplicates
for indx, val in enumerate(df.removeConsecutives): #for all the values
if(indx == 0): #skip first indx
我正在研究如何将函数应用于熊猫数据栏中的一个列。但是我只想在满足条件的情况下应用这个函数。
import pandas as pd
def example_function(a, b):
return a + b
data = dict(
A = [1, 2],
B = [4, 5],
C = ["A", "B"],
)
example_df = pd.DataFrame(data=data)
因此,我想使用来自A和B的值应用example_function,只有在C列中有"B"的情况下。
有什么想法吗?
我有以下数据。
import pandas as pd
import numpy as np
d ={
'ID1':['abc1','abc2','abc3','abc4','abc5','abc1','abc1','abc1','abc1','abc1','abc2','abc2','abc2','abc3'],
我有一个Pandas数据帧,如下所示, a b c
A 100 60 60
B 90 44 44
A 70 50 50 现在,我想得到列和行的总和,跳过c,如下所示: a b sum
A 170 110 280
B 90 44 134 所以我不知道该怎么办,我有麻烦了,请帮帮我,谢谢大家。 我的示例数据帧是: df = pd.DataFrame(dict(a=[100, 90,70], b=[60, 44,50],c=[60, 44,50]),index=["A", "B","A
基于下面的可复制代码,我有以下数据:
df.tail(10)
open high low close 200MA 20MA Trend
date
2020-12-24 1.3273 1.3384 1.3257 1.3384 1.324826 1.325365 Up
2020-12-25 1.3408 1.3408 1.3268 1.3268 1.324926 1.326240 Up
2020-12-26 1.3268 1