我正在使用Python进行一个小项目,并且遇到了以下问题:
我有一个表,其中A列包含多个并且可能是非唯一值,第二列B包含可能为零的值。现在,我希望根据A列中所有行的值对DataFrame中的所有行进行分组,然后只对B列中包含一个或多个零的组进行“保持”或“选择”。
例如,从如下所示的DataFrame中:
Column A Column B
-------- --------
b 12
c 56
f 0
b 456
b 334
f 10
我只对列A=f的所有行(组
我在python pandas中有一个DataFrame,它包含几个不同的条目(行),这些条目(行)在列中也具有整数值,例如:
A B C D E F G H
0 1 2 1 0 1 2 1 2
1 0 1 1 1 1 2 1 2
2 1 2 1 2 1 2 1 3
3 0 1 1 1 1 2 1 2
4 2 2 1 2 1 2 1 3
我将只返回列中包含常用值的行,结果应该是:
A B C D E F G H
1 0 1 1 1 1 2 1 2
3
我在Python中有一个dataframe,它由1行但100列组成。看起来是这样的:
_id d.0.id d.0.name d.0.dep.id d.0.dep.name d.0.dep.1.id d.0.dep.1.name ....
A B C D E F G
我需要以以下方式将dataframe转换为csv文件:
_id d.0.id d.0.name d.dep.id d.dep.name
A B C D
我有几个字文档,在读到数据文件之前,我把这些文档转换成字符串。每个dataframe只有一列宽,但有许多行长。它们看起来都是这样的:
0| this document is a survey
1| please fill in fully
2| Send back to address on the bottom of the sheet
etc....
每个dataframe的开头都是胡言乱语,我不需要这样做,所以我需要删除行之前的所有行,其中包含值‘质询’。但是,对于每个dataframe,它并不位于相同的索引上,所以我不能只删除前20行,因为它会对每个dataframe产生不同的影响。
我有一个熊猫dataframe (至少)两列:id,value,可能还有更多。id不是唯一的。我需要过滤数据,以便每个id只保留一行。我要选择的行是值不是NaN的行。保证最多有一个这样的行。对于那些在值列中包含所有NaN的id,我不关心选择哪一行。实现这一点的最好方法是什么?
示例:如果数据文件是
id other value
0 0 3.14
0 1 NaN
1 2 NaN
1 3 NaN
结果可能是
id other value
0 0 3.14
1 2 NaN
或
id other value
0 0 3.14
1
如何在python dataframe中随机选择和赋值给给定的行数。列B只包含1和0。假设我有一个数据帧,如下 Col A Col B
A 0
B 0
A 0
B 0
C 0
A 0
B 0
C 0
D 0
A 0 我的目标是随机选择5%的行,并将列B的值更改为1。我看到了df.sample(),但这不允许我就地更改列数据
在向这个DataFrame添加一个新列之后,当我将一个新行添加到预先分配的DataFrame时,我有一个意想不到的行为。
我创建了以下最小示例(使用Python3.6.5和Panda 0.23.0):
首先,我创建了一个具有3列的预先分配的DataFrame。
import pandas as pd
df = pd.DataFrame(columns=('A', 'B', 'C'), index=range(5))
# The resulting DataFrame df
# A B C
#0 NaN NaN NaN