我很好奇Pandas中是否有预先构建的函数来检查组中的所有成员(列中的因素)是否在另一列中包含相同的值。
也就是说,如果我的数据与下面类似,它将返回一个空列表。
Col1 Col2
2 A
2 A
0 B
0 B
但是,如果我的数据以这种方式出现(注意到Col1中的1):
Col1 Col2
2 A
2 A
0 B
1 B
然后输出将是一个包含对象"B“的列表,因为组B在Col1中有不同的值。
我有这样的数据:
nt
12062 Python Pandas: Create new column out of other columns where value is not null
12063 Python Pandas Create New Column with Groupby().Sum()
12064
12065 Python - Pandas - create “first fail” column from other column data
12066
12067
12068 Creating new column in
我正在使用Pandas操作一个包含多个行和列的csv文件,如下所示
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 .
我有一个大数据集(450万行,35列)。感兴趣的列是company_id (字符串)和company_score (浮点数)。大约有10,000个独特的company_id's。
company_id company_score date_submitted company_region
AA .07 1/1/2017 NW
AB .08 1/2/2017 NE
CD .0003 1/18/20
我有一个有7列的表,每隔几行,就有6列保持不变,只有7列变化。我想将所有这些行合并成一行,并将第7列的值合并到一个列表中。
所以如果我有这个数据
A B C
0 a 1 2
1 b 3 4
2 c 5 6
3 c 7 6
我想将其转化为:
A B C
0 a 1 2
1 b 3 4
2 c [5, 7] 6
因为A和C列的值在第2行和第3行是相同的,所以它们会折叠成一行,B的值将合并成一个列表。
熔化,爆炸和枢轴似乎没有这样的功能。如何使用Pandas来实现这一点?
我希望根据一列将数据帧中的多个行组合成一行 这是我的df的样子: id Name score
0 1234 jim 34
1 5678 james 45
2 4321 Macy 56
3 1234 Jim 78
4 5678 James 80 我想根据列"score“进行组合,这样输出将如下所示: id Name score
0 1234 jim 34,78
1
我有一个Pandas dataframe df,我想要查找其列A的值相同,但列B的值不同的所有行,例如:
| A | B
---|---|---
0 | 2 | x
1 | 2 | y
我知道可以使用pd.concat(g for _, g in df.groupby('A') if len(g) > 1)来获取具有重复A值的行,但是如何添加第二个约束呢?