我正在努力改进我的客户报告的筹款表现,我加入了特定的参考代码,以便能够跟踪电子邮件的表现。我已经成功地加载到我的数据框中,但是我不知道如何选择列的特定实例。 例如,我正在尝试绘制3个参考代码(SAN_20210811_GEN_FDR_X、SAN_20210808_GEN_ENG_X和SAN_20210803_GEN_FDR_X)的性能图。我在我的数据框中加载: import pandas as pd
data = pd.read_excel(r'C:\Users\Sandro\Downloads\SANdata.xlsx')
df = pd.DataFrame(data, c
我想从我的一个Pandas数据框列中创建一个唯一值的计数,然后将具有这些计数的新列添加到我的原始数据框中。我试过几种不同的方法。我创建了一个pandas序列,然后使用value_counts方法计算计数。我尝试将这些值合并回我的原始数据帧,但我希望合并的键在Index(ix/loc)中。
Color Value
Red 100
Red 150
Blue 50
我想返回如下内容:
Color Value Counts
Red 100 2
Red 150 2
Blue 50 1
我有一个Pandas DataFrame,我想要按某个列进行分组。然后,我想对这个分组的数据帧做一个散点图。然而,如果我这样做了,我会得到一个错误,因为我分组的列是无法识别的。 # Data loading, processing and for more
import pandas as pd
import numpy as np
# Visualization
import seaborn as sns
import matplotlib.pyplot as plt
# set seaborn style because it prettier
sns.set()
df = pd.D
我有一个熊猫数据框df,如下所示: Name Hour Activity
A 4 TT
A 3 TT
A 5 UU
B 1 TT
C 1 TT
D 1 TT
D 2 TT
D 3 UU
D 4 UU 下一步是,如果行的Name和Activity列具有相同的值,则获取总和。 例如,对于这种情况,Name: A和Activity: TT将给出7的总和 结果如下所示 TT UU
A 7 5
B 1 0
C 1 0
D
我对Pandas的数据比较陌生,我必须做简单的计算,但到目前为止,我还没有找到一个很好的方法去做。
基本上我拥有的是:
type group amount
1 A real 55
2 A fake 12
3 B real 610
4 B fake 23
5 B real 45
现在,我必须添加一个新的列,它将显示伪造产品在类型总数中所占的百分比。因此,这个表的简单公式是A 12 / (55 + 12)
我有一个下面的数据框
df=pd.DataFrame({"A":np.random.randint(1,10,9),"B":np.random.randint(1,10,9),"C":list('abbcacded')})
A B C
0 9 6 a
1 2 2 b
2 1 9 b
3 8 2 c
4 7 6 a
5 3 5 c
6 1 3 d
7 9 9 e
8 3 4 d
我想得到下面的分组结果(带有key="C“列),并且有意丢弃了行c、d和e。
我想要一些基于.groupby() in pandas的%的费率。我的目标是取一个指标列Ind,得到A(分子)除以当年的总数(A+B)的比率。
示例数据:
import pandas as pd
import numpy as np
df: pd.DataFrame = pd.DataFrame([['2011','A',1,2,3], ['2011','B',4,5,6],['2012','A',15,20,4],['2012','B',17,12,12]], co
我正在使用Pandas操作一个包含多个行和列的csv文件,如下所示
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 .
我试图找出如何通过在新列上创建百分比和求和来聚合Pandas数据框架中的组。
例如,在下面的数据框架中,我有A、B、C和D列,我想按A中的组进行聚合,而C应该是(频率'1‘除以不缺失值的频率)的一个百分比,而D应该是不缺失值的总和。
例如,对于“foo”组,生成的数据框架应该是
A B C D
foo 1.333 4
我可以在这里和那里做一些单独的部分,但不确定如何编译成一个连贯的脚本:
import pandas
from pandas import DataFrame
import numpy as np
df = DataFrame