我想用x和y轴画一个散点图,x轴分组。X轴将分为三种类型(例如h、o、c),这些类型可由ID列标识。Y轴将有每个ID的平均值。
以下是样本数据:
id sum mean color type
0 109 2852 5.301115 r h
1 110 3162 5.877323 r h
2 111 1997 3.711896 b o
Y轴为“平均值”列值,X轴为"id“值。当我在下面运行我的代码时,它会生成一个错误:
File "pand
假设我有一个名为df的数据框架,如下所示:
id x y
1 10 A
2 12 B
3 10 B
4 4 C
5 9 A
6 15 A
7 6 B
现在我想将数据按y列分组,并得到每个组的2个最大值(x)的平均值,其结果如下
y
A (10+15)/2 = 12.5
B (12 + 10)/2 = 11
C 4
如果我试着用df.groupby('y')['x'].nlar
在我的项目中,我需要检查整个dataframe列中是否存在一些值。示例dataframe:
df=pd.DataFrame([['abc', 'a'], ['def', 'x'], ['aef', 'f']])
df.columns=['a', 'b']
>>>df
a b
0 abc a
1 def x
2 aef f
这个静态代码运行良好:
df['a'].str.contains('f')
我已经在python中创建了一个基本的pandas数据帧,它有多列。我创建的第一个列是包含日期时间信息的多个列中的时间戳。其他列只是每个相应时间的数据。 我希望每隔6小时获得这些值的平均值,然后将这些值作为文本绘制在我使用其他数据创建的线形图中,但在曲线图的顶部(因此在线条内)。 我已经尝试了多种方法,我似乎就是想不出如何从一列中获得6小时的平均值,更不用说开始绘制数值了。 具体地说,我只需要其中两列的6小时平均值,这两列是我用于折线图的两列。对于解决方案,在这种情况下,无论是哪一个都无关紧要。 以防万一。以下是用于创建datetime列的代码。 #convert first time co
我在一个数据帧中有一系列的数据帧。
顶层数据帧的结构如下:
24hr 48hr 72hr
D1 x x x
D2 x x x
D3 x x x
在每种情况下,x都是使用pandas.read_excel()创建的数据帧
每个x数据帧中的一列具有标题‘平均血管长度’,并且在该列中有三个条目(即行、索引)。
我想返回的是“平均血管长度”列的平均值。我还对如何返回该列中的特定单元格感兴趣。我知道有一个用于pandas数据帧的.mean方法,但我不知道使用它的索引语法。
下面是一个例子
import pandas as
我正在使用Pandas操作一个包含多个行和列的csv文件,如下所示
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 .
我得到的字符串如下:
scrap1 =
a le h
ke fd
zyq b
ner i
您会注意到,每行中有两个空格表示一个空格(ASCII32)。我需要找出每一列中的平均ASCII值,而不考虑空格(32)。所以首先我会用double(scrap1)转换成,但是我如何在不考虑空格的情况下求平均值呢?