在编写代码以获得10、50和90分位数时,我一直在苦苦挣扎(一个分位数是将样本分成等号的地方)。每一行都是不同的示例。此数据帧中的数据是每个类标记(列中表示)的频率。
import pandas as pd
main_folder = r'c:user/sherwood/documents/data.csv'
datos = pd.read_csv(main_folder)
datos.head()
output[1]:
'sample_number' 'classmark1' 'classmark2' 'classmark3' ...
0.37 0.44 0.52
1 freq1_1 freq1_2 freq1_3
2 freq2_1 freq2_2 freq2_3
3 freq3_1 freq3_2 freq3_3
.
.
.分类分数分别为0.37、0.44、0.52等。请注意,类的宽度沿分布既不已知也不相等。下面是excel中的数据 (右侧列是示例,但不在数据帧中使用)
我想知道如何通过将类标记作为标题来获得每一行的分位数10、50和90 。
(在统计中,类标记是类间隔内的值,尤指它的中点或最近的积分值,用于表示该区间以便于计算)。
发布于 2020-06-21 06:19:29
尝试使用.describe()
import pandas as pd
main_folder = r'c:user/sherwood/documents/data.csv'
datos = pd.read_csv(main_folder)
datos.describe(percentiles = [0.1,0.5,0.9]).filter( regex = '%',axis = 0)https://stackoverflow.com/questions/62494723
复制相似问题