我试图从我的AWS S3桶中的csv文件中绘制加载到木星笔记本中的数据的频率分布。%matplotlib inlineimport numpy as npimport seaborn有373909行数据,只有一列名为 data ,其中包含从-7.80到4.5之间的浮标。
然后,我使用以下方法来计数每个浮点数,并将它们绘制
当我使用displot而不是distplot绘制用于每个循环的Pandas列时,我遇到了问题,而且它只显示了全局分布,而不是基于它的组。假设我有一个名为columns和Pandas‘dataframe n的列名列表,其中有列名class。目标是根据每个类的列显示分发图: if w!=<discarded column>:但是,当
我试图找到中除quality之外的所有列的相关性,然后绘制葡萄酒质量的频率分布。df = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv', s