pandas -绘制一列的分布_根据目标值绘制pandas数据帧的分布_如何用Pandas Dataframe中的每一列绘制每一列？ - 腾讯云开发者社区

python、pandas、matplotlib、seaborn

我正在尝试在pandas的一列中绘制文本中字符的分布情况。例如： Phrase example1 example1+example2 example 3 example 4 example of sentence and so on.... 因此，我需要确定Phrase列中每个字符串/文本的长度。计算…的长度 df['Phrases length'] = df.Phrase.apply(len) 但后来我意识到，我不知道如何绘制长度分布。我希望你能在这方面提供一些帮助或建议。

浏览 2提问于2021-02-24得票数 0

回答已采纳

3回答

尝试在python中绘制散点矩阵时，“‘Series”对象没有属性“column”

python、python-2.7、pandas、jupyter-notebook、scatter

大家好，我是python新手，正在使用jupyter笔记本，所以如果有任何帮助，我将不胜感激！我在绘制散点矩阵时遇到了问题。我已经导入了我的csv文件，并且我有一个包含药物'Names‘的列。所以我想知道这种药发生了多少次，所以我使用 name = Crimes['drug name'].value_counts() name 这将返回一种特定药物被调用的次数，在我的csv文件中，这一列是“药物名称” 我尝试绘制散点矩阵，如下所示： %matplotlib inline import matplotlib.pyplot as plt from pandas.plott

浏览 0提问于2017-11-22得票数 1

1回答

如何用Python/Pandas转换正态分布？

python、pandas、statistics、regression

我正在寻找一个方便的方式来测试正态分布使用Pandas。 Stata有一个有用的梯子/加法器，用于计算或绘制多个转换。我知道R有一个类似的功能包括在'HH‘包。我想知道是否有一种方法可以用Pandas/Python实现类似的功能？非常感谢!

浏览 3提问于2018-03-11得票数 3

回答已采纳

1回答

pandas中直方图的权重

python、pandas、matplotlib

我有一个pandas dataframe (称之为data)，它具有分类的、连续的值，如下所示： INDEX AGE SEX INCOME COUNTRY INSTANCE_WEIGHT 1 25 M 30000 USA 120 2 53 F 42000 FR 95 3 37 F 22000 USA 140 4 18 M 0 FR 110 . . . 15000 29 F 39000 USA 200 实例权重表示

浏览 0提问于2016-04-13得票数 8

2回答

如何在R中的同一个Box图上从一个数据集绘制两组分类数据

javascript、r、multiple-columns、categorical-data、box

我有一个数据电子表格，其中一列是数字值，另一列是性别，其中是男性或女性。如何使用Boxplot绘制此数据，以便在同一图形上为男性和女性绘制不同的图形？

浏览 19提问于2019-08-13得票数 0

回答已采纳

2回答

变异在机器学习中的重要性

machine-learning、python、unsupervised-learning、variance

从Dataframe中选择一列，使用matplotlib绘制其直方图，然后找到方差是我必须为项目的这一部分采取的步骤。该项目的最终目标是检测数据中的异常。我理解以图形的形式绘制数据的部分，以便更好地理解它。另一方面，我不知道为什么找到这一列的变化如此重要。如果我能得到关于这件事的任何信息，我会非常感激的。我知道方差的定义，但似乎无法理解它在这个项目中的用法和重要性。

浏览 0提问于2020-01-29得票数 2

1回答

如何用Python绘制概率密度函数(PDF)图？

python、normal-distribution、probability-distribution、scipy.stats

我想问一下如何用Python绘制概率密度函数(PDF)图。这是我的密码。 import numpy as np import pandas as pd from pandas import DataFrame import matplotlib.pyplot as plt import scipy.stats as stats 。 x = np.random.normal(50, 3, 1000) source = {"Genotype": ["CV1"]*1000, "AGW": x} df=pd.DataFrame(source) df

浏览 7提问于2022-02-28得票数 2

回答已采纳

1回答

帮助查找异常的激活函数

python、anomaly-detection、activation-function、sigmoid

所以我有一列数据，所有的数据都是正常的，没有任何异常。让我们假设数据就像下面的图片一样分散。 K-means在一列上并不能真正起作用。我得到的建议是绘制数据图，然后使用激活函数，最好是sigmoid (但也可能有其他函数)，以包含其中的大多数数据。在此之后，添加离激活函数更远的异常，然后基本上说，如果一个值离激活函数如此之远(扮演阈值的角色)，则将该值称为异常我正在寻找一些关于这方面的建议，我认为它背后的想法是不坏的。

浏览 24提问于2020-03-07得票数 1

1回答

Python:分组数据的seaborn条形图

python、pandas、seaborn、pandas-groupby

这是我的数据集： ? 我想使用seaborn来绘制每一列，就像pandas默认做的那样： ? 有什么线索吗？提前感谢

浏览 14提问于2019-04-15得票数 0

回答已采纳

1回答

在PySpark中密谋？

apache-spark、pyspark、plotting、dataframe

我一直在寻找在PySpark中绘图的方法。我找不到任何资源来绘制驻留在DataFrame中PySpark中的数据。列出的唯一方法是：通过方法collect()将数据带入‘本地’Python会话并绘制通过方法toPandas()将数据转换为“本地”Pandas数据。问题是，这两者都是非常耗时的函数。是否有任何方法可以直接绘制驻留在Spark会话中的数据(不将其导入本地会话)？

浏览 0提问于2018-09-06得票数 3

回答已采纳

4回答

在seaborn.jointplot中绘制两个分布

python、pandas、matplotlib、seaborn

我有两个pandas数据格式，我想在相同的中绘制。如下所示(命令在IPython shell中为don；ipython --pylab)： import pandas as pd import seaborn as sns iris = sns.load_dataset('iris') df = pd.read_csv('my_dataset.csv') g = sns.jointplot('sepal_length', 'sepal_width', iris) 两个数据流中的密钥是相同的。如何在相同的情节(当然是不同的颜色)中

浏览 12提问于2015-07-21得票数 13

回答已采纳

1回答

不带NaN值空格的Pandas绘图栏

python、pandas、matplotlib、histogram

我有一个包含NaN值的pandas DataFrame。我想用x轴上的索引绘制一个条形图，并为每一列绘制一个条形图，按索引分组。我只想绘制具有实际值的条形图。据我所知，在这个例子中： df = pandas.DataFrame({'foo':[1,None,None], 'bar':[None,2,0.5], 'col': [1,1.5,None]}, index=["A","B","C"]) df.plot.bar() plt.show() 我可以生成这个图：我想要的是删除NaN列的

浏览 3提问于2018-11-21得票数 6

2回答

在pandas数据框上绘制堆叠的柱状图

python、pandas

这是我参加了Wesley在pycon的教程后第一次尝试使用Pandas库。在浏览了一下数据帧之后，我很高兴我能够以我想要的方式处理数据，但在绘制它时遇到了麻烦。我想这也说明了我对matplotlib库的天真。我所拥有的是具有以下数据的pandas Series对象。我想以柱状图的形式绘制，并将第一列('file')作为垂直方向的标签。 sample data here: http://pastebin.com/y2w0uJPQ

浏览 0提问于2012-03-30得票数 5

回答已采纳

6回答

在python中绘制熊猫系列的CDF

python、pandas、series、cdf

有没有办法做到这一点？我似乎不是一种简单的方法来连接pandas系列和绘制CDF。

浏览 186提问于2014-08-30得票数 60

回答已采纳

1回答

Python Pandas Matplotlib :如何在没有数值的情况下绘制图形？

python、python-3.x、pandas、matplotlib

我想使用Pandas数据帧绘制条形图或python中的图形，使用不包含数字的两列。一列是操作系统，另一列是计算机名称，我想在它们之间绘制一个图表，显示哪个操作系统在多少个系统上运行，示例数据如下所示。如何为这两个柱状图绘制条形图或其他图形。当我尝试下面的代码时： ax = dfdefault[['Operating System','Computer Name']].plot(kind='bar') ax.set_xlabel("Hour", fontsize=12) ax.set_ylabel("V"

浏览 34提问于2019-03-29得票数 0

2回答

我们是否可以在matplotlib中绘制一行的特定列与同一行的另一列

python、matplotlib、plot

我正在使用python绘制我的数据集。我想要在同一行的另一列上绘制一行的特定列。准确地说，我希望我的两列是x轴和y轴，然后在该图上绘制用户输入的特定值。 import matplotlib.pyplot as plt import pandas import numpy as np filename = 'friuts.csv' raw_data = open(filename, 'rb') data = pandas.read_csv(raw_data) mydata = pandas.DataFrame(np.random.randn(10,2), col

浏览 2提问于2017-02-17得票数 0

1回答

使用Matplotlib时木星笔记本中的条形图和显示问题

matplotlib、jupyter-notebook、bar-chart、frequency-distribution

我试图从我的AWS S3桶中的csv文件中绘制加载到木星笔记本中的数据的频率分布。 %matplotlib inline import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns bucket = "a_bucket" data_key = "ice_freq.csv" data = f's3://{bucket}/{data_key}' load = pd.DataFrame(pd.read_csv(data)) lo

浏览 2提问于2021-05-29得票数 0

1回答

如何根据已排序的值绘制单个列

python、dataframe、matplotlib

假设我有一个只有一列的dataframe。我对它进行了排序，当我尝试绘制排序值时，绘图是按照索引而不是按排序值绘制的。如何实现基于排序值绘制的绘图？我想要的情节是从顶部下降到底部的曲线。 Ex代码： import pandas as pd import matplotlib.pyplot as plt a=pd.DataFrame() a['col']=(4,5,8,10,1,0,15,20) a_sorted=a.sort_values(by='col',ascending=False) plt.plot(a_s)

浏览 12提问于2019-03-22得票数 1

回答已采纳

1回答

Matplotlib线形图:未显示数据点

python-3.x、matplotlib

我有一个147637行175列的多维数组。现在我只想绘制其中的一列，即最后一列。最后一列在除以下5行之外的所有行中都填充0: 29528、59051、88583、118110、147636。这些行的值为1。下面是我用来绘制的代码： import matplotlib.pyplot as plt workBoundary=-1 fig,(ax1)=plt.subplots(nrows=1,ncols=1) ax1.plot(allPathsDistance[:,workBoundary],color='maroon') plt.show() 以下是输出：请注意x轴。根据这个图

浏览 2提问于2018-02-16得票数 0

2回答

在Python中计算并绘制散点图上95%的数据范围

python、pandas、statistics、scatter-plot、percentile

我希望知道，对于给定的以分钟为单位的预计通勤行程，我可能期望的实际通勤时间范围。例如，如果Google Maps预测我的通勤时间为20分钟，我应该期望的最小和最大通勤时间是多少(可能是95%的范围)？让我们将我的数据导入pandas： %matplotlib inline import pandas as pd commutes = pd.read_csv('https://raw.githubusercontent.com/blokeley/commutes/master/commutes.csv') commutes.tail() 这提供了：我们可以很容易地

浏览 4提问于2017-03-02得票数 1

回答已采纳

1回答

为什么R忽略geom_histogram中的二进制宽度，桶？

r、ggplot2

我试图在dataframe的一列中绘制值的直方图。我尝试设置bin或binwidth，但没有效果。R在建图时说，“忽略未知的参数:平宽、桶、垫”。 ggplot(data=subset(flights, Distance < quantile(flights$Distance, 0.75)))+ geom_histogram(aes(x=Distance), stat='count', binwidth=100) 要绘制的变量是整数的向量，航班的距离。我尝试将数据类型从整数更改为数字。 flights$Distance <- as.numeric(as.cha

浏览 2提问于2017-06-26得票数 1

1回答

熊猫数据栏中单词的频率计数及在其他栏中的存储

python、pandas、text-processing

DataFrame 我有一个Pandas DataFrame的评论栏，如上图所示。我希望获取产品‘’review‘列中每一行中每个单词的计数，并将其存储到另一列，即products' word _ count’。我尝试的代码如下： products['word_count'] = products['review'].apply(lambda x : nltk.FreqDist) 但是，我得到的不是单词计数，而是列中的<class‘word .概率.’>对象！

浏览 1提问于2020-09-30得票数 0

1回答

从嵌套JSON列表绘制图表

python、json、pandas、matplotlib

我试图绘制从CoinGecko API获取的价格数据。为了获取数据本身，我使用了以下命令： mbrp = coingecko.get_coin_market_chart_range_by_id("bitcoin","usd","1577836800","1609459200")["prices"] 该命令的输出如下所示： [[1577836800000, 7195.153895430029],[1577923200000, 7193.7546679601],...,[1609459200000, 29022.418

浏览 9提问于2021-01-14得票数 0

回答已采纳

1回答

在熊猫数据中用for循环迭代列

python、pandas、dataframe、bokeh

我正在尝试从CSV文件中读取数据，并为数据文件中的每一列生成散点图。例如，我用df=pandas.readcsv()阅读了下面的文章 Sample AMP ADP ATP 1A 239847 239084 987374 1B 245098 241210 988950 2A 238759 200554 921032 2B 230029 215408 899804 我想要生成一个散点图，使用样本作为x值，以及每个列的区域。我使用下面的代码与bokeh.plotting一起手动绘制每一列 import pandas from

浏览 3提问于2016-07-01得票数 2

2回答

绘制pandas数据帧的特定行

python、pandas、plot

我有一个包含三列的pandas dataframe，我使用以下代码分别绘制每一列： data.plot(y='value') 它会生成类似下面这样的图形：我需要的是这些值的一个子集，而不是全部。例如，我想绘制500到1000行的值，而不是0到3500行的值。你知道我该怎么告诉plot函数只选择那些吗？谢谢

浏览 3提问于2016-05-20得票数 18

回答已采纳

4回答

如何在pandas dataframe中随机添加Yes/No(比例为7:3)到一列？

python、pandas、dataframe

我有一个数据帧，它由三列组成。我想使用python-pandas将"Yes“或"No”附加到其中一列。而且，Yes:No之间的比例是7:3。有人试过这个吗？？

浏览 1提问于2016-05-20得票数 6

1回答

spyder中的Pandas直方图'by‘参数

python-3.x

尝试从url的数据帧中产生一些直方图，并将它们按数据帧列进行分组。尝试了下面的“by=”，但当在Spyder中运行时，它会运行，并且当它绘制直方图时，它似乎会在下面的每个“spyder”图像上绘制数据。猜想这是因为'by =‘的错误使用吗？显然，是python和pandas的新手 import pandas as pd import urllib.request import csv import matplotlib.pyplot as plt url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/

浏览 0提问于2016-09-27得票数 0

2回答

如何使用pandas在python中绘制直方图中特定范围的值？

python、pandas

我已经从.csv导入了数据。数据中有一列涉及人数。对于每个不同的输入，人数从1到100不等。我的目标是只在直方图上绘制人数少于50人的输入。我知道如何绘制直方图。df‘’people‘.hist() 但是，我如何指定人员的范围？我尝试过df[df‘’people‘< 50].hist()，但没有起作用。我知道这应该很简单，但我就是不明白！这是在使用python和pandas。

浏览 55提问于2021-05-05得票数 0

回答已采纳

3回答

使用matplotlib绘制分类变量的直方图

python、pandas、matplotlib

我在pandas数据框中有一个列，它有三个可能的分类值。当我尝试使用matplotlib中的plt.hist(data['column'])绘制它时，直方图条没有与x轴刻度对齐，它们的间距也不均匀。我该如何解决这个问题呢？

浏览 2提问于2021-04-29得票数 0

1回答

Pandas.plot(subplots=True)，每个子图中有3列

python、pandas、plot

我有一个包含700行和6列的DataFrame： import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(700,6)) 通过调用以下命令，我可以将所有列绘制在一个图中： df.plot() 我可以在一个图中绘制每一列，方法是： df.plot(subplots=True) ，我怎么能有两个子图，每个子图有三个列来自我的DataFrame?!

浏览 4提问于2017-05-17得票数 0

回答已采纳

3回答

绘制R中差异的分布

r、plot

我有一个数据集，其中的数字表示在某种程度上的每日差异。我想创建一个差异的分布图，特别强调罕见的大变化。我尝试使用hist()函数绘制每一列，但它并没有真正提供数据的详细情况。例如，绘制数据集的第一列将生成以下图：我的问题是，这几乎没有给出很少出现的大偏差的细节。做这件事最简单的方法是什么？另外，对于如何在表格中汇总这些数据，有什么建议吗？例如，除了显示最小值、最大值和平均值之外，您还会查看分位数吗？还有其他想法吗？

浏览 1提问于2012-10-24得票数 1

回答已采纳

1回答

如何将pandas.core.series.Series绘制为条形图？

python、pandas

我正在尝试绘制一个pandas系列变量，它在一列中有一个数字id，在下一列中有该id的频率。我希望将这两个绘制为条形图，在y轴上为freq，id为no。在x轴上。然而，有太多的行，即id号。有没有办法我只能画出最常出现的前10个ids？执行这个代码-- area_count.plot.bar会给出这个错误-- <bound method SeriesPlotMethods.bar of <pandas.plotting._core.SeriesPlotMethods object at 0x0000019C68029908>> 我尝试使用以下代码将本系列中的前20个

浏览 24提问于2019-07-21得票数 0

回答已采纳

3回答

按索引对熊猫系列进行排序

python、pandas、sorting

我有一个名为pd的Pandas数据帧，我使用以下命令提取该数据帧其中一列中的唯一值的数量： b = df.groupby('Region').size() B是一个Pandas系列对象，如下所示： In [48]: b Out[48]: Region 0 8 1 25 11 1 2 41 3 23 4 15 5 35 6 24 7 27 8 50 9 55 N 10 我正在尝试绘制此系

浏览 4提问于2013-10-03得票数 9

回答已采纳

1回答

单列和58000列数据的Pandas直方图绘制

python、pandas、numpy、image-processing、histogram

import numpy as np import pandas as pd from PIL import Image hlack_img = Image.open("Henrietta_Lacks.jpg") hlack_arr = np.array(hlack_img) print(hlack_arr.shape) # (290,200) features = np.reshape(hlack_img, (290*200)) hlack_df = pd.DataFrame(np.array([features]), index=['hlack']) pr

浏览 8提问于2022-11-10得票数 0

2回答

Pandas:来自多个列的seaborn countplot

python、pandas、seaborn

我有一个包含几个分类列的数据帧。我知道如何做countplot，它通常绘制一列。问:如何在一张图中绘制所有列的最大计数？下面是一个典型的数据框架来阐明这个问题： import pandas as pd import numpy as np import seaborn as sns testdf=pd.DataFrame(({ 'Ahome' : pd.Categorical(["home"]*10), 'Bsearch' : pd.Categorical(["search&#

浏览 1提问于2018-07-06得票数 5

回答已采纳

0回答

"%H:%M:%S“datetime对象是否可以成为具有相同"%H:%M:%S”格式的数字数据类型？

python、pandas、datetime、numeric

我有一列纪元持续时间。已将其转换为表单%H:%M:%S.中的日期-时间对象但在绘制时，pandas需要数字数据类型。在搜索堆栈溢出后，我只发现将%H:%M:%S更改为秒。有没有办法保留"%H:%M:%S"格式，并将这些日期-时间对象转换为数字？

浏览 4提问于2018-07-20得票数 0

回答已采纳

2回答

Matplotlib的概率密度直方图没有意义

python、matplotlib、histogram、probability-density

我刚刚运行了一个简单的任务，尝试为我运行的模拟绘制概率密度直方图。然而，当我绘制它时，每个bin的概率似乎与频率图的结果不匹配。对于50个存储箱，我预计每个存储箱的平均概率为2%，这在图表中没有反映出来。提前感谢 import pandas as pd import numpy as np import matplotlib.pyplot as plt plntAcres = 88.0 hvstPer = 0.99 hvstAcres = plntAcres*hvstPer yldAcre = np.random.triangular(47,48,49, 10000) carryIn =

浏览 28提问于2017-02-27得票数 7

回答已采纳

2回答

如何从带条件的数据框中绘制图形？

python、dataframe、plot、stock

我有一些期权的数据，我想用看涨或看跌期权的条件来绘制数据。以下数据如下所示： underlying_last exchange ... IVBid IVAsk underlying ... BP 39.00 * ... 0.0000 4.0743 BP 39.00 * ... 0.0000 3.0846 BP 39.

浏览 20提问于2020-02-14得票数 0

回答已采纳

2回答

数据透视表错误:此时不支持1ndim分类

python、pandas、pivot

我的目标是通过“标签”来绘制“分数”，我不关心“日期”和"Cusip“。我想使用'pivot‘来重塑数据，这样每个标签都在一列中，我可以对其进行箱图绘制。 date Cusip Label Score 663182 2015-07-31 00846UAG AAA 138.15 663183 2015-07-31 00846UAH AAA 171.93 663184 2015-07-31 00846UAJ AAA 175.67 663185 2015-07-31 023767AA BB 187.92

浏览 74提问于2016-07-30得票数 6

回答已采纳

2回答

无法理解matplotlib pyplot直方图

python、pandas、matplotlib、histogram

我只是在学习数据分析的一些基础知识。我有一个简单的csv数据文件，如下所示。 START,FIRST,SECOND,ITEM 1,100,200,A 2,100,200,B 2,100,300,C 2,200,300,D 3,200,100,E 3,200,100,F 3,200,100,G 3,200,100,H 3,200,100,I 3,200,100,J 我编写了这个小程序来读取这个csv文件，然后使用matplotlib为三列START、FIRST和SECOND打印一个直方图。我还打印了第一列和第二列的散点图。 #!/exp/anaconda3/bin/python3 import

浏览 1提问于2020-10-10得票数 0

1回答

如何绘制蟒蛇的高斯型直方图？

python、python-3.x、matplotlib、seaborn

我有一个名为df的s，它只有一列： size 20 28 38 42 42 42 44 124 176 192 194 216 228 316 318 2048 2714 2802 4128 4186 6910 9313 10816 16560 20704 34766 91022 我正在为同样的方法绘制一个直方图 sns.distplot(s['size'], bins = len(s)) 其结果如下：我想知道怎样才能做一些改变：我希望直方图具有如下的高斯外观： (这只是一个显示我所期望的直方图的例子) 在我绘制的图表中，垃圾箱是不连续的，这意味着两个垃圾箱之

浏览 0提问于2019-05-04得票数 0

回答已采纳

1回答

在pyspark上运行python库的速度会加快吗？

apache-spark、dataframe、pyspark

当我运行python库如pandas或scikit learn时，我试着通读并理解spark中的加速是从哪里来的，但我没有看到任何特别有用的东西。如果我可以在不使用pyspark数据帧的情况下获得相同的加速比，我可以只使用pandas部署代码，它的性能大致相同吗？我想我的问题是：如果我有可用的pandas代码，为了提高效率，我应该把它翻译成PySpark吗？

浏览 2提问于2018-06-22得票数 0

1回答

使用频率DIstribution数据的Python Plotly CDF

python、plotly、data-visualization、plotly-python

如何使用Plotly在Pandas DataFrame中使用频率分布数据绘制CDF图？假设下面的玩具数据 value freq 1 3 2 2 3 1 所有示例都显示了如何使用如下所示的原始数据执行此操作： value 1 1 1 2 2 3 我可以像这样用Pandas .plot做到这一点(但我更喜欢用Plotly做同样的事情)： stats_df = df stats_df['pdf'] = stats_df['count'] / sum(stats_df['count']) # calcu

浏览 46提问于2020-12-22得票数 2

回答已采纳

1回答

如何使用pandas.plot()函数用不同的标记绘制熊猫数据框的不同列？

python、pandas、matplotlib、plot

我有一个熊猫数据框架与5个不同的列。我想为每一列绘制不同的颜色、标签和标记。通过为每一列传递一个颜色/标签列表，我设法为每一列制作不同的颜色和标签。但是，这对标记不起作用。你知道怎么做吗？以下是代码示例： ds # a pandas data frame with 3 columns list_label=['A','B','C'] list_color=['tab:red','tab:green','tab:blue'] list_marker=['o','s',

浏览 0提问于2020-01-25得票数 1

1回答

绘制单个集群

python、pandas、cluster-analysis、hdbscan

我正在使用HDBSCAN，我只想绘制一个数据集群。这是我当前的代码： import hdbscan import pandas as pd from sklearn.datasets import make_blobs blobs, labels = make_blobs(n_samples=2000, n_features=10) clusterer = hdbscan.HDBSCAN(min_cluster_size=15).fit(blobs) color_palette = sns.color_palette('deep', 8) cluster_colors

浏览 36提问于2021-10-08得票数 1

回答已采纳

1回答

不同长度列的Python盒图

python、pandas、boxplot、prettyplotlib

我在Python中有以下数据格式(实际的dataframe要大得多，只是提供了一个小示例)： A B C D E F 0 0.43 0.52 0.96 1.17 1.17 2.85 1 0.43 0.52 1.17 2.72 2.75 2.94 2 0.43 0.53 1.48 2.85 2.83 3 0.47 0.59 1.58 3.14 4 0.49 0.80 我使用df.values将dataframe转换为numpy，然后将其传递给boxplot。当我

浏览 2提问于2014-04-17得票数 9

回答已采纳

1回答

我们如何对列的每个值中的pandas数据帧进行子采样

python、pandas、scikit-learn、cross-validation

我有一个dataframe，其中有一列给出了集群，我想在每个集群中使用相同的片段进行训练和测试。我知道我可以用下面的代码自己完成： nb_fold = 10 for i in range(nb_fold): X_train= X.groupby('Cluster').apply(lambda x: x.sample(frac = 1/nb_fold)) X_train.index = temp.index.droplevel(0) Y_train = Y.loc[X_train.index] X_eval, Y_eval = X.drop

浏览 6提问于2017-08-27得票数 1

回答已采纳

1回答

在pandastable中，X轴未拾取正确的绘图列

python、pandas、plot

我有两个列的dataframe，我想绘制数据，因为pandastable中已经有了plot函数。如何在pandastable plot中设置x轴列。我选择了两列，一列作为x轴，另一列作为y轴，x轴我希望是字符串时间，y轴作为值，绘制正确，但x轴被接受为时间列， import tkinter as tk import pandas as pd from pandastable import Table root=tk.Tk() df=pd.DataFrame({'Time':['10:00','11:00','12:00','

浏览 0提问于2020-01-28得票数 0

1回答

计算时间序列占总时间序列的百分比

pandas、matplotlib

我正在查看县级采购数据(数百万账单)，并使用groupby使用matplotlib和pandas绘制时间序列 dataframe_slice.groupby(pd.Grouper(freq='1M')).bill_amount.sum().plot 其中bill_amount是一列浮点数，它显示了账单的金额。如何更改图表以将dataframe_slice显示为总数据帧bill_amount的百分比

浏览 13提问于2021-01-06得票数 0

1回答

np.mean()给出了错误的意思？

python-3.x、numpy、numpy-ndarray

我在计算两个二维数组的每一列的平均值时遇到了麻烦。两个数组的每一列都是省略号的x，y坐标。因此，我想计算这些省略号的中心，使它们居中。所以，我使用np.mean()来做这件事，但是我得到了错误的值。如果我绘制椭圆和中心，椭圆确实是椭圆形的，但是点(根本)不在中心。所以，这不是由于错误的省略点造成的。 def acquire(self, qt, it, lapNumber): if self.stream is None: self.stream = {'qt': qt, 'it': it}

浏览 25提问于2020-02-09得票数 0