我使用熊猫和matplotlib来生成一些图表。
我的DataFrame:
Journal Papers per year in journal
0 Information and Software Technology 4
1 2012 International Conference on Cyber Securit... 4
2 Journal of Network and Computer Applications 4
3
当我使用DataReader从FRED那里抓取数据时,我的DataFrame中有一些NaN值,但是在FRED官方网站上,他们的数据和图形似乎是完整的,没有丢失。所以我想知道是什么原因导致NaN值出现在我的DataFrame中?以及如何修复它?
import pandas as pd
import datetime as dt
import pandas_datareader as web
import matplotlib.pyplot as plt
from matplotlib import style
import matplotlib.ticker as ticker
style.us
我有一个Pandas dataframe,它有两个列,比如-
Vendor Product Category
VendorA ProdABC B
VendorA ProdXYZ C
VendorAB ProdCDC A
VendorAB ProdDEF A
VendorAB ProdKLM B
VendorF ProdXYZ D
VendorC ProdBSE C
VendorF ProdFGH D
VendorAB ProdMNO
import matplotlib.pyplot as plt
import matplotlib.image as img
import pandas as pd
import numpy as np
import seaborn as sns
%matplotlib inline
data = pd.read_csv('http://www.biointelligence.hu/ids/fuel_data_with_errors.txt', header=0, sep='\t')
data.fillna(method="backfill"
我正在尝试制作一个百分比堆叠条形图,有5个条形图。%2条形图没有数据,但无法从图表中排除它们。我将这个值设置为NaN (因为稍后我需要计算均值)。在本例中,这2个条目中的一个是列表中的第一个条目。这将导致不显示图表的顶部。我不明白的是,当我切换第一个条目和第二个条目时,将第二个条目设为NaN,没有问题。
代码:这里NaN是第一个,3是第二个,这是不起作用的。切换NaN和3确实有效(见下图)
import numpy as np
import matplotlib.pyplot as plt
from math import nan
#Data
goed1 = [nan,3,152,9, na
我想用两个类别来制作一个盒子图,但出于一个原因,它没有出现在第二个盒子图上。这里我的代码:
from matplotlib import pyplot as plt
import pandas as pd
# Data
url = 'https://github.com/Nayeli-Luis/stackoverflow_collection/blob/main/datasets/knz_bison.csv?raw=true'
bison = pd.read_csv(url)
# Prepare data
bisonF = bison.loc[bison['ani
我将在matplotlib中制作一个堆叠条形图。不知何故,它没有包括我给他的所有条形图(应该有大约50个条形图堆叠在一起)
代码:
N=45 #numbers of columns
max_el=50
ind=np.arrange(N)
for bar in range(0,max_el):
y=[dic[value][bar] for value in dic]
plt.bar(ind,y,)
plt.show()
注意:我使用了类似的代码和相同的数据,并用plotly制作了一个堆叠的条形图(这是有效的)
有情节的
使用matplotlib
变量的某些值是零或0.1。
我有下面的代码,我想将数据中的所有0转换成None的(因为我不想在matplotlib中绘制数据)。但是,代码无法工作,0.仍在打印中。
sd_rel_track_sum=np.sum(sd_rel_track, axis=1)
for i in sd_rel_track_sum:
print i
if i==0:
i=None
return sd_rel_track_sum
有没有人能想出一个解决方案。或者仅仅是我如何将所有0都转移到None的答案。或者只是不绘制Matplotlib中的零值。
我有一个海量的DataFrame df (按'year'排序):
year gender
1894 male
1895 male
1895 male
1896 male
1900 male
...
2008 male
2008 female
2009 male
2009 female
2009 female
我的目标是用x轴'year'和y轴绘制一个堆叠的条形图,这些年值出现的次数,['gender'] ==
我正在试图理解这一失败的原因,尽管文档中说:
dropna :布尔值,可选地在绘图前从数据中删除丢失的值。
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
sns.__version__
# '0.7.dev'
# generate an example DataFrame
a = pd.DataFrame(data={
'a': np.random.normal(size=(100,)),
我想做一个标准的matplotlib动画,我想让不同的组作为一条“单”线,而不是绘制10个共享同一x轴的组。对于上下文,我试图在一个系列中绘制10本书的情绪图,并希望对每本书的线条进行颜色编码。我找到的所有线动画的搜索似乎都是从x=0开始到当前的x,这使得分配正确的颜色标签变得困难。 例如,以Animating "growing" line plot in Python/Matplotlib为例。假设我想要将x in [0,10)作为一个组,将x in [10,20)作为组2,等等。我该如何以动画的方式完成这件事? 我正在尝试获取动画版本: import numpy as n
Problem:我有几天的timeseries数据,我使用Seaborn库的函数以facet形式绘制这些数据。在几种情况下,我发现前面提到的海运函数在两个读数之间绘制了连续行之间的连续缺失值(nan值)。虽然matplotlib将缺失的值显示为gap,但这是有意义的。演示示例如下所示
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# create timeseries data for 3 days such that day two contains N