首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python也太好用了吧!一个plotly库就能实现交互式数据可视化

在本文中,我们将学习如何在Python中创建交互式可视化。我们将从仅仅以不同格式绘制数据开始,然后再探索添加更多交互式控件。

今天,我们将学习如何使用Plotly express。Plotly允许用户在肉眼可见的可视化界面上进行数据交互,并且与Web内容集成起来要容易得多。

plotly express简介

plotly express是 plotly 包装器,它允许使用更简单的语法。

受Seaborn和ggplot2的启发,它经过专门设计,具有简洁、一致且易于学习的API:只需一次导入,你就可以在一个函数调用中创建丰富的交互式图,包括刻面、地图、动画和趋势线。

如果你想了解更多信息,可访问Plotly的官方文档: https://medium.com/plotly/introducing-plotly-express-808df010143d

只需要两行代码,你就可以拥有一个漂亮的交互式图表,非常简单:

代码语言:javascript
复制
import plotly.express as px  fig = px.line(x='x data set', y= 'y data set')  fig.show()  

数据来源及准备

在本文中,我们将使用COVID-19数据集。

我们将使用以下代码来获取和格式化数据:

代码语言:javascript
复制
import plotly.express as px  import numpy as np  import pandas as pd  url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'  df = pd.read_csv(url, delimiter=',', header='infer')  df_interest = df.loc[  df['Country/Region'].isin(['United Kingdom', 'US', 'Italy', 'Brazil', 'India'])  & df['Province/State'].isna()]  df_interest.rename(  index=lambda x: df_interest.at[x, 'Country/Region'], inplace=True)  df1 = df_interest.transpose()  df1 = df1.drop(['Province/State', 'Country/Region', 'Lat', 'Long'])  df1 = df1.loc[(df1 != 0).any(1)]  df1.index = pd.to_datetime(df1.index)  df1 = df1.diff() #数据每日变化  

创建图表

1、线图

要在图形上添加一个国家的疫情数据可视化,我们只需要两行代码:

代码语言:javascript
复制
fig = px.line(x=df1.index, y= df1[df1.columns[0]],title = 'Daily Deaths due to COVID-19', name = df1.columns[0])  fig.show()  

单线图

要添加更多国家的数据,我们需要.add_scatter()属性。通过使用循环,我们可以添加所有范围内的国家。

代码语言:javascript
复制
fig = px.line()  for i,n in enumerate(df1.columns):  fig.add_scatter(x=df1.index, y= df1[df1.columns[i]], name= df1.columns[i])  

多线图

最后,我们可以考虑在图中添加更多的细节,个人喜欢在图中突出显示不同的数据点。

代码语言:javascript
复制
fig.update_traces(mode='markers+lines')  

带标记的图形

最后,添加相关的轴标签,设置字体大小并替换默认模板。

代码语言:javascript
复制
fig.update_layout(  title = 'Daily Deaths due to COVID-19'  ,xaxis_title = 'Dates'  ,yaxis_title = 'Number of Deaths'  ,font = dict(size = 25)  ,template = 'plotly_dark' #"plotly", "plotly_white", "plotly_dark", "ggplot2", "seaborn", "simple_white", "none"  )  

2、条形图

正如我们之前看到的,条形图可以很快就可以组合起来:

代码语言:javascript
复制
fig = px.bar(x=df1.index, y= df1[df1.columns[0]])  for i,n in enumerate(df1.columns):  fig.add_bar(x=df1.index, y= df1[df1.columns[i]], name= df1.columns[i])  fig.update_layout(  title = 'Daily Deaths due to COVID-19'  ,xaxis_title = 'Dates'  ,yaxis_title = 'Number of Deaths'  ,font = dict(size = 25)  ,template = 'plotly_dark' #"plotly", "plotly_white", "plotly_dark", "ggplot2", "seaborn", "simple_white", "none"  )  fig.show()  

3、饼状图

和以前一样,唯一的区别是我们只显示时间序列中的最新一天。

代码语言:javascript
复制
df1 = df1.tail(1).transpose()  fig = px.pie(df1, values = str(df1.columns[0]), names = df1.index)  fig.update_traces(textposition='inside', textinfo = 'percent+label')  ddate = str(df1.columns[0])[:10] #时间戳  fig.update_layout(  title = f'Deaths on {ddate} due to COVID-19'  ,xaxis_title = 'Dates'  ,yaxis_title = 'Number of Deaths'  ,font = dict(size = 25)  ,template = 'seaborn' #"plotly", "plotly_white", "plotly_dark", "ggplot2", "seaborn", "simple_white", "none"  )  fig.show()  

交互控件

通过上文,我们知道了如何快速地将不同类型的可视化组合在一起,接下来我们用交互控件来增强数据的可视化。

1、范围滑块

首先,通过下面的一行代码来添加一个范围滑块,这是一个很好用的控件,让用户看到自己控制想看的特定部分。

代码语言:javascript
复制
fig.update_xaxes(rangeslider_visible=True)  

2、范围焦点

如果我们的用户只想关注某个时间段里的某些部分呢?我们可以直接建立这些控件!

代码语言:javascript
复制
 fig.update_xaxes(  rangeslider_visible=True,  rangeselector=dict(  buttons=list([  dict(count=7, label="1w", step="day", stepmode="backward"),  dict(count=1, label="1m", step="month", stepmode="backward"),  dict(count=2, label="2m", step="month", stepmode="backward"),  dict(step="all")  ]),  font = dict( color='#008000', size = 11),  )  )  

3、自定义按钮

在体验了上面的范围焦点功能后,我们可以很容易想象到如何构建自定义按钮。Plotly express 以一种简单的方式满足了这一需求。让我们看看定制按钮,把重点放在个别国家上。

代码语言:javascript
复制
fig.update_layout(  updatemenus=[  dict(  type="buttons",  direction="right",  active=0,  x=0.5,  y=1.03,  buttons=list([  dict(label=df1.columns[0],  method="update",  args=[ {"visible": [True, False, False, False, False]},  {'showlegend' : True}  ]),  dict(label=df1.columns[1],  method="update",  args=[ {"visible": [False, True, False, False, False]},  {'showlegend' : True}  ]),  dict(label=df1.columns[2],  method="update",  args=[ {"visible": [False, False, True, False, False]},  {'showlegend' : True}  ]),  dict(label=df1.columns[3],  method="update",  args=[ {"visible": [False, False, False, True, False]},  {'showlegend' : True}  ]),  dict(label=df1.columns[4],  method="update",  args=[ {"visible": [False, False, False, False, True]},  {'showlegend' : True}  ]),  dict(label='All',  method="update",  args=[ {"visible": [True, True, True, True, True]},  {'showlegend' : True}  ]),  ]),  )  ]  )  

4、下拉式菜单

如果你想在可视化数据中,获得一个下拉菜单,就像注释掉一行代码一样简单。在这里,你只需注释掉“type=”buttons“就可以:

结论

Plotly express绝对是一个非常棒的数据可视化工具,它非常容易获取,使用起来也非常像Python。在这篇文章里,我们只是简单地描述了它所提供的功能。我鼓励你进一步探索这个Python库,因为它具有无限可能性!

  • 发表于:
  • 原文链接http://news.51cto.com/art/202006/619169.htm
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券