前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python助力Tableau代码驱动分析,助力实现数据科学的扩展性

Python助力Tableau代码驱动分析,助力实现数据科学的扩展性

作者头像
Python大数据分析
发布2022-04-03 11:38:01
1K0
发布2022-04-03 11:38:01
举报

Tableau 直观且易于使用的可视化操作界面,帮助数据分析师乃至是其他领域的人们都可以看到并理解他们的数据。当然,同样包括像数据科学家或统计学家这样老练的数据分析用户。

为什么特别突出这类人群呢?因为他们的工作流程与数据分析师的略有不同,他们严重依赖统计和机器学习算法,通常只能从 R、Python 或 Matlab 访问并分析数据。

  • 为了与这些库进行交互,统计人员和数据科学家必须编写代码,对其模型参数进行实验,再将结果以可视化方式来呈现。
  • 数据科学家通常选择的工具是一些编程语言构建的编辑器环境,例如 RStudio 或 Jupyter,他们可以在这些程序中混合创建代码和可视化效果。

图示:传统的 Jupyter Notebook 环境

过去,数据科学家不愿采用 Tableau 的主要原因之一是缺乏对这种代码驱动型迭代开发方法的支持。但随着 Tableau Dashboard Extensions API 和 Analytics Extensions API 的不断更新,这种形势有了新的变化。

如今, Tableau 结合了可进行代码驱动的数据科学应用和易于使用的拖放式可视化界面,为数据科学家和统计学家群体提供了更好的选择。

Tableau 与 Python 和 R 集成

Analytical Extension 提供了可在 Tableau 工作簿中使用 Python、R、Matlab 和其他平台的库和函数的标准方法。使用标准的 Tableau “ SCRIPT ”函数,用户可以将其 Python 或 R 代码添加为 Tableau 计算字段,从而开启更高级的分析体验。

图示:Tableau Desktop 中 Python 计算字段的简单示例

尽管这仅仅结合了 Tableau 现有的计算功能,但与笔记本型机器的迭代体验并不相同。Dashboard Extensions API 可以为用户提供更多帮助,例如提供在 Tableau 代码编辑器中使用代码的体验,并同步以 Tableau 图表的可视化形式查看结果,分析效率更高效。

Tableau 的 CodePad 编辑器

Tableau Extension Gallery 平台最近更新了一个扩展程序,该扩展允许用户与代码进行交互(就像在代码笔记本中那样)。在代码编辑器中更改代码时, Tableau 会执行这些命令并重新计算标记,且立即在当前窗口中更新可视化效果。

图示:使用代码编辑器扩展程序 “CodePad” 更新 Viz

要使用扩展,首先需要创建一个字符串参数,再创建一个基于 SCRIPT 函数的计算字段,并将相关字段映射为脚本参数。

图示:创建一个参数来存储程序代码

图示:在 SCRIPT 函数中使用参数

然后将扩展程序添加到仪表板中,选择先前创建好的参数,并将配置选择为与 Analytics Extension API 中相同的编程语言(例如是 R / Python):

图示:向仪表板添加并配置 CodePad 扩展程序

现在,你可以开始构建可视化视图,将其添加到机器学习模型中,并使用外部 API 来丰富数据的层次,这一切在 Tableau 中即可完成!最棒的体验在于,你可以重复使用同一工作簿,以与最终用户共享分析,该分析可以放置在不同的工作表上。

Tableau 中的样本工作簿分析

如何在实际业务分析中具体运用呢?Tableau 技术团队将示例工作簿与三种基于 Python 的算法放在了一起,以便我们更直观感受最终结果:

01

聚类分析

此仪表板使用 scikit Learn 的 DBSCAN 算法将聚类分析应用于一组点。

图示:使用 DBSCAN 算法的集群

02

季节性分析

使用 statsmodel 的 “seasonal_decompose” 从时间序列数据中删除季节性并显示纯趋势。

03

情感分析

比较产品评论的标题和等级,及其情感评分。

图示:使用 ntlk 或 textblob 进行情感分析

结 语:立即开始探索吧!

你是否已跃跃欲试?拷贝下方链接至浏览器打开,立即下载扩展程序和演示工作薄,开始更深入的探索吧!PS:需要提前在机器上安装好 Python,并已成功链接至 Tableau(通过 TabPy),方可正常打开和查看工作薄哦~

扩展程序下载地址:

https://extensiongallery.tableau.com/extensions/200

工作薄下载地址:

https://tableau-extension-gallery-backend-production.s3-us-west-2.amazonaws.com/products/200/CodePad+Demo.twbx

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python大数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档