前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【2022新书】高效数据科学基础: 如何使数据科学家高效

【2022新书】高效数据科学基础: 如何使数据科学家高效

作者头像
数据派THU
发布2022-07-25 10:41:21
2200
发布2022-07-25 10:41:21
举报
文章被收录于专栏:数据派THU
代码语言:javascript
复制
来源:专知本文为书籍介绍,建议阅读5分钟简化数据科学基础设施,为数据科学家提供从原型到生产的有效路径。

《高效数据科学基础》是为数据科学和机器学习应用程序组装基础设施的实践指南。它揭示了Netflix和其他数据驱动公司管理尖端数据基础设施的过程。

当您使用这个易于遵循的指南时,您将从头开始设置端到端基础设施,使用一个完全可定制的流程,您可以很容易地适应您的公司。您将了解如何使用现有的云基础设施、一堆开源软件和惯用的Python提高数据科学家的工作效率。在整个过程中,您将遵循以人为中心的方法,重点关注用户体验和满足数据科学家的独特需求。

第一章: 介绍

第二章: 数据科学的工具链

第三章: 介绍Metaflow

第四章: 计算层的扩展

第五章: 实践可扩展和性能

第六章: 进入生产阶段

第七章: 处理数据

第八章: 使用和运作模式

第九章: 使用完整堆栈的机器学习

机器学习和数据科学应用是人类构建的最复杂的工程产品,如果你考虑到驱动它们的全部软件和硬件堆栈的话。因此,在今天,在21世纪20年代初,构建这样的应用并不容易,这就不足为奇了。机器学习和数据科学将继续存在。由高级数据驱动技术驱动的应用程序在各个行业中越来越普遍。因此,显然需要使构建和操作这样的应用程序成为一个更轻松、更有纪律的过程。引用阿尔弗雷德·怀特黑德的话:“文明的进步是通过扩展我们无需思考就能执行的重要操作的数量。”这本书教你如何构建一个有效的数据科学基础设施,它允许用户试验创新的应用,将它们部署到生产中,并不断改进它们,而不需要过多考虑技术细节。没有一种千篇一律的方法可以适用于所有的用例。因此,本书关注的是通用的、基本的原则和组件,这些原则和组件可以在您的环境中以一种有意义的方式实现。

https://www.manning.com/books/effective-data-science-infrastructure#:~:text=Effective%20Data%20Science%20Infrastructure%3A%20How,their%20cutting%20edge%20data%20infrastructure.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档