前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《Python 数据科学加速》电子书开源了!

《Python 数据科学加速》电子书开源了!

作者头像
PP鲁
发布2024-05-17 09:48:47
1190
发布2024-05-17 09:48:47
举报
文章被收录于专栏:皮皮鲁的AI星球皮皮鲁的AI星球

📚 《Python 数据科学加速》电子书开源了!🎉

链接 👉🏻 https://scale-py.godaai.org/

这是一本面向下一代数据科学和人工智能的开源电子书。

本书内容

在这本电子书中,我们将深入探讨以下四个关键框架:

  • Dask - 一个并行计算的利器,它让 Python 能够处理超出内存大小的大型数据集,是数据科学家处理大规模数据的得力助手。
  • Ray - API 简单,面向深度学习训练推理,GitHub 30k stars。AI 时代的基础设施,OpenAI 基于 Ray 训练 ChatGPT!
  • Xorbits - 一个高性能的分布式计算和推理框架,简单易上手。
  • mpi4py - MPI 的 Python 实现,它让 Python 开发者能够利用 MPI 强大的并行计算能力。本书探讨了 mpi4py 如何与大模型训练相结合。

Python pandas、NumPy、scikit-learn 只能在单机运行,如果你还还在困扰如何将这些任务横向扩展,这本书正适合你!

数据科学经常反复试验,Ray 提供了丰富的超参数调优功能,轻松选出最优超参数。

训练好的模型如何部署?Ray Serve、Xinference 帮你快速部署大模型。

实战案例

本书强调实战和案例,数据源代码可复现,可以在 colab 或您自己的服务器上运行。帮助您在数据科学的征途上,更快地分析数据,更高效地构建模型,更便捷地实现分布式计算和模型部署。

🔬 无论你是数据科学的初学者,还是资深的研究人员,这本电子书都将是你的宝贵资源。

作者

  • 鲁蔚征 - 现就职于中国人民大学,CCF高性能计算专业委员会执行委员,主要研究大数据与机器学习系统。
  • 秦续业 - 开源项目 Xorbits 负责人,前阿里巴巴技术专家,主导开发了多款开源项目,GitHub 获的上万 stars。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 皮皮鲁的科技星球 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本书内容
  • 实战案例
  • 作者
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档