首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
871547
阅读量
105
订阅数
一起揭开 PySpark 编程的神秘面纱
在开始讲解PySpark程序启动原理之前,我们先来了解一下Spark的一些概念和特性。
Python数据科学
2021-09-29
1.6K0
开源 sk-dist,超参数调优仅需 3.4 秒,sk-learn 训练速度提升 100 倍!
这篇文章为大家介绍了一个开源项目——sk-dist。在一台没有并行化的单机上进行超参数调优,需要 7.2 分钟,而在一百多个核心的 Spark 群集上用它进行超参数调优,只需要 3.4 秒,把训练 sk-learn 的速度提升了 100 倍。
Python数据科学
2019-09-16
7370
Python写的抢票神器成GitHub热榜第一8400星,竟然还支持候补抢票!
这很可能是全GitHub最德高望重的购票小助手了,功能一直在更新,且现已支持Python 3.6以上版本。
Python数据科学
2019-09-16
9330
你与数据科学家只差这26条python技巧
作者 Peter Gleeson 是一名数据科学家,日常工作几乎离不python。一路走来,他积累了不少有用的技巧和tips,现在就将这些技巧分享给大家。这些技巧将根据其首字母按A-Z的顺序进行展示。
Python数据科学
2019-07-19
4210
python爬虫 | 一文搞懂分布式进程爬虫
今天咱们来扯一扯分布式进程爬虫,对爬虫有所了解的都知道分布式爬虫这个东东,今天我们来搞懂一下分布式这个概念,从字面上看就是分开来布置,确实如此它是可以分开来运作的。
Python数据科学
2019-06-10
7090
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档