首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1042835
阅读量
52
订阅数
第四范式OpenMLDB: 拓展Spark源码实现高性能Join
Spark是目前最流行的分布式大数据批处理框架,使用Spark可以轻易地实现上百G甚至T级别数据的SQL运算,例如单行特征计算或者多表的Join拼接。
代码医生工作室
2021-09-29
1.1K0
使用PySpark迁移学习
在本文中,将演示计算机视觉问题,它结合了两种最先进的技术:深度学习和Apache Spark。将利用深度学习管道的强大功能来 解决多类图像分类问题。
代码医生工作室
2019-07-26
1.8K0
使用Wordbatch对Python分布式AI后端进行基准测试
在过去的几年里,Python已成为数据科学和人工智能的通用语言,所有使用Python作为主要界面语言的着名深度学习框架(Keras,Pytorch,MXNet)。与竞争语言相比,Python在DS和AI的几乎每个方面都可以与之竞争或超越:最新的机器学习算法及其高效实现(Scikit-Learn,LightGBM,XGBoost),数据处理和分析(Pandas,cuDF),高效的数值计算库(Numpy) ,PyPy,Numba),GPU计算(CuPY)和Web API编程(Flask,Celery)。
代码医生工作室
2019-07-05
1.5K0
Spark&AI Summit 2019
他们宣布了一个名为Koalas的新项目,这是Spark的本地“pandas”翻译。现在可以自动将Pandas代码移植到Spark的分布式世界。这将成为人们习惯于pandas环境的绝佳桥梁。许多在线课程/大学使用pandas教授数据科学。现在新数据科学家将减少损失。
代码医生工作室
2019-06-21
5090
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档