首页
学习
活动
专区
工具
TVP
发布

重庆的技术分享区

专栏作者
93
文章
260698
阅读量
30
订阅数
PySpark简介
Apache Spark是一个大数据处理引擎,与MapReduce相比具有多个优势。通过删除Hadoop中的大部分样板代码,Spark提供了更大的简单性。此外,由于Spark处理内存中的大多数操作,因此它通常比MapReduce更快,在每次操作之后将数据写入磁盘。
双愚
2018-08-30
6.8K0
选择一个数据仓库平台的标准
原文地址:https://dzone.com/articles/criteria-for-selecting-a-data-warehouse-platform
双愚
2018-06-10
2.9K0
大数据与机器学习融合
我最近与柏林工业大学的学生进行了两次非常有趣的讨论,我了解了机器学习社区和大数据社区之间的鸿沟有多大。
双愚
2018-06-10
1.1K0
为什么你应该有一个数据治理策略
原文地址:https://dzone.com/articles/why-you-should-already-have-a-data-governance-stra
双愚
2018-05-31
8250
Hadoop和大数据分析简介
原文地址:https://opensourceforu.com/2013/12/introduction-tohadoop-big-data-analysis/
双愚
2018-05-21
9830
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档