腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
包子铺里聊IT
https://baozitraining.org/ 北美最优秀的程序员模拟面试 - 包子IT面试培训
专栏作者
举报
123
文章
107429
阅读量
37
订阅数
订阅专栏
申请加入专栏
全部文章
编程算法
网络安全
https
其他
html
node.js
数据结构
java
分布式
hadoop
大数据
缓存
面向对象编程
神经网络
机器学习
javascript
go
sql
git
api
linux
网站
http
spark
二叉树
数据分析
processing
it
space
面试
数据挖掘
ios
php
python
css
android
数据库
oracle
nosql
云数据库 Redis
ide
eclipse
github
matlab
jar
搜索引擎
unix
windows server
apache
金融
vr 视频解决方案
express
erp
hashmap
rpc
小程序
机器人
数据处理
windows
系统架构
架构设计
amazon
bat
code
communication
input
lifecycle
output
package
point
process
root
sequence
set
t4
this
time
transfer
visibility
window
百度
搜索文章
搜索
搜索
关闭
五分钟零基础介绍 Spark
hadoop
spark
数据处理
机器学习
神经网络
相信大家都听说过火的不能再火、炒得不能再炒的新一代大数据处理框架 Spark. 那么 Spark 是何方神圣?为何大有取代 Hadoop 的势头?Spark 内部又是如何工作的呢?我们会用几篇文章为大家一一介绍。 Hadoop:我不想知道我是怎么来的,我就想知道我是怎么没的? 还是从 Hadoop 处理海量数据的架构说起,一个 Hadoop job 通常都是这样的: 从 HDFS 读取输入数据; 在 Map 阶段使用用户定义的 mapper function, 然后把结果写入磁盘; 在 Reduce 阶段,
包子面试培训
2018-04-20
598
0
【最火大数据 Framework】五分钟深入 Spark 运行机制
大数据
spark
上篇文章,我们简要介绍了 MapReduce 框架的局限和 Spark 横空出世的土壤。今天,我们就来详细介绍 Spark 的内部原理和它强大功能的背后设计。 前文回顾 Hadoop 的局限并非只有 IO 速度的问题,更重要的是 MapReduce 规定死了 map / reduce 两种运算,并且提供之间 shuffle 的数据搬运工作。无论运算怎样灵活多样,你都要走 map -> shuffle -> reduce 这条路,要进行灵活运算并保证优秀性能确实有点吃力。Spark 这边,AMPLab 为此
包子面试培训
2018-04-19
595
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档