腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
码的一手好代码
专栏成员
举报
68
文章
96451
阅读量
18
订阅数
订阅专栏
申请加入专栏
全部文章(68)
java(17)
编程算法(17)
数据库(14)
sql(11)
spark(11)
大数据(10)
云数据库 SQL Server(8)
hive(8)
linux(6)
缓存(5)
bash(4)
node.js(4)
bash 指令(4)
mapreduce(4)
jdk(4)
zookeeper(4)
python(3)
scala(3)
ide(3)
文件存储(3)
面向对象编程(3)
flink(3)
c++(2)
javascript(2)
css(2)
access(2)
打包(2)
git(2)
unix(2)
日志服务(2)
mongodb(2)
网站(2)
http(2)
存储(2)
数据迁移(2)
shell(2)
hadoop(2)
jvm(2)
numpy(2)
jdbc(2)
grep(2)
数据结构(2)
https(2)
hbase(2)
kafka(2)
官方文档(1)
自动驾驶(1)
机器学习(1)
xml(1)
html(1)
jquery(1)
android(1)
github(1)
api(1)
matlab(1)
jar(1)
ubuntu(1)
神经网络(1)
深度学习(1)
命令行工具(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
消息队列 CMQ 版(1)
云推荐引擎(1)
企业(1)
yarn(1)
开源(1)
分布式(1)
网络安全(1)
html5(1)
erp(1)
rpc(1)
udp(1)
rabbitmq(1)
scikit-learn(1)
socket编程(1)
windows(1)
网站建设(1)
unicode(1)
utf8(1)
ascii(1)
lock(1)
logic(1)
self(1)
tree(1)
代理(1)
设计模式(1)
数据(1)
搜索文章
搜索
搜索
关闭
设计模式七大原则
spark
css
缓存
编程算法
累加器(Accumulator)是Spark提供的累加器,顾名思义,该变量只能够增加。由Driver端进行初始变量,Task再对声明的变量进行累加操作。
俺也想起舞
2019-11-27
461
0
Spark中累加器的陷阱
spark
css
缓存
编程算法
累加器(Accumulator)是Spark提供的累加器,顾名思义,该变量只能够增加。由Driver端进行初始变量,Task再对声明的变量进行累加操作。
俺也想起舞
2019-11-27
954
0
Spark中的持久化
文件存储
spark
缓存
java
存储
Spark 中一个很重要的能力是将数据持久化(或称为缓存),在多个操作间都可以访问这些持久化的数据。当持久化一个 RDD 时,每个节点的其它分区都可以使用 RDD 在内存中进行计算,在该数据上的其他 action 操作将直接使用内存中的数据。这样会让以后的 action 操作计算速度加快(通常运行速度会加速 10 倍)。缓存是迭代算法和快速的交互式使用的重要工具。
俺也想起舞
2019-11-27
715
0
Spark入门
spark
hadoop
mapreduce
编程算法
Transformation:进行数据的转换,即将一个RDD转换成另一个RDD,这类转换并不触发提交作业,完成作业中间过程处理。
俺也想起舞
2019-07-24
388
0
spark源码分析————DAGScheduler实现
spark
DAGScheduler创建、Job提交、Stage划分、任务生成
俺也想起舞
2019-07-24
452
0
spark RPC原理
java
scala
spark
rpc
Spark-1.6以后RPC默认使用Netty替代Akka,在Netty上加了一层封装,为实现对Spark的定制开发,所以了解Spark中RPC的原理还是有必要的
俺也想起舞
2019-07-24
977
0
Spark源码分析————start-all
spark
bash
bash 指令
scala
org.apache.spark.deploy.master.Master 让我们先来看看main()方法
俺也想起舞
2019-07-24
582
0
spark源码分析————submit
spark
会先经历spark-class org.apache.spark.deploy.SparkSubmit处理,里面包括一些基本环境配置,然后运行
俺也想起舞
2019-07-24
1.2K
0
spark源码分析————shell
spark
shell
spark-shell启动的过程源码分析 spark-shell function main() { # 对当前系统进行判断,通过spark-submits.sh 启动 org.apac
俺也想起舞
2019-07-24
611
0
Spark内部原理
mapreduce
文件存储
缓存
spark
编程算法
Spark中的Shuffle、宽依赖窄依赖、RDD持久化、共享变量
俺也想起舞
2019-07-24
765
0
Spark Streaming写出文件自定义文件名
hadoop
spark
hive
通过重写MultipleOutputFormat来自定义文件名
俺也想起舞
2019-07-24
1.4K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档