首页
学习
活动
专区
工具
TVP
发布

大数据成神之路

专注大数据领域的一切技术~
专栏作者
635
文章
1280200
阅读量
316
订阅数
【Spark重点难点】你的数据存在哪了?
在之前的课中我们讲了Spark的RDD以及整个Spark系统中的一些关键角色:《【Spark重点难点】你从未深入理解的RDD和关键角色》。
王知无-import_bigdata
2021-12-07
1.3K0
ConcurrentHashMap锁机制进化的考量
我们知道,HashMap是无法保证线程安全性的,如果在并发环境下插入一个HashMap,哈希桶数组扩容时,有可能会造成链表出现环(美团技术的文章有详解)。若要保证线程安全性,就得使用ConcurrentHashMap。而ConcurrentHashMap在JDK 7和JDK 8中的锁机制设计有相当大的区别,本文来简单谈谈(其实也是老生常谈了)。
王知无-import_bigdata
2020-05-09
1.6K0
Spark SQL是如何选择join策略的?
我们都知道,Spark SQL上主要有三种实现join的策略,分别是Broadcast hash join、Shuffle hash join、Sort merge join。那Catalyst是依据什么样的规则来选择join策略的?本文来简单补个漏。
王知无-import_bigdata
2020-05-07
2.5K0
Flink DataStream维度表Join的简单方案
在编写基于Flink的ETL程序时,我们经常需要用维度数据丰富我们接入的流式数据,如通过商品ID获得商品名称、通过商品分类ID获得分类名称等等。而维度表基本都位于外部存储,换句话说,就是要解决一个无界的流式表与一个有界的码表或半静态表做join操作的问题。
王知无-import_bigdata
2019-12-05
2.1K0
助力秋招-独孤九剑荡剑式 | Java语言&基础面试题
https://blog.csdn.net/sufu1065/article/details/88051083
王知无-import_bigdata
2019-09-16
6310
助力秋招-独孤九剑破剑式 | 10家企业面试真题
场景描述:这篇文章是来自一个《大数据技术与架构》的一个读者-逆流而上Mr李,作者总结了自己在应聘过程中的面试题以及经验,珍贵的什么程度?也许你下次的问题就在这上面。多达10家企业面试的一手资料。
王知无-import_bigdata
2019-09-10
7150
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档