腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
灯塔大数据
专栏作者
举报
1001
文章
950441
阅读量
115
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
大数据(435)
人工智能(133)
其他(126)
数据分析(111)
编程算法(106)
机器学习(70)
python(65)
深度学习(55)
安全(49)
神经网络(45)
存储(45)
微信(42)
区块链(36)
数据挖掘(30)
https(30)
物联网(27)
5g(27)
网络安全(26)
数据库(22)
hadoop(21)
游戏(19)
api(16)
自动化(16)
spark(16)
企业(15)
数据处理(14)
java(13)
tcp/ip(13)
数据结构(13)
html(12)
开源(12)
数据可视化(12)
云计算(12)
无人驾驶(11)
互联网金融(10)
爬虫(10)
自动驾驶(9)
sql(9)
mapreduce(9)
http(9)
黑客(9)
强化学习(9)
android(8)
github(8)
分布式(8)
运维(8)
比特币(7)
电商(7)
费用中心(6)
数字货币(6)
NLP 服务(6)
ios(6)
linux(5)
图像处理(5)
工业物联(5)
卷积神经网络(5)
机器人(5)
windows(5)
人脸识别(4)
iphone(4)
javascript(4)
o2o(4)
缓存(4)
图像识别(4)
推荐系统(4)
决策树(4)
小程序(4)
hbase(4)
互联网(4)
语音识别(3)
php(3)
go(3)
r 语言(3)
node.js(3)
搜索引擎(3)
TDSQL MySQL 版(3)
腾讯云测试服务(3)
网站(3)
出行(3)
互联网医疗(3)
正则表达式(3)
ipv6(3)
tensorflow(2)
swift(2)
json(2)
硬件开发(2)
oracle(2)
ide(2)
git(2)
jar(2)
windows server(2)
apache(2)
云推荐引擎(2)
金融(2)
在线旅游(2)
express(2)
容器(2)
云市场(2)
hive(2)
erp(2)
gui(2)
监督学习(2)
二叉树(2)
pytorch(2)
anaconda(2)
安全漏洞(2)
腾讯云开发者社区(2)
sdn(2)
汽车(2)
app(2)
创业(2)
云点播(1)
对象存储(1)
创业扶持(1)
mac os(1)
c 语言(1)
c++(1)
.net(1)
react(1)
xml(1)
css(1)
ajax(1)
单片机(1)
nosql(1)
容器镜像服务(1)
apt-get(1)
spring(1)
云直播(1)
短视频(1)
云数据库 MongoDB(1)
NAT 网关(1)
VPN 连接(1)
知识图谱(1)
es 2(1)
mongodb(1)
金融风控(1)
智慧物流(1)
yarn(1)
devops(1)
数据迁移(1)
shell(1)
html5(1)
jdk(1)
ssh(1)
openstack(1)
npm(1)
kotlin(1)
flash(1)
kernel(1)
scikit-learn(1)
模式识别(1)
uml(1)
架构设计(1)
网站建设(1)
nat(1)
虚拟化(1)
云游戏(1)
学习方法(1)
图像搜索(1)
手机行业(1)
智能家居(1)
alexa(1)
it(1)
max(1)
video(1)
web(1)
wifi(1)
程序员(1)
公众号(1)
科技(1)
流媒体(1)
路由器(1)
面试(1)
设计(1)
视频(1)
数据科学(1)
腾讯(1)
语音(1)
终端(1)
搜索文章
搜索
搜索
关闭
干货|盘点最受欢迎的十个开源大数据技术
spark
apache
hive
sql
大数据已然成为当今最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点最受欢迎的十大开源的大数据技术。 1 Hadoop 高效、可靠、可伸缩,能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。 2 Spark 使用简单、支持所有重要的大数据语言(Scala、Python、Java、R)。拥有强大的生态系统,成长迅速,对microbatching/batching/SQL支持
灯塔大数据
2018-04-09
808
0
每周学点大数据 | No.42 Hash join
大数据
mapreduce
hive
No.42期 Hash join Mr. 王:那我们就来看看 Hash join 具体是怎么做的吧。 两个表直接拿过来,我们不对其做任何排序和预处理。对这两个表进行一些随机分割,然后 Mapper 会去读取这些分割好的表块,并将它们划分为 Hash 桶。最后这些 Hash 桶根据相应的 Hash 值归入相应的 Reducer 中。 在 Reducer 中,将归入一个 Reducer 中的两个表的表块合并成一个表。于是每个 Reducer 的输入对应的就是相同的 Hash 值,因此就可以放到同一个Merg
灯塔大数据
2018-04-04
709
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档