腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
分布式系统和大数据处理
专栏成员
举报
103
文章
168396
阅读量
30
订阅数
订阅专栏
申请加入专栏
全部文章(103)
其他(66)
hadoop(9)
hive(8)
大数据(8)
linux(7)
.net(5)
存储(5)
asp.net(4)
html(4)
数据库(4)
ide(4)
mapreduce(4)
yarn(4)
分布式(4)
spark(4)
ssh(4)
windows(4)
java(3)
react(3)
sql(3)
http(3)
开源(3)
asp(3)
微服务(3)
官方文档(2)
api(2)
webpack(2)
游戏(2)
缓存(2)
iphone(1)
python(1)
ruby(1)
go(1)
angularjs(1)
xml(1)
json(1)
ajax(1)
access(1)
搜索引擎(1)
ubuntu(1)
windows server(1)
apache(1)
容器镜像服务(1)
redux(1)
编程算法(1)
shell(1)
网络安全(1)
jdk(1)
正则表达式(1)
yum(1)
面向对象编程(1)
dns(1)
jdbc(1)
决策树(1)
npm(1)
seo(1)
iis(1)
socket编程(1)
微信(1)
安全(1)
数据处理(1)
数据结构(1)
系统架构(1)
搜索文章
搜索
搜索
关闭
玩转电商系统:深入剖析智慧电商平台
分布式
存储
缓存
hadoop
大数据
因为本人最近几年都在从事电商相关的工作,因此购买了这本书,主要是想了解大型的电商系统应该包括哪些组成部分,以弥补自身知识的不足。
张子阳
2018-09-30
2.4K
0
大数据常用组件默认端口号
大数据
hadoop
yarn
mapreduce
hive
.colspan{ background:#f4f4f4; font-weight: bold;}
张子阳
2018-09-30
2.3K
0
安装和配置Hadoop集群(3节点)
hadoop
大数据
分布式
存储
yarn
在 安装和配置Hadoop(单节点) 这篇文章中,已经进行了Hadoop单机伪集群模式的部署。生产环境中,Hadoop都是以集群方式进行安装和部署的,否则,就不需要使用Hadoop了,分布式存储和分布式运算是Hadoop提供的核心功能。这篇文章将在单机安装的基础上,进行3个节点Hadoop集群的安装,因此如果你还没有单机安装过Hadoop,那么请先查看一下单机安装的这篇文章。
张子阳
2018-09-30
7.7K
1
使用Spark读取Hive中的数据
spark
hive
大数据
mapreduce
官方文档
在默认情况下,Hive使用MapReduce来对数据进行操作和运算,即将HQL语句翻译成MapReduce作业执行。而MapReduce的执行速度是比较慢的,一种改进方案就是使用Spark来进行数据的查找和运算。Hive和Spark的结合使用有两种方式,一种称为Hive on Spark:即将Hive底层的运算引擎由MapReduce切换为Spark,官方文档在这里:Hive on Spark: Getting Started。还有一种方式,可以称之为Spark on Hive:即使用Hive作为Spark的数据源,用Spark来读取HIVE的表数据(数据仍存储在HDFS上)。
张子阳
2018-09-28
11.2K
0
安装和配置Hive
hive
大数据
mapreduce
存储
hadoop
直接通过MapReduce来对存储在Hadoop HDFS上的数据进行查询和分析比较繁琐而且还需要编程。Hive是一个数据仓库系统,构建在HDFS之上,它提供了类似SQL的语法(HQL),可以将HQL翻译成MapReduce作业进行查询,使得对数据的管理和检索更为便利。
张子阳
2018-09-28
1.9K
0
安装和配置Hadoop(单节点)
hadoop
大数据
yarn
mapreduce
linux
Hadoop生态圈仍处于欣欣向荣的发展态势,不断涌现新的技术和名词。Hadoop的HDFS、YARN、MapReduce仍是最基础的部分,这篇文章记录了如何一步步在linux上安装单节点的Hadoop,之后就可以在它上面做一些练习了。截至目前(2018.7.16),Hadoop的最新版本是3.0.3,但使用最新版本的问题是:当你遇到问题时,所能找到的资料或者书籍都是针对较晚版本的。因此,对一项技术,如果没有达到特别熟悉,安装次新、或者次次新版本是一个相对稳妥的做法。所以,我选择安装的是2.9.1版本。
张子阳
2018-09-28
2.8K
0
安装和配置Spark(单节点)
spark
大数据
apache
linux
hadoop
Apache Spark被称为第三代大数据处理平台,也当前应用最广泛的大数据处理方案,这篇文章将介绍如何在Linux系统(Cent OS7)上以单机模式(Stand alone)模式安装Apache Spark。当前的最新稳定版是2.3.1。
张子阳
2018-09-28
3.7K
0
安装和配置Hadoop集群(3节点)
yarn
大数据
ssh
hadoop
windows
在 安装和配置Hadoop(单节点) 这篇文章中,已经进行了Hadoop单机伪集群模式的部署。生产环境中,Hadoop都是以集群方式进行安装和部署的,否则,就不需要使用Hadoop了,分布式存储和分布式运算是Hadoop提供的核心功能。这篇文章将在单机安装的基础上,进行3个节点Hadoop集群的安装,因此如果你还没有单机安装过Hadoop,那么请先查看一下单机安装的这篇文章。
张子阳
2018-08-21
2.9K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档