腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
星汉技术
专栏作者
举报
119
文章
194952
阅读量
45
订阅数
订阅专栏
申请加入专栏
全部文章
数据库
sql
hive
编程算法
linux
云数据库 SQL Server
java
ide
存储
jar
spark
jdk
云数据库 Redis
专用宿主机
eclipse
maven
centos
其他
scala
云数据库 MongoDB
mongodb
分布式
数据结构
python
node.js
打包
shell
hadoop
tcp/ip
ntp
javascript
xml
git
api
http
大数据
hbase
自动驾驶
apache
访问管理
yarn
缓存
数据迁移
zookeeper
gradle
socket编程
windows
云服务器
android
硬件开发
access
人工智能
网站
压力测试
网络安全
jvm
ssh
jdbc
gcc
数据分析
数据处理
https
sas
unicode
搜索文章
搜索
搜索
关闭
CDH的坑之Deploy Client Configuration Failed
jdk
专用宿主机
spark
java
网上查了以下,各种的都没有解决,只说是jdk的问题,但是具体问题在哪里,不知道。因为之前本人安装的CDH,也安装了spark,还是成功安装了,在公司的集群中却出现了上面的问题。都说是jdk的问题那么就检查一下jdk。
云飞扬
2019-03-12
1.6K
0
原 Spark简介及完全分布式安装
spark
Spark简介及完全分布式安装 一、Spark介绍 官方介绍: Apache Spark™ is a fast and general engine for large-scale data processing. Spark Introduce Run programs up to 100x faster than Hadoop MapReduce in memory, or 10x faster on disk. Apache Spark has an advanced
云飞扬
2018-05-17
651
0
原 Spark On Yarn完全分布式搭
spark
yarn
分布式
zookeeper
Spark On Yarn完全分布式搭建 Spark On Yarn的搭建分为三个阶段,第一个是Zookeeper集群的搭建,第二是Hadoop集群的搭建,第三是Spark集群的搭建。所以以下将按照这三个步骤来给大家进行展示Spark On Yarn完全分布式搭建。 一、准备 1、软件及版本 1. jdk-8u65-linux-x64.tar.gz 2. scala-2.11.0.tgz 3. zookeeper-3.4.7.tar.gz 4. hadoop-2.7.
云飞扬
2018-05-17
1.6K
0
原 荐 Spark框架核心概念
spark
Spark框架核心概念 首先介绍Spark中的核心名词概念,然后再逐一详细说明。 RDD:弹性分布式数据集,是Spark最核心的数据结构。有分区机制,所以可以分布式进行处理。有容错机制,通过RDD之间的依赖关系来恢复数据。 依赖关系:RDD的依赖关系是通过各种Transformation(变换)来得到的。父RDD和子RDD之间的依赖关系分两种:①窄依赖②宽依赖。 ①窄依赖:父RDD的分区和子RDD的分区关系是:一对一。 窄依赖不会发生Shuffle,执行效率高,spark框架底层
云飞扬
2018-05-17
1.3K
0
原 Spark的架构
spark
Spark的架构 1、概述 为了更好地理解调度,先来鸟瞰一下集群模式下的Spark程序运行架构图。 2、角色 1.cluster manager cluster manager:集群管
云飞扬
2018-05-17
673
0
原 Spark Shuffle
spark
数据库
Spark Shuffle 1、概述 Shuffle,翻译成中文就是洗牌。之所以需要Shuffle,还是因为具有某种共同特征的一类数据需要最终汇聚(aggregate)到一个计算节点上进行计算
云飞扬
2018-05-17
1.5K
0
原 荐 SparkSQL简介及入门
spark
sql
数据处理
SparkSQL简介及入门 一、概述 Spark为结构化数据处理引入了一个称为Spark SQL的编程模块。它提供了一个称为DataFrame(数据框)的编程抽象,DF的底层仍然是RDD,并且可以充当分布式SQL查询引擎。 1、SparkSQL的由来 SparkSQL的前身是Shark。在Hadoop发展过程中,为了给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具,Hive应运而生,是当时唯一运行在hadoop上的SQL-on-Hadoop工具。但是,MapReduc
云飞扬
2018-05-17
2.4K
0
原 SparkSQL语法及API
spark
sql
SparkSQL语法及API 一、SparkSql基础语法 1、通过方法来使用 1.查询 df.select("id","name").show(); 1>带条件的查询 df.select($"id",$"name").where($"name" === "bbb").show() 2>排序查询 orderBy/sort($"列名") 升序排列 orderBy/sort($"列名".desc) 降序排列 orderBy/sort($"列1" , $"列2".desc) 按两列排序
云飞扬
2018-05-17
1.4K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档