腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
黑泽君的专栏
专栏作者
举报
708
文章
1681964
阅读量
102
订阅数
订阅专栏
申请加入专栏
全部文章(708)
其他(310)
java(123)
linux(40)
http(35)
编程算法(34)
windows(34)
eclipse(33)
数据库(32)
存储(27)
大数据(25)
xml(23)
html(22)
面向对象编程(20)
sql(19)
安全(19)
ide(18)
git(17)
云数据库 SQL Server(16)
tomcat(16)
python(13)
jar(13)
servlet(12)
jsp(12)
scala(12)
spark(12)
hadoop(12)
api(11)
spring(11)
开源(10)
jdk(10)
云数据库 Redis(8)
容器(8)
jvm(8)
gui(8)
go(7)
node.js(7)
jquery(7)
ajax(7)
oracle(7)
maven(7)
mapreduce(7)
hive(7)
数据结构(7)
bash(6)
腾讯云测试服务(6)
mongodb(6)
hbase(6)
svn(5)
struts(5)
unix(5)
ubuntu(5)
apache(5)
游戏(5)
分布式(5)
缓存(5)
ftp(5)
ios(4)
单片机(4)
mvc(4)
bash 指令(4)
云数据库 MongoDB(4)
shell(4)
jdbc(4)
asp(4)
tcp/ip(4)
dubbo(4)
udp(4)
kafka(4)
bootstrap(3)
json(3)
android(3)
qt(3)
全文检索(3)
centos(3)
网络安全(3)
hashmap(3)
监督学习(3)
zookeeper(3)
kotlin(3)
单元测试(3)
gcc(3)
nat(3)
虚拟化(3)
NLP 服务(2)
数据挖掘(2)
机器学习(2)
php(2)
javascript(2)
ecmascript(2)
arm(2)
打包(2)
搜索引擎(2)
lucene/solr(2)
nginx(2)
神经网络(2)
深度学习(2)
TDSQL MySQL 版(2)
海外加速(2)
腾讯git代码托管(工蜂)(2)
图像处理(2)
电商(2)
express(2)
yarn(2)
自动化(2)
ssh(2)
mybatis(2)
dns(2)
线性回归(2)
grep(2)
aop(2)
rpc(2)
socket编程(2)
数据分析(2)
数据处理(2)
https(2)
云计算(2)
Elasticsearch Service(2)
测试(2)
模型(2)
数据(2)
算法(2)
负载均衡(1)
c 语言(1)
c++(1)
actionscript(1)
汇编语言(1)
嵌入式(1)
github(1)
analyzer(1)
专用宿主机(1)
访问管理(1)
企业邮箱(1)
大数据处理套件 TBDS(1)
人工智能(1)
网站(1)
数据备份(1)
混合云存储(1)
日志数据(1)
出行(1)
reactnative(1)
压力测试(1)
html5(1)
正则表达式(1)
erp(1)
yum(1)
unity(1)
自动化测试(1)
ntp(1)
小程序(1)
notepad ++(1)
es(1)
数据库管理(1)
cmd(1)
editor(1)
exe(1)
file(1)
input(1)
list(1)
readline(1)
settings(1)
show(1)
二进制(1)
面试(1)
异常(1)
搜索文章
搜索
搜索
关闭
大数据技术之_19_Spark学习_06_Spark 源码解析 + Spark 通信架构、脚本解析、standalone 模式启动、提交流程 + Spark Shuffle 过程 + Spark 内存
spark
mapreduce
hashmap
大数据
数据结构
上图展示了 2 个 RDD 进行 JOIN 操作,体现了 RDD 所具备的 5 个主要特性,如下所示: • 1)一组分区 • 2)计算每一个数据分片的函数 • 3)RDD 上的一组依赖 • 4)可选,对于键值对 RDD,有一个 Partitioner(通常是 HashPartitioner) • 5)可选,一组 Preferred location 信息(例如,HDFS 文件的 Block 所在 location 信息) 有了上述特性,能够非常好地通过 RDD 来表达分布式数据集,并作为构建 DAG 图的基础:首先抽象一个分布式计算任务的逻辑表示,最终将任务在实际的物理计算环境中进行处理执行。
黑泽君
2019-05-14
1.3K
0
大数据技术之_19_Spark学习_05_Spark GraphX 应用解析 + Spark GraphX 概述、解析 + 计算模式 + Pregel API + 图算法参考代码 + PageRank
数据结构
分布式
mapreduce
linux
Spark GraphX 是一个分布式图处理框架,它是基于 Spark 平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。那么什么是图,都计算些什么?众所周知社交网络中人与人之间有很多关系链,例如 Twitter、Facebook、微博和微信等,数据中出现网状结构关系都需要图计算。 GraphX 是一个新的 Spark API,它用于图和分布式图(graph-parallel)的计算。GraphX 通过引入弹性分布式属性图(Resilient Distributed Property Graph): 顶点和边均有属性的有向多重图,来扩展Spark RDD。为了支持图计算,GraphX 开发了一组基本的功能操作以及一个优化过的 Pregel API。另外,GraphX 也包含了一个快速增长的图算法和图 builders 的集合,用以简化图分析任务。 从社交网络到语言建模,不断增长的数据规模以及图形数据的重要性已经推动了许多新的分布式图系统的发展。通过限制计算类型以及引入新的技术来切分和分配图,这些系统可以高效地执行复杂的图形算法,比一般的分布式数据计算(data-parallel,如 spark、MapReduce)快很多。
黑泽君
2019-05-14
1.8K
0
大数据技术之_19_Spark学习_05_Spark GraphX 应用解析小结
数据结构
spark
========== Spark GraphX 概述 ========== 1、Spark GraphX是什么? (1)Spark GraphX 是 Spark 的一个模块,主要用于进行以图为核心的计算还有分布式图的计算。 (2)GraphX 他的底层计算也是 RDD 计算,它和 RDD 共用一种存储形态,在展示形态上可以以数据集来表示,也可以图的形式来表示。
黑泽君
2019-05-14
824
0
大数据技术之_19_Spark学习_02_Spark Core 应用解析小结
spark
hadoop
编程算法
数据库
数据结构
1、RDD 全称 弹性分布式数据集 Resilient Distributed Dataset 它就是一个 class。
黑泽君
2019-04-27
640
0
大数据技术之_16_Scala学习_02_变量
scala
编程算法
java
数据结构
第二章 变量2.1 变量是程序的基本组成单位2.2 Scala 变量的介绍2.2.1 概念2.2.2 Scala 变量使用的基本步骤2.3 Scala 变量的基本使用2.4 Scala 变量使用说明2.4.1 变量声明基本语法2.4.2 注意事项2.5 Scala 程序中 +号 的使用2.6 Scala 数据类型2.6.1 scala 数据类型体系一览图2.6.2 scala 数据类型列表2.7 整数类型2.7.1 基本介绍2.7.2 整型的类型2.7.3 整型的使用细节2.8 浮点类型2.8.1 基本介绍2.8.2 浮点型的分类2.8.3 浮点型使用细节2.9 字符类型:Char2.9.1 基本介绍2.9.2 案例演示2.9.3 字符类型使用细节2.9.4 字符类型本质探讨2.10 布尔类型:Boolean2.11 Unit 类型、Null 类型和 Nothing 类型2.11.1 基本说明2.11.2 使用细节和注意事项2.12 值类型转换2.12.1 值类型隐式转换2.12.2 自动类型转换细节说明2.12.3 高级隐式转换和隐式函数2.12.4 强制类型转换2.13 值类型转换练习题2.14 值类型和 String 类型的转换2.14.1 介绍2.14.2 基本数据类型转 String 类型2.14.3 String 类型转基本数据类型2.14.4 注意事项2.15 标识符的命名规范2.15.1 标识符概念2.15.2 标识符的命名规则(要记住)2.15.3 标识符举例说明2.15.4 标识符命名注意事项2.15.5 Scala 关键字2.16 作业01
黑泽君
2019-04-09
1.2K
0
传智播客C++学习感悟
游戏
python
网络安全
数据结构
linux
楼主在本文中将说到C++的学习方式以及亲身经历。本文内容不仅仅限于C++学员,对于那些有意向来学习技术的、或刚来不久、或处在迷茫期的同学可以一同看下,希望在这里楼主能帮到你们什么。
黑泽君
2018-10-11
1.4K
0
从零讲JAVA ,给你一条清晰地学习道路!该学什么就学什么!!
java
数据结构
编程算法
存储
linux
原文链接:https://zhuanlan.zhihu.com/p/25296859
黑泽君
2018-10-11
437
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档