腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
程序萌部落
个人博客请访问 www.cxmoe.com,自19年8月起搬迁至此。
专栏作者
举报
130
文章
289427
阅读量
27
订阅数
订阅专栏
申请加入专栏
全部文章(130)
编程算法(36)
java(17)
spark(12)
hadoop(12)
sql(10)
ide(10)
javascript(9)
linux(9)
网站(9)
kafka(9)
scala(8)
xml(8)
数据库(8)
打包(8)
http(8)
node.js(7)
api(7)
html(6)
git(6)
jar(6)
网络安全(6)
tcp/ip(6)
hexo(6)
数据结构(6)
https(6)
python(5)
github(5)
maven(5)
深度学习(5)
开源(5)
大数据(5)
bash(4)
云数据库 SQL Server(4)
bash 指令(4)
分布式(4)
jdk(4)
dns(4)
css(3)
jquery(3)
oracle(3)
ubuntu(3)
文件存储(3)
存储(3)
zookeeper(3)
数据处理(3)
数据可视化(3)
虚拟化(3)
机器学习(2)
c++(2)
php(2)
json(2)
ajax(2)
eclipse(2)
apache(2)
神经网络(2)
mapreduce(2)
人工智能(2)
shell(2)
ssh(2)
socket编程(2)
ICP备案(1)
云服务器(1)
其他(1)
actionscript(1)
jsp(1)
opengl(1)
makefile(1)
access(1)
struts(1)
tomcat(1)
centos(1)
腾讯云 tce 解决方案(1)
腾讯云可观测平台(1)
TDSQL MySQL 版(1)
NAT 网关(1)
海外加速(1)
消息队列 CMQ 版(1)
游戏解决方案(1)
渲染(1)
数据迁移(1)
爬虫(1)
html5(1)
hive(1)
面向对象编程(1)
hashmap(1)
seo(1)
rpc(1)
数据分析(1)
windows(1)
hbase(1)
nat(1)
云开发静态网站托管(1)
attr(1)
d3(1)
graph(1)
kettle(1)
line(1)
nonetype(1)
闭包(1)
继承(1)
装饰器(1)
搜索文章
搜索
搜索
关闭
Spark集群从搭建到任务提交-第N次记录
spark
bash
bash 指令
ide
打包
作为一名合格的计算机人士,百折不挠的瞎折腾精神是必备的。今天本想使用一下尘封已久的VMware虚拟机搭的集群,结果发现 Spark 有各种问题,应该是之前潦草搭集群时挖下的坑(前几天也用过,但并不是cluster mode,我现在才知道..),面对这些坑,果断的选择重装啊,所以叒叒叒开始愉快的搭环境了,,
ZONGLYN
2019-08-08
2.1K
0
GraphX编程指南-官方文档-整理
hashmap
数据结构
api
spark
GraphX 是新的(alpha)的图形和图像并行计算的Spark API。从整理上看,GraphX 通过引入 弹性分布式属性图(Resilient Distributed Property Graph)继承了Spark RDD:一个将有效信息放在顶点和边的有向多重图。为了支持图形计算,GraphX 公开了一组基本的运算(例如,subgraph,joinVertices和mapReduceTriplets),以及在一个优化后的 PregelAPI的变形。此外,GraphX 包括越来越多的图算法和 builder 构造器,以简化图形分析任务。
ZONGLYN
2019-08-08
3.9K
0
Spark安装之问题
scala
spark
打包
sql
SparkSQL context 在执行sql语句时,现在使用spark.sql()替换sqlContext.sal()
ZONGLYN
2019-08-08
553
0
分布式执行代码的认知纠正
分布式
spark
scala
java
Spark是一个分布式计算系统/组件/平台,这是都知道的,其用Scala实现Spark任务也是最原生的,但万万不能认为只要是在Spark环境下执行的Scala代码都是分布式执行的,这是大错特错的,一开始一直有错误的认识,但现在想想,如果拿Java和Hadoop的关系来作对比,其就很容易理解了。
ZONGLYN
2019-08-08
591
0
Spark图计算及GraphX简单入门
spark
数据结构
存储
分布式
编程算法
Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。
ZONGLYN
2019-08-08
2.5K
0
使用SBT正确构建IndexedRDD环境
打包
github
git
开源
spark
IndexedRDD由AMPLab的Ankur Dave提出,它是Immutability和Fine-Grained updates的精妙结合。IndexedRDD是一个基于RDD的Key-Value Store,扩展自RDD[(K, V)],可以在IndexRDD上进行高效的查找、更新以及删除。由于其并没有合并到 Spark 的主项目分支,所以在使用时需要引入特别的对其的支持。
ZONGLYN
2019-08-08
1K
0
提交Spark任务的三种方式
ide
打包
spark
jar
在使用Spark的过程中,一般都会经历调试,提交任务等等环节,如果每个环节都可以确认程序的输入结果,那么无疑对加快代码的调试起了很大的作用,现在,借助IDEA可以非常快捷方便的对Spark代码进行调试,在借助IDEA来完成Spark时,可以大致通过以下几个步骤来完成:
ZONGLYN
2019-08-08
5.3K
0
如何使用IDEA加载已有Spark项目
scala
spark
编程算法
ide
背景是这样的:手上有一个学长之前实现的Spark项目,使用到了GraphX,并且用的Scala编写,现在需要再次运行这个项目,但如果直接在IDEA中打开项目,则由于各种错误会导致运行失败,这里就记录一下该如何使用IDEA来加载老旧的Spark项目。 注意:默认你的机器已有Scala环境,项目使用IDEA打开,对Sbt不做要求,因为这里采用的是NoSbt方式添加依赖的。
ZONGLYN
2019-08-08
1.9K
0
IDEA如何在项目中快速添加Maven依赖
maven
jar
spark
编程算法
在日常项目开发中,组件的引入是很平常的事情,一般来说,我们的项目由Maven构建,然后在需要新引入一个依赖时,只需在pom.xml中添加依赖描述即可,但是,有时我们的项目未必采用Maven构建,比如Spark项目就多采用sbt,或者直接添加jar包的方式,这时,如果需要添加某个外部依赖如果采用添加jar包的方式就会非常繁琐,不过IDEA为我们提供了方便的添加方式。
ZONGLYN
2019-08-08
12K
0
基于Spark的大数据热图可视化方法
spark
网站
编程算法
大数据
数据可视化
针对普通客户端浏览和分析大数据困难的问题, 结合 Spark 和 LOD 技术, 以热图为例提出一种面向大数据可视化技术框架. 首先利用 Spark 平台分层并以瓦片为单位并行计算, 然后将结果分布式存储在 HDFS 上, 最后通过web 服务器应用Ajax技术结合地理信息提供各种时空分析服务.文中重点解决了数据点位置和地图之间的映射, 以及由于并行计算导致的热图瓦片之间边缘偏差这2个问题.实验结果表明,该方法将数据交互操作与数据绘制和计算任务分离, 为浏览器端大数据可视化提供了一个新的思路.
ZONGLYN
2019-08-08
1.9K
0
Spark的RDDs相关内容
spark
编程算法
scala
分布式
通常使用parallelize()函数可以创建一个简单的RDD,测试用(为了方便观察结果)。
ZONGLYN
2019-08-08
534
0
Spark的运行环境及远程开发环境的搭建
spark
shell
scala
hadoop
2009 RAD实验室,引入内存存储 2010 开源 2011 AMP实验室,Spark Streaming 2013 Apache顶级项目
ZONGLYN
2019-08-08
2.1K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档