腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
加米谷大数据
加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
专栏作者
举报
296
文章
345630
阅读量
61
订阅数
订阅专栏
申请加入专栏
全部文章(296)
大数据(121)
hadoop(53)
spark(39)
数据分析(38)
数据库(37)
机器学习(31)
java(30)
编程算法(30)
存储(29)
python(27)
分布式(25)
sql(22)
mapreduce(22)
人工智能(20)
apache(19)
数据可视化(18)
hive(17)
数据挖掘(16)
hbase(16)
其他(15)
神经网络(15)
深度学习(13)
开源(13)
网络安全(13)
数据处理(11)
https(11)
node.js(8)
github(8)
api(8)
scala(7)
企业(7)
NLP 服务(6)
git(6)
yarn(6)
zookeeper(6)
c++(5)
nosql(5)
网站(5)
javascript(4)
linux(4)
unix(4)
mongodb(4)
数据安全(4)
http(4)
rpc(4)
数据结构(4)
kafka(4)
区块链(3)
云数据库 Redis(3)
TDSQL MySQL 版(3)
缓存(3)
运维(3)
爬虫(3)
决策树(3)
安全(3)
c#(2)
bash(2)
react(2)
云数据库 SQL Server(2)
ide(2)
spring(2)
shell(2)
jvm(2)
监督学习(2)
微服务(2)
sas(2)
Elasticsearch Service(2)
ICP备案(1)
负载均衡(1)
比特币(1)
数字货币(1)
tensorflow(1)
c 语言(1)
php(1)
perl(1)
ruby(1)
.net(1)
bootstrap(1)
angularjs(1)
vue.js(1)
css(1)
matlab(1)
jar(1)
搜索引擎(1)
windows server(1)
负载均衡缓存(1)
文件存储(1)
云数据库 MongoDB(1)
知识图谱(1)
大数据处理套件 TBDS(1)
图像处理(1)
混合云解决方案(1)
vr 视频解决方案(1)
工业物联(1)
容器(1)
serverless(1)
devops(1)
自动化(1)
图像识别(1)
强化学习(1)
erp(1)
yum(1)
numpy(1)
面向对象编程(1)
opencv(1)
hashmap(1)
线性回归(1)
二叉树(1)
selenium(1)
rabbitmq(1)
迁移学习(1)
windows(1)
物联网(1)
系统架构(1)
架构设计(1)
nat(1)
信息流(1)
云计算(1)
任务调度(1)
虚拟化(1)
5g(1)
es(1)
flink(1)
学习方法(1)
TDSQL-C MySQL 版(1)
app(1)
na(1)
工具(1)
工作流(1)
实践(1)
数据科学(1)
搜索文章
搜索
搜索
关闭
Github标星5300+,专门为程序员开发文档开源管理系统
api
git
github
https
开源
目前,它已经在Github上标星超5300,1.3K个Fork,Github地址:
加米谷大数据
2020-02-14
1.1K
0
0基础大数据开发Spark要学习什么内容?
spark
api
scala
sql
Spark 是专为大规模数据处理而设计的快速通用的计算引擎。用来构建大型的、低延迟的数据分析应用程序。可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等。
加米谷大数据
2019-06-05
510
0
Spark的发展历史
spark
大数据
api
sql
机器学习
Spark是一种通用的大数据计算框架,使用了内存内运算技术。今天加米谷大数据就来简单介绍一下Spark的简史。
加米谷大数据
2019-06-05
3.8K
0
比拼生态和未来,Spark和Flink哪家强?
spark
api
apache
运维
开源
Spark 是最活跃的 Apache 项目之一。Spark 的开源社区一度达到上千的活跃贡献者。最主要推动者是 Databricks,由最初的 Spark 创造者们成立的公司。Spark 因为在引擎方面比 MapReduce 全面占优,经过几年发展和 Hadoop 生态结合较好,已经被广泛视为 Hadoop MapReduce 引擎的取代者。
加米谷大数据
2019-01-09
893
0
spark2.1.0的配置与源码分析
spark
api
hashmap
Spark作为一款优秀的计算框架,也配备了各种各样的系统配置参数(例如:spark.master,spark.app.name,spark.driver.memory,spark.executor.memory等)。
加米谷大数据
2019-01-09
498
0
如何避免HBase写入过快引起的各种问题
hbase
api
rpc
client api ==> RPC ==> server IPC ==> RPC queue ==> RPC handler ==> write WAL ==> write memstore ==> flush to filesystem
加米谷大数据
2018-07-25
905
0
MapReduce API 基本概念
mapreduce
api
在正式分析新旧 API 之前,先要介绍几个基本概念。这些概念贯穿于所有 API 之中,因此,有必要单独讲解。 1、 序列化 序列化是指将结构化对象转为字节流以便于通过网络进行传输或写入持久存储的过程。 反序列化指的是将字节流转为结构化对象的过程。在 Hadoop MapReduce 中,序列化的主要作用有两个:永久存储和进程间通信。 为了能够读取或者存储 Java 对象,MapReduce 编程模型要求用户输入和输出数据 中 的 key 和 value 必 须 是 可 序 列 化 的。 在 Hadoop M
加米谷大数据
2018-04-02
545
0
加米谷:Kafka Connect如何运行管理
api
分布式
kafka
http
上节讲述了Kafka OffsetMonitor:监控消费者和延迟的队列,本节更详细的介绍如何配置,运行和管理Kafka Connect,有兴趣的请关注我们的公众号。
加米谷大数据
2018-03-30
1.7K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档