腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
加米谷大数据
加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
专栏成员
举报
296
文章
360010
阅读量
61
订阅数
订阅专栏
申请加入专栏
全部文章(296)
大数据(121)
hadoop(53)
spark(39)
数据分析(38)
数据库(37)
机器学习(31)
java(30)
编程算法(30)
存储(29)
python(27)
分布式(25)
sql(22)
mapreduce(22)
人工智能(20)
apache(19)
数据可视化(18)
hive(17)
数据挖掘(16)
hbase(16)
其他(15)
神经网络(15)
深度学习(13)
开源(13)
网络安全(13)
数据处理(11)
https(11)
node.js(8)
github(8)
api(8)
scala(7)
企业(7)
NLP 服务(6)
git(6)
yarn(6)
zookeeper(6)
c++(5)
nosql(5)
网站(5)
javascript(4)
linux(4)
unix(4)
mongodb(4)
数据安全(4)
http(4)
rpc(4)
数据结构(4)
kafka(4)
区块链(3)
云数据库 Redis(3)
TDSQL MySQL 版(3)
缓存(3)
运维(3)
爬虫(3)
决策树(3)
安全(3)
c#(2)
bash(2)
react(2)
云数据库 SQL Server(2)
ide(2)
spring(2)
shell(2)
jvm(2)
监督学习(2)
微服务(2)
sas(2)
Elasticsearch Service(2)
ICP备案(1)
负载均衡(1)
比特币(1)
数字货币(1)
tensorflow(1)
c 语言(1)
php(1)
perl(1)
ruby(1)
.net(1)
bootstrap(1)
angularjs(1)
vue.js(1)
css(1)
matlab(1)
jar(1)
搜索引擎(1)
windows server(1)
负载均衡缓存(1)
文件存储(1)
云数据库 MongoDB(1)
知识图谱(1)
大数据处理套件 TBDS(1)
图像处理(1)
混合云解决方案(1)
vr 视频解决方案(1)
工业物联(1)
容器(1)
serverless(1)
devops(1)
自动化(1)
图像识别(1)
强化学习(1)
erp(1)
yum(1)
numpy(1)
面向对象编程(1)
opencv(1)
hashmap(1)
线性回归(1)
二叉树(1)
selenium(1)
rabbitmq(1)
迁移学习(1)
windows(1)
物联网(1)
系统架构(1)
架构设计(1)
nat(1)
信息流(1)
云计算(1)
任务调度(1)
虚拟化(1)
5g(1)
es(1)
flink(1)
学习方法(1)
TDSQL-C MySQL 版(1)
app(1)
na(1)
工具(1)
工作流(1)
实践(1)
数据科学(1)
搜索文章
搜索
搜索
关闭
成为大数据工程师必备的技能有哪些?(上)
hive
mapreduce
http
java
hbase
http://www.aboutyun.com/thread-11873-1-1.html
加米谷大数据
2020-05-09
753
0
0基础入门大数据开发学习的经典书籍推荐
hadoop
hive
hbase
TDSQL MySQL 版
kafka
本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。
加米谷大数据
2019-11-15
890
0
Hadoop的发家简史
hadoop
mapreduce
apache
hbase
说到大数据技术不得不提起Hadoop,今天加米谷大数据就来简单介绍一下Hadoop的简史。
加米谷大数据
2019-06-05
1.6K
0
hdfs hbase hive hbase分别的适用场景
mapreduce
hive
hadoop
hbase
TDSQL MySQL 版
不想用程序语言开发MapReduce的朋友,熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。
加米谷大数据
2019-04-19
1.4K
0
大数据Hadoop入门需要填的坑
hadoop
分布式
hbase
apache
Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效、可伸缩的特点。
加米谷大数据
2019-01-09
444
0
大数据入门之Hadoop基础学习
hbase
hadoop
spark
mapreduce
nosql
目前人工智能和大数据火热,使用的场景也越来越广,日常开发中前端同学也逐渐接触了更多与大数据相关的开发需求。因此对大数据知识也有必要进行一些学习理解。
加米谷大数据
2019-01-09
423
0
hdfs hbase hive hbase分别的适用场景
hive
hbase
数据库
hadoop
不想用程序语言开发MapReduce的朋友,熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。
加米谷大数据
2019-01-08
724
0
大数据技术学习:Hbase应该怎么学?
hbase
数据库
大数据
大数据中HBase是一个分布式的、面向列的开源数据库,Hbase的名字的来源是Hadoop database,即hadoop数据库, HBase中的所有数据文件都存储在Hadoop HDFS文件系统上
加米谷大数据
2019-01-08
693
0
7种最常见的Hadoop和Spark项目
spark
hadoop
sas
hbase
称之为“企业级数据中心”或“数据湖”,这个想法是你有不同的数据源,你想对它们进行数据分析。这类项目包括从所有来源获得数据源(实时或批处理)并且把它们存储在hadoop中。有时,这是成为一个“数据驱动的公司”的第一步;有时,或许你仅仅需要一份漂亮的报告。
加米谷大数据
2018-07-25
371
0
如何避免HBase写入过快引起的各种问题
hbase
api
rpc
client api ==> RPC ==> server IPC ==> RPC queue ==> RPC handler ==> write WAL ==> write memstore ==> flush to filesystem
加米谷大数据
2018-07-25
973
0
Spark Streaming应用与实战全攻略
spark
爬虫
大数据
hbase
有一块业务主要是做爬虫抓取与数据输出,通过大数据这边提供的SOA服务入库到HBase,架构大致如下:
加米谷大数据
2018-07-25
826
0
ZooKeeper在HBase中的应用
zookeeper
hbase
分布式
yarn
HBase主要用ZooKeeper来实现HMaster选举与主备切换、系统容错、RootRegion管理、Region状态管理和分布式SplitWAL任务管理等。 HMaster选举与主备切换 HMaster选举与主备切换的原理和HDFS中NameNode及YARN中ResourceManager的HA原理相同。 系统容错 当HBase启动时,每个RegionServer都会到ZooKeeper的/hbase/rs节点下创建一个信息节点(下文中,我们称该节点为”rs状态节点”),例如/hbase/rs/
加米谷大数据
2018-06-04
2.3K
0
技术分享 | HBase二级索引实现方案
hbase
数据库
1. 概要设计 主要思路: 为每个DataTable创建一个与之对应的IndexTable,通过各种途径,保证IndexTable Region与DataTable Region一一对应,并且存储在同一个RegionServer上,存储结构如图所示。最终要实现的效果是,每个IndexTable Region是对应的DataTable Region的局部索引,使用索引进行查询时,将对每个IndexTable Region进行检索,找出所有符合条件的DataTable RowKey,再根据DataTabl
加米谷大数据
2018-04-02
1.1K
0
技术分享 | 提升Hadoop性能和利用率你知道有哪些吗?
hadoop
hive
mapreduce
java
hbase
时下流行的词汇是大数据和Hadoop。了解大数据的知道Hadoop有三个组件,即HDFS、MapReduce和Yarn。 HDFS代表Hadoop分布式文件系统。 Hadoop分布式文件系统用于整个集群中以块的形式在计算机之间存储数据。 MapReduce是一种编程模型,可以用来编写我们的业务逻辑并获取所需的数据。 而Yarn是HDFS和Spark、Hbase等其他应用程序之间的接口。我们不知道的是,Hadoop使用了很多其他应用程序有助于其最佳性能和利用率。 1、Hbase HBase是一个基于HDFS的
加米谷大数据
2018-04-02
1.3K
0
技术干货 | Hbase的数据坐标
hbase
数据库
Hbase在表里存储数据使用的是四维坐标系统。分别是:行健、列族、列限定符和时间版本。 如: 列族A 行健 列限定符(name) 列限定符(email) 列限定符C(password) aaa 单元(value1) 单元(value4) 单元(value7) bbb 单元(value2) 单元(value5) 单元(value8) ccc 单元(value3) 单元(value6) 时间版本1:单元(value9),时间版本2:单元(value10) 行健按照字典排
加米谷大数据
2018-04-02
1.1K
0
技术干货 | hbase配置详解
hbase
数据库
为了能够让namespace支持使用配置属性,如:namespace下表个数(hbase.namespace.quota.maxtables)或者region个数(hbase.namespace.quota.maxregions) 需要设置hbase.quota.enabled为true或者设置 <property> <name>hbase.coprocessor.region.classes</name> <value>org.apache.hadoop.hbase.namespace.Namespace
加米谷大数据
2018-04-02
1.7K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档