腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
xingoo, 一个梦想做发明家的程序员
专栏成员
举报
805
文章
938540
阅读量
80
订阅数
订阅专栏
申请加入专栏
全部文章(805)
java(111)
其他(97)
编程算法(91)
es 2(47)
spark(39)
数据库(34)
spring(34)
apache(30)
大数据(30)
数据处理(30)
javascript(26)
存储(26)
windows(25)
angularjs(24)
机器学习(23)
oracle(23)
linux(23)
数据结构(23)
html(22)
xml(20)
sql(17)
eclipse(13)
tomcat(13)
jsp(12)
jquery(12)
云数据库 SQL Server(12)
云数据库 Redis(12)
mvc(12)
node.js(11)
udp(11)
安全(11)
api(10)
scala(9)
汇编语言(9)
容器(9)
hadoop(9)
c++(8)
深度学习(8)
开源(8)
分布式(8)
shell(8)
aop(8)
servlet(7)
缓存(7)
jvm(7)
jdbc(7)
指针(7)
c 语言(6)
ruby(6)
css(6)
图像处理(6)
http(6)
hbase(6)
函数(6)
json(5)
打包(5)
git(5)
运维(5)
hashmap(5)
二叉树(5)
https(5)
flink(5)
tensorflow(4)
bootstrap(4)
ajax(4)
android(4)
maven(4)
腾讯云测试服务(4)
人工智能(4)
mybatis(4)
zookeeper(4)
队列(4)
ios(3)
.net(3)
ecmascript(3)
github(3)
容器镜像服务(3)
神经网络(3)
mapreduce(3)
网络安全(3)
yum(3)
推荐系统(3)
线性回归(3)
tcp/ip(3)
单元测试(3)
架构设计(3)
io(3)
ip(3)
size(3)
python(2)
go(2)
nosql(2)
access(2)
ide(2)
svn(2)
jar(2)
struts(2)
lucene/solr(2)
mongodb(2)
express(2)
yarn(2)
游戏(2)
html5(2)
面向对象编程(2)
keras(2)
kernel(2)
汽车(2)
cuda(2)
int(2)
服务器(2)
接口(2)
链表(2)
连接(2)
排序(2)
设计模式(2)
搜索(2)
算法(2)
对象存储(1)
负载均衡(1)
mac os(1)
php(1)
c#(1)
lua(1)
bash(1)
listview(1)
textview(1)
搜索引擎(1)
unix(1)
centos(1)
负载均衡缓存(1)
企业邮箱(1)
知识图谱(1)
数字营销(1)
腾讯专有云 PaaS 平台(1)
kubernetes(1)
grunt(1)
自动化(1)
黑客(1)
压力测试(1)
数据迁移(1)
爬虫(1)
无人驾驶(1)
jdk(1)
图像识别(1)
ssh(1)
正则表达式(1)
numpy(1)
dns(1)
opencv(1)
npm(1)
grep(1)
自动化测试(1)
cdn(1)
dubbo(1)
gcc(1)
socket编程(1)
uml(1)
无监督学习(1)
微信(1)
小程序(1)
安全漏洞(1)
系统架构(1)
nat(1)
虚拟化(1)
abstraction(1)
acrobat(1)
adobe(1)
arguments(1)
bi(1)
break(1)
class(1)
component(1)
decorator(1)
default(1)
device(1)
distributed(1)
dom(1)
double(1)
editor(1)
expression(1)
google(1)
handle(1)
hdfs(1)
host(1)
keydown(1)
kibana(1)
pdf(1)
ps(1)
search(1)
shadow(1)
shutdown(1)
state(1)
status(1)
stl(1)
sum(1)
swt(1)
unsigned(1)
viewer(1)
void(1)
winsock(1)
word(1)
编程(1)
遍历(1)
变量(1)
编译器(1)
测试(1)
对象(1)
后端(1)
集合(1)
计算机(1)
进程(1)
路由器(1)
配置(1)
事件(1)
数学(1)
数组(1)
思维导图(1)
网络(1)
系统(1)
效率(1)
学习笔记(1)
优化(1)
语法(1)
终端(1)
主机(1)
搜索文章
搜索
搜索
关闭
HBase官方文档 之 Region的相关知识
hbase
存储
大数据
一般来说对于每个Region Server,官方推荐最好是控制Region的数量在20-200个、大小在5-20Gb左右。
用户1154259
2018-07-31
813
0
spark踩坑——dataframe写入hbase连接异常
spark
hbase
最近测试环境基于shc[https://github.com/hortonworks-spark/shc]的hbase-connector总是异常连接不到zookeeper,看下报错日志: 18/06/20 10:45:02 INFO RecoverableZooKeeper: Process identifier=hconnection-0x5175ab05 connecting to ZooKeeper ensemble=localhost:2181 18/06/20 10:45:02 INFO Rec
用户1154259
2018-06-21
2.3K
0
Spark DataFrame写入HBase的常用方式
spark
hbase
Spark是目前最流行的分布式计算框架,而HBase则是在HDFS之上的列式分布式存储引擎,基于Spark做离线或者实时计算,数据结果保存在HBase中是目前很流行的做法。例如用户画像、单品画像、推荐系统等都可以用HBase作为存储媒介,供客户端使用。 因此Spark如何向HBase中写数据就成为很重要的一个环节了。本文将会介绍三种写入的方式,其中一种还在期待中,暂且官网即可... 代码在spark 2.2.0版本亲测 1. 基于HBase API批量写入 第一种是最简单的使用方式了,就是基于RDD的分区
用户1154259
2018-03-28
4.2K
0
Hbase多版本的读写(Shell&Java API版)
hbase
shell
java
Hbase是基于HDFS的NOsql数据库,它很多地方跟数据库差不多,也有很多不同的地方。这里就不一一列举了,不过Hbase有个版本控制的特性,这个特性在很多场景下都会发挥很大的作用。本篇就介绍下基于Shell和Java API的Hbase多版本的读写。 为了更好的理解多版本,我们可以把普通的数据存储理解成二维空间,提供了rowkey,列族,列几个存储的维度。那么版本则相当于二维空间升华到了三维空间,多了时间维度的概念。如果按照默认的操作,当前的时间戳就是版本号,每个数据都可以保留多个版本的数据。你可
用户1154259
2018-01-17
2.7K
0
Hbase常用Shell命令
hbase
shell
status 查看系统状态 hbase(main):010:0> status 1 active master, 0 backup masters, 4 servers, 0 dead, 6.5000 average load version 查看版本号 hbase(main):011:0> version 1.2.0-cdh5.7.2, rUnknown, Fri Jul 22 12:20:40 PDT 2016 table_help 查看提示信息 hbase(main):012:0> table_hel
用户1154259
2018-01-17
1.4K
0
推荐系统那点事 —— 什么是用户画像?
nosql
云数据库 Redis
hbase
用户画像在大数据分析中是一种很有用的系统,它可以各种不同的系统中,起到很关键的作用。比如搜索引擎、推荐系统、内容系统等等,可以帮助应用实现千人千面、个性化、精准等的效果。 下面将从几个方面来说一下
用户1154259
2018-01-17
2.2K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档