首页
学习
活动
专区
工具
TVP
发布

奇点大数据

专栏作者
243
文章
215364
阅读量
50
订阅数
Hbase优化
本文对hbase集群进行优化,主要涵盖硬件和操作系统,网络通信,JVM,查询,写入,核心服务,配置参数,zookeeper,表设计等多方面。 我们对hbase的应用主要是用户画像,根据自身使用场景做一些优化。难免有片面之处。 一、软硬件优化: 1. 配置内存,cpu HBase的LSM树结构,缓存机制和日志机制对内存消耗非常大,所以内存越大越好。 其中过滤器,数据压缩,多条件组合扫描等场景都是cpu密集型的,所以cpu也要够强悍 2. 操作系统 选择主流linux发行版,JVM推荐用Sun
刀刀老高
2018-04-11
1.3K0
RHadoop应用(1)
使用RHadoop结合hdfs存储R语言输入数据 1 R语言是著名的开源统计分析和绘图语言,但限于功能,只能进行单机存储数据和计算,通过hadoop的功能可以存储更多的数据和并行计算。 Rhadoop包括rhdfs、rmr2、rhbase等R语言插件,rhdfs插件可以加载hdfs文件系统,rmr2可以使用mapreduce做并行计算。 这里先使用rhdfs来简单介绍下r语言怎样读取较大的文件 2 首先安装rhdfs插件,由于R语言要调用java 因此需要安装rjava插件 install.package
刀刀老高
2018-04-11
6900
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档