腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在windows 10中启动
hbase
shell时出错
C:\hadoop-3.2.1\
hbase
\bin>
hbase
shell将ruby文件打包到jar中并使用jruby的引导来调用它们,从而取代了这个文件。如果您出于某种原因需要
源码
这个文件,它现在被命名为'jar-bootstrap.rb‘,位于文件
hbase
-shell.jar的根目录中,并位于
源码
树中的'
hbase
-shell/src/main/ruby
浏览 95
提问于2021-01-14
得票数 0
1
回答
Beeline无法创建外部
hbase
表,但配置单元cli可以
、
、
我有
hbase
1.2.3集群,并安装了hive 2.1.1。当我尝试通过beeline/hiveserver2创建外部
hbase
表时,我得到了异常。但是如果我使用hive cli,它是可以的。create语句如下: stored by 'org.apache.hadoop.hive.
hbase
.HBaseStorageHandler' with serdepropert
浏览 5
提问于2017-01-06
得票数 0
1
回答
运行MR代码将数据加载到
HBASE
中
、
、
我是
HBASE
新手,我正尝试从HDFS将数据加载到
HBASE
中,但每次运行MR时都无法执行此操作所有的类文件都在那里我不知道哪里出了问题.To运行MR首先我编译了
源码
并将hadoop和
hbase
库包含在类路径中然后我生成了"
hba
浏览 3
提问于2012-02-27
得票数 0
回答已采纳
2
回答
如何使用flume从mysql中读取数据?
、
、
、
如何使用flume从mysql连续读取数据加载到
hbase
? 我熟悉sqoop,但我需要从mysql
源码
中不断地使用它。是否需要自定义源才能做到这一点?
浏览 3
提问于2012-10-02
得票数 3
5
回答
单节点上的
hbase
安装
、
现在,我正在尝试在其上安装
hbase
(0.94.18版)。但是我得到了以下错误(尽管我已经将其解压缩到/usr/local/
hbase
中):
浏览 1
提问于2014-05-11
得票数 3
1
回答
Hadoop context.write()缓冲区大小
、
、
、
我正在使用带有puts的context.write()从映射器写入
HBase
。根据这个,context.write()不会立即刷新,而是等待缓冲区填满,然后才将它们异步设置到服务器。目的是通过调整缓冲区大小来减少对
HBase
表的RPC调用。
浏览 6
提问于2015-08-07
得票数 0
2
回答
是否有可能从
hbase
转换为spark rdd效率?
、
、
、
我在
hbase
中有一个很大的项目数据集,我想要加载到spark rdd中进行处理。我的理解是,
hbase
针对hadoop上的低延迟单项目搜索进行了
优化
,所以我想知道是否有可能在
hbase
中高效地查询1亿个项目(大约10TB大小)?
浏览 1
提问于2017-10-25
得票数 0
2
回答
Cloudera 5.4.4群集-获取聚合使用指标
、
、
我想从Cloudera5.4.4 Hadoop集群中收集聚合使用指标。我心目中的一些指标如下: 提前感谢!
浏览 1
提问于2015-09-03
得票数 1
回答已采纳
1
回答
为什么
HBase
的全扫描和聚集速度比拼板慢,尽管它也是柱状数据库?
、
、
、
、
我试过使用
Hbase
,第1点和第3点都满足了。但是我发现在
HBase
上进行分析(加载/保存/聚合)非常慢,比使用Parquet慢10倍。我不明白为什么Parquet和
Hbase
都是柱状DBs,而且我们已经很好地分散了
HBase
集群中的工作负载(“每个区域的请求”这么说)。 有什么建议吗?我是不是用错工具做这份工作了?
浏览 0
提问于2018-07-16
得票数 1
回答已采纳
1
回答
上传到
Hbase
后数据大小减小
、
、
、
当文件作为记录从linux机器上传到
Hbase
表时,我们观察到数据大小的减少(文件系统上为10 GB,
Hbase
表中为6-8 GB )。在
hbase
表上没有使用压缩方法,主要压缩也被禁用。
浏览 47
提问于2021-06-23
得票数 0
1
回答
在Spark的MLlib中使用TFIDF生成过程中的内存不足异常
、
、
、
为了给出一个规模概念,我从
HBase
中读取了大约61.5万个(约4GB的文本数据)小文档,并运行了带有8核和6GB执行器内存的spark程序。我已经尝试过增加并行级别和洗牌内存分数,但没有效果。
浏览 1
提问于2014-09-18
得票数 4
回答已采纳
1
回答
使用现有值在
HBase
中向上插入
、
、
我使用
HBase
来存储一些流数据,我有从一个插入到另一个插入的值,并且使用现有的值。我有一个这样创建的表:
hbase
(main):005:0> create ‘mytable’,’mycolfam’ 该表将包含一个名为val的字段 首先,按原样插入数据(key=1、val=10):
hbase
(main):005:0> put 'mytable','1','mycolfam:val',10 然后,我有了相同键'1‘的传入数据(key=1,val=12),并且<
浏览 13
提问于2019-04-02
得票数 2
回答已采纳
1
回答
谁执行
HBase
过滤器?
、
、
哪台机器执行org.apache.hadoop.
hbase
.filter.Filter?因为过滤器是不能串行化的
浏览 0
提问于2018-05-10
得票数 3
回答已采纳
2
回答
HBase
作为web应用后端
、
有人能建议让
HBase
作为基于web的应用程序的主要数据源是否是个好主意吗?我主要关心的是
HBase
对查询的响应时间。有可能有亚秒级的反应吗? 该应用程序将用于显示存储在
HBase
中的数据,例如在过去的24小时中关键字"X“发生了多少次。对于该应用程序80%的请求,我将知道确切的键,20%的请求是扫描(我正在研究与
HBase
模式设计相关的主题,以使其运行得更快)
浏览 0
提问于2012-10-28
得票数 3
1
回答
我想要扫描大量的数据(基于范围的查询),在编写数据时,我可以做什么
优化
,以便扫描变得更快?
、
我在
hbase
中有十亿行,我想一次扫描百万行。什么是最好的
优化
技术,我可以做,使这个扫描尽可能快。
浏览 4
提问于2011-12-08
得票数 3
回答已采纳
1
回答
存储TimeStamp的最佳方法
、
、
、
然后,CSV文件将数据导出到MySQL和
HBase
数据库。我有大约2亿条记录(1TB),因此我需要
优化
每个处理步骤。我应该使用什么数据类型来存储Python、CSV、MySQL和
HBase
数据库中的TimeStamp值?我需要存储TimeStamp值的所有方面。我的模式在CSV文件、MySQL和
HBase
数据库表中有4列。 谢谢!
浏览 0
提问于2015-03-10
得票数 1
2
回答
哪一个是最好的
HBase
连接器用于批量加载数据到
HBase
从火花?
、
正如在中也提到的,主要有两个选项: 我对一个接一个的记录不感兴趣,而是对高吞吐量感兴趣。在深入研究代码之后,似乎两者都求助于TableOutputFormat、DataFrame库是否为大容量加载提供了与RDD库相比的性能改进
浏览 2
提问于2017-11-08
得票数 1
1
回答
利用HADOOP的遥感图像数据
、
实际上,我对hadoop环境并不熟悉,而且遇到了很多困难。有人能帮忙完成以下任务吗?
浏览 0
提问于2018-09-18
得票数 1
3
回答
HBase
上的配置单元与HDFS上的配置单元
、
、
、
我的数据不需要实时加载,所以我不需要使用
HBASE
,但我想知道在MR Jobs中使用
HBASE
是否有任何性能优势,由于索引数据,连接不是应该更快吗? 有人有什么基准吗?
浏览 1
提问于2012-07-29
得票数 2
回答已采纳
2
回答
使用
Hbase
shell手动拆分
Hbase
区域
我们面对的是
HBase
区域的热点。所有写操作都被重定向到一个区域服务器,因此某些映射需要花费大量时间。我想手动拆分区域使用
HBase
外壳,但可以找到任何示例。拆分地域服务器最好的
优化
方式是什么?
浏览 0
提问于2016-03-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券