我需要让存储在hbase中的数据在R中进行分析,但我需要通过Spark来完成,因为数据不适合内存。有人知道如何通过Spark in R访问hbase中的数据吗?
我在网上都找过了,但是没有什么乐趣。我找到了一些页面,解释了如何从R访问hbase中的数据,但它们不是通过Spark来实现的。我看到的所有解释如何在R和Spark中访问数据的页面(使用sparklyr)都提供了iris数据
在今天的一集中,hbase让我不知所措,我们遇到了一个问题,hbase的主控程序启动,然后很快就会死亡。Starting shutdown. at org.apache.hadoop.hbase.master.handler.CreateTableHandler.prepare)
我认为这可能是旧运行的一些残留物,所以我删除了hbase数据<