我和一位同事讨论了MongoDB连接器在Hadoop中的使用问题,他解释说这是非常低效的。他说,MongoDB连接器使用它自己的映射减少,然后使用Hadoop映射减少,这在内部减缓整个系统。如果是这样,那么将我的数据传输到Hadoop集群的最有效方法是什么?如果MongoDB连接器效率更低,它有什么用途?在我的场景中,我希望从MongoDB (大约10 my )获取每日插入的数据,并将其全部放入Hadoop中。我还应该指出,每个MongoDB节点和Hadoop节点都共享
username for jdbc:hive2://localhost:10000: Enter password for jdbc:hive2://localhost:10000:
由于我不知道我应该输入什么用户名或密码,所以我将它保留为空,这会导致错误:Error: Failed to open new session: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.sec