我正在尝试使用五旬节数据集成社区版从MongoDB读取数据。在尝试执行MongoDB输入步骤时,我会得到身份验证失败的错误。我发现,错误是由于MongoDb中缺少的驱动程序造成的。当试图通过在MongoDbMongoDb输入步骤中提供MongoDb连接详细信息来获取Dbs时,我得到了错误java.nullpointerException。 at org.pentaho.di.ui
我和一位同事讨论了MongoDB连接器在Hadoop中的使用问题,他解释说这是非常低效的。他说,MongoDB连接器使用它自己的映射减少,然后使用Hadoop映射减少,这在内部减缓整个系统。如果MongoDB连接器效率更低,它有什么用途?在我的场景中,我希望从MongoDB (大约10 my )获取每日插入的数据,并将其全部放入Hadoop中。我还应该指出,每个MongoDB节点和Hadoop节点都共享相同的服务器。