spark和mongo db连接器参数化聚合查询_有没有可能在Spark的Cosmos DB连接器中使用Mongo Shell风格的查询？ - 腾讯云开发者社区

、、

我正在尝试从mongo集合创建一个dataframe (在databricks中)，我需要从集合中挑选90天的数据。当我硬编码日期时，它工作得很好，但当我尝试参数化时，我得到了一个错误的java.lang.IllegalArgumentException: requirement failed: Invalid pipelineoption，我需要了解如何将参数传递给此管道查询pipeline = "{'$match': {'timestamp':{$gte: ISODa

浏览 54提问于2021-11-02得票数 0

1回答

有没有可能在Spark的Cosmos DB连接器中使用Mongo Shell风格的查询？

、、

我正在使用Cosmos DB Connector for Spark。是否可以将Mongo Shell“JSON样式”查询与Cosmos DB连接器一起使用，而不是SQL查询？我尝试使用Mongo来实现相同的功能，但是在使用MongoDB连接器时遇到了一些恼人的内存限制错误。所以我放弃了这种方法。这是我更喜欢的查询方式： {

浏览 8提问于2019-11-07得票数 0

1回答

Mongo Hadoop连接器支持的聚合？

、、

我正在尝试使用spark的mongo hadoop ()库对mongo集合进行一些聚合操作。我使用作为输入发送到newApiHadoopRDD的mongo.input.query配置输入查询。";m

浏览 10提问于2016-08-11得票数 1

回答已采纳

2回答

蒙古-火花连接器的工作逻辑是什么？

、、

我一直在试图了解蒙戈火花连接器是如何工作的罩下，但我仍然没有得到整个工作逻辑的背后。entity_df = sqlContext.read.format("com.mongodb.spark.sql.DefaultSource") \如果是，这是否意味着连接器只是一个只在MongoDB和</e

浏览 3提问于2017-12-15得票数 0

回答已采纳

4回答

使用scala从Spark将$group聚合写入mongodb时重复键错误

、、、

在spark上运行的mongodb聚合(特别是使用$group)在写回集合时正在创建重复的_id记录。因此，mongodb正在抛出重复的键错误。顺便说一句，这个查询在mongo中运行得非常好。完成”的{Product Product}组的所有客户和日期。我用的是 import org.apache.spark."org.mongodb.spark" %% "mongo-

浏览 6提问于2017-01-11得票数 2

1回答

Spark Mongo连接器如何验证读取首选项

、

我正在使用spark mongo连接器()。如果我使用的read config设置在not上是正确的，我需要验证几件事。我使用的是读配置 "uri" -> "mongodb://ip:port/db.collection?partitionerOptions.shardkey" -> "key", "partitioner&qu

浏览 0提问于2016-12-02得票数 0

2回答

如何使用来自MongoDB的过滤记录来构建星火数据帧？

、、、

DB中的一个集合具有大量的数据量，并且选择了apache通过计算来检索和生成分析数据。我已经将配置为与MongoDB通信。我需要使用MongoDB吡火花查询来查询集合，并构建一个由mongodb查询结果集组成的数据集。请给我一个适当的解决办法。

浏览 5提问于2016-08-09得票数 3

回答已采纳

2回答

数据库笔记本Scala Spark连接到MongoDB无法初始化类com.mongodb.spark.config.ReadConfig$

、、、、

import org.apache.spark.ml.tuning.{ParamGridBuilder, TrainValidationSplit}import org.apache.spark{SparkConf, SparkContext} import com.mongodb.spark.config.{ReadConfig, WriteConfi

浏览 1提问于2020-05-04得票数 0

1回答

火花-蒙戈连接器SparkR从两个集合中读取

、、

在Spark.mongo连接器中，可以在mongo中查询服务器长度，java和scala提供了有关查询不同集合的更多信息，如下所示：然后，在代码中可以指定另一个集合，设置配置/bin/spark

浏览 3提问于2016-08-23得票数 0

回答已采纳

2回答

如何使用pycharm开发火花放电和mongoDB

、、、、

我需要在MongoDB集合中工作，读和写。一切都很好。我使用下面的包开始使用MongoDB连接然而，问题在于它在命令行中，在命令行中编写大量代码变得非常困难

浏览 3提问于2017-10-14得票数 0

回答已采纳

2回答

如何通过Spark查询MongoDB进行地理空间查询

、

有没有办法使用MongoDB和Spark进行地理空间查询？我不知道如何使用Stratio做到这一点。

浏览 1提问于2016-01-30得票数 2

2回答

火花芒果连接需要很长时间才能实现。

、、

我使用了蒙哥-火花连接器_2.11的火花蒙戈连接器。在下面编写代码，并在火花外壳中运行以进行测试。topic: String): ReadConfig = { val pass = Password val db), "database" -> db, "collection" -> coll, "partitioner" -> partitione

浏览 5提问于2017-08-24得票数 2

3回答

MongoDB和Apache Spark* projection*

、、

在将MongoDB集合拉入Apache Spark/Hadoop时，是否可以通过MongoInputFormat进行投影以减小返回的数据集的大小？

浏览 3提问于2015-02-27得票数 3

1回答

用蒙戈火花连接器连接到mongodb时出错

、、、

我是新的火花/mongodb，我试图使用蒙戈火花连接器从火花放电连接到芒果，按照的指示。' \ 它在启动时提供了以下内容：org.mongodb.spark#mon

浏览 7提问于2020-01-24得票数 1

回答已采纳

1回答

将pyspark数据存储到mongodb会产生一个错误

、、、、

我使用的是spark 2.4.7和python 3.7，mongoDB火花连接器2.4.3在这里是我的代码： .appName("demo")\ &q

浏览 2提问于2021-06-22得票数 1

2回答

使用Spark* SQL在Cassandra表上运行复杂的SQL查询*

、、、

hereI有设置卡桑德拉和火花与卡桑德拉-火花连接器。我可以使用Scala创建RDDs。但是我想使用Spark SQL在Cassandra表上运行复杂的SQL查询(聚合/分析函数/窗口函数)，您能帮助我应该如何继续吗?以下是使用的查询: sqlContext.sql(“CREATE TEMPORARY table words |USING org.apache.spark.sql.cassandra |OPTIONS

浏览 4提问于2017-03-23得票数 1

1回答

将矩阵从MongoDB加载/反序列化为pySpark，添加新的向量列

、、、

我的数据存储在MongoDB中，包含用cPickle序列化的小图像。)client.drop_database(db_name)collection = database我成功地使用正式的DataFrame连接器将数据库中的数据读取到了MongoDB。但是，它们仍然是序列化的：impo

浏览 4提问于2017-04-26得票数 0

回答已采纳

1回答

MongoDB聚合不更新我的集合

、、

我试图使用他们的nodejs驱动程序在Mongo中运行一个聚合查询，这会占用我的一些字段，并添加/查找平均值等等。我在Mongo中构建了聚合并将其导出到节点，但是当我运行代码时，我从Mongo获得了以下响应：const agg = [ '$addFields': {

浏览 3提问于2021-01-15得票数 0

1回答

用于MongoDB连接的参数化链接服务

我试图在azure数据工厂中参数化mongo连接的链接服务。我已将文件提交给您。未能发布*DB(链接服务名称)。原因:至少有一个资源部署操作失败。有关详细信息，请列出部署操作。有关使用细节，请参阅。下面是错误的屏幕截图。

浏览 0提问于2019-07-22得票数 0

回答已采纳

1回答

将sql- Spark -connector库安装到Azure Synapse Apache Spark

、

我正在尝试安装Apache Spark Connector for SQL Server和Azure SQL，以便在大数据分析中使用事务数据，并将结果持久化以进行即席查询或报告。连接器允许您使用任何SQL数据库，本地或云中，作为Spark作业的输入数据源或输出数据宿。spark sql连接器位于此处有人能告诉我如何在Azure Synapse Apache Spark中导入它吗？

浏览 4提问于2021-10-14得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云