这个复杂的逻辑可以用在spark中吗？

、、

我有一些像follow结构这样的数据，数据量非常大。我找不到合适的逻辑来使用spark。1.你知道第一个数据的时间序列是2016-04-29,00:40:15。我想获取下一个数据，它是小于18秒的最后一个数据。我会得到第二个数据: 2016-04-29,00:40:24,2第三个数据是: 2015-04-29,00:40:36,2 2.如果下一个数据的标志与引物的数据不同，我将获得这个数据，无论它是否是小于18secs.And

浏览 3提问于2016-08-15得票数 0

1回答

在UDT上激发SQL表达式

、、

我有一个UDT (用户定义的类型)。我想在Spark表达式中使用它，例如UDTName * 10.3。我的UDT不仅仅是一个简单的数字，它是一个复杂的类型，它对+-/*有自己的重写函数。我无法用标准scala类型实现我想要的逻辑。我尝试在Spark1.6.0中的Spark表达式中使用这个表达式，并得到了以下结果：无法解析“(UDTN

浏览 2提问于2016-01-18得票数 2

回答已采纳

1回答

Apache Spark* - Map Reduce调试技巧*

、、

我正在尝试实现Kafka - Spark环境。我正在尝试调试我的MapReduce逻辑(用Java语言实现)。Spark提交步骤使我的算法中的断点调试变得复杂。传入的实时数据模式很复杂。模拟复杂的算法将是一个非常耗时的过程。更好的开发环境将帮助开发人员在实时流数据上验证他们的map reduce逻辑。请给我一

浏览 1提问于2015-05-31得票数 1

1回答

如何掌握spark* sql*

、

我是一位能激发sql活力的纽比。我发现编写具有复杂逻辑的spark查询程序可能非常棘手。例如，我知道spark sql库中的运算符是相当有限的，所以有时我们需要实现UDF。但是，您如何知道库操作员是否可以执行某些操作？如何知道是否需要实现UDF？我发现很多开发者都能写出精美的Spark程序。你是怎么掌握Spark的？如何使用Spark SQL提高

浏览 29提问于2020-07-05得票数 0

回答已采纳

1回答

无法理解scala操作是如何在Apache spark中运行的

、、、、

我所了解到的是，火花作业在有任务要在RDDS上操作的阶段上工作，在这些阶段中，它们是通过从spark控制台开始的惰性转换创建的。(如果我错了，请纠正我) ，那么这些函数和应用在RDDs上的任务之间有什么关系呢?Scala的编码有RDD上的操作，据我所知，RDD是<e

浏览 0提问于2019-07-07得票数 0

1回答

连接到另一个mysql数据库，并在更新其他数据库时更新数据库表

、

有没有可能在连接一个远程mysql服务器的同时自动更新另一个数据库？例如我的数据库：在数据库二中添加或更新用户时，数据库一中的用户名也会更新。如果可能的话，我该怎么做呢？提前感谢

浏览 2提问于2010-11-21得票数 0

回答已采纳

1回答

共享火花会话

假设我有一个python文件my_python.py，在其中我创建了一个SparkSession 'spark‘。我有一个jar，比如my_jar.jar，其中写了一些火花逻辑。我不是在我的jar中创建SparkSession，而是想使用在my_python.py中创建的同一个会话。如何编写一个spark-submit命令，它以我的python文件、我的jar和我的火花会话‘S火花’作为j

浏览 0提问于2019-08-12得票数 0

回答已采纳

1回答

oracle nvl且不在spark* sql中的函数中*

、、

我正在尝试在spark 1.5.0中实现下面的oracle逻辑，我有如下select查询select name, id, age, country, CASE WHEN (id is not我想在spark中实现case和NVL逻辑，有人可以帮助我如何使用数据帧在spark scala API中实现这个逻辑吗？

浏览 1提问于2017-01-24得票数 1

2回答

jetty 9 websocket中的Uri路径参数

、、

我使用在jetty 9服务器上运行的spark 2.5创建了websocket如何在jetty 9 websocket中捕获路径参数？

浏览 5提问于2016-11-24得票数 0

1回答

用于PySpark 3.1.1的Elasticsearch插件

、、

我成功地在PySpark 2.4.5中使用了Elasticsearch Spark 7.12.0。读写都很完美。现在，我正在测试升级到Spark 3.1.1，这个集成不再起作用了。在2.4.5和3.1.1之间，PySpark中没有代码更改。有兼容的插件吗？有没有人把这个用在PySpark 3.1.1上？错误： ?

浏览 59提问于2021-03-27得票数 0

2回答

将函数应用于Spark* DataFrame中的所有单元格*

、、、、

我正在尝试将一些Pandas代码转换为Spark以进行缩放。myfunc是一个复杂应用程序接口的包装器，它接受一个字符串并返回一个新的字符串(这意味着我不能使用矢量化函数)。这将有效地修改DataFrame中的所有单元。这就是我迷路的地方。我需要一个UDF，一个panda

浏览 2提问于2019-02-02得票数 1

回答已采纳

1回答

将昂贵的初始化java.util.concurrent.Callables迁移到Apache

、

更确切地说：有些数据确实可以在工人之间共享，例如，一些查找表，但不需要共享。工作人员可以在处理条目时更改数据，然后才以快速的方式重

浏览 4提问于2016-10-06得票数 0

回答已采纳

1回答

如何在Spark中使用自定义类型安全聚合器

、、、

星火文档描述了如何同时创建一个 () (又名 )和一个 () (也就是org.apache.spark.sql.expressions.Aggregator的一个子类)。我知道您可以通过spark.udf.register("udafName", udafInstance)注册一个使用在sql中的udaf，然后像使用spark.sql("SELECT udafName(在sql中也有使用聚合器的<

浏览 0提问于2018-06-28得票数 1

回答已采纳

1回答

Flex Spark* DataGrid: GridItemEditor中的ReferenceError #1069*

、、、

我正在为spark DataGrid编写一个通用的<s:GridItemEditor>，以根据属性类型动态创建一个适当的UIComponent进行编辑。链接到GridColumn的一些属性很复杂，例如：我在这个复杂的属性中遇到了这个错误在sp

浏览 3提问于2012-03-24得票数 0

回答已采纳

2回答

为什么运行导出的jar文件提供“线程中的异常”主“java.io.IOException；类未找到”？

、

如何将这个库包含在jar文件中？我如何在这个包中运行一个应用程序？

浏览 4提问于2016-11-19得票数 2

回答已采纳

1回答

Spark Streaming -调用REST API与为Spark Streaming原生构建功能

我们有一个管理时间序列数据的特定功能。该功能已经作为REST API提供，并在Cloudfoundry上运行。我们希望提供对使用Spark Streaming和kafka摄取时间序列数据的支持，以便解决方案更具可扩展性和健壮性。从spark streaming内部调用REST API在spark中原生构建功能有什么缺点？

浏览 8提问于2017-02-16得票数 0

1回答

可以获得pyspark数据帧的源/原始查询吗

、

输入：输出：

浏览 0提问于2020-05-10得票数 0

2回答

如何在Java中对返回布尔值的函数的输出进行反转或补码

、、

我正在用java编写一个spark代码，需要将一个数据集分成两部分。基于某种条件。Doesn't work 现在很明显，我可以写另一个过滤函数，返回false，但内部逻辑很复杂，我不想重写相同的逻辑，也不想使用相同的过滤函数。在java中有没有一种方法可以包装这个函数，并在某种程度上得到补码呢？

浏览 29提问于2020-01-30得票数 0

回答已采纳

2回答

数据库.自动并行性和Spark

、、、

我有一个关于数据库单元格和Spark的自动并行性的一般性问题。我有一个摘要表，其中有许多字段，其中大多数字段背后有一个复杂的逻辑。如果我在单个单元中放置单个字段逻辑的块(%SQL)，调度程序是否会自动尝试将单元分配到集群中的不同节点以提高性能(取决于我的集群有多少节点)？或者，我可以使用它们的PySpark函数来组织并行运行吗？我正在使用LTS 10.4 (<em

浏览 3提问于2022-05-04得票数 0

回答已采纳

3回答

可以从不同的spark上下文访问RDD吗

、、

我是spark的新手。是否可以使用在不同spark上下文中定义的RDD？如果是，是如何实现的。我们在spark context1中创建一个hive表t1的RDD。我们是否可以在不同的spark工作中使用(参考) RDD。

浏览 49提问于2016-08-12得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在UDT上激发SQL表达式

Apache Spark* - Map Reduce调试技巧*

如何掌握spark* sql*

无法理解scala操作是如何在Apache spark中运行的

连接到另一个mysql数据库，并在更新其他数据库时更新数据库表

共享火花会话

oracle nvl且不在spark* sql中的函数中*

jetty 9 websocket中的Uri路径参数

用于PySpark 3.1.1的Elasticsearch插件

将函数应用于Spark* DataFrame中的所有单元格*

将昂贵的初始化java.util.concurrent.Callables迁移到Apache

如何在Spark中使用自定义类型安全聚合器

Flex Spark* DataGrid: GridItemEditor中的ReferenceError #1069*

为什么运行导出的jar文件提供“线程中的异常”主“java.io.IOException；类未找到”？

Spark Streaming -调用REST API与为Spark Streaming原生构建功能

可以获得pyspark数据帧的源/原始查询吗

如何在Java中对返回布尔值的函数的输出进行反转或补码

数据库.自动并行性和Spark

可以从不同的spark上下文访问RDD吗

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐