如何在另一个模块中使用相同的spark会话_如何在angular中通过不同的路由使用相同的模块_如何在entryComponents中使用另一个模块中的组件？ - 腾讯云开发者社区

、、、、

我必须用两个任务在Airflow中运行两个模块。每个任务都有一个执行一些spark操作的PySpark模块。第二个模块使用在前一个会话中创建的数据帧并继续其操作。同样的SparkSession初始化，如何实现同样的效果？我尝试使用getActiveSession()，但由于任务1作业已完成，因此无法工作，因此当任务2运行时，会创建一个新的

浏览 32提问于2021-11-23得票数 0

2回答

快递4-如何设置额外的自定义cookie与会话？

、、

从阅读不再需要使用cookie解析器中间件来使该模块工作。这个模块现在直接在req/res上读写cookie。如果这个模块和cookie解析器之间的秘密不相同，那么使用cookie解析器可能会导致问题。如果我想设置一个额外的自定义cookie (如loggedIn: true )，我将如何在会话中做到这一点？除了默认的cookies之外，我

浏览 2提问于2016-04-05得票数 2

1回答

在Palantir Foundry的代码工作簿中如何分配执行者？

、

如果我在工作簿A中运行一个计算成本很高的pyspark转换，并试图在工作簿B中运行某些内容，则这两个队列都将永久排队，直到工作簿A中的构建停止，然后工作簿B中的生成立即运行，就好像它在等待工作簿A中的构建

浏览 5提问于2022-03-24得票数 0

回答已采纳

1回答

什么是databricks spark* delta表？它们是否也存储特定会话的数据，以及如何查看这些增量表及其结构*

、、、

spark delta表的用途是什么？它们是要永久存储数据，还是只保留处理数据直到会话持续。如何在spark集群中查看它们，以及它们属于哪个数据库。

浏览 0提问于2018-08-20得票数 1

3回答

如何在maven项目的同一个模块中使用com.fasterxml.jackson 2.8.1和2.6.5？

、、、

我有一个包含Spark 2.1.0和Presto 0.166的模块。Spark 2.1.0需要com.faster.xml版本2.6.5，而Presto 0.166严格要求2.8.1。如何在相同的pom.xml中解决问题，以便可以在相同的模块中运行它们？

浏览 1提问于2017-06-02得票数 2

1回答

提交jars以激发集群时出现的问题

、、、

我试图使用IntelliJ在scala中创建一个基本作业。使用下面的代码，我必须构建scala并使用sbt assembly创建一个jar。然后将这些罐子连同火花-卡桑德拉连接器一起提交给星火星系团。因此，我的问题是如何在Intellij中不创建jar的情况下测试scala代码。而且，每次我更改我的build.sbt文件中的某些内容。它启动了一个下载依赖项的后台任务，即使我已经将其

浏览 4提问于2016-04-15得票数 2

1回答

如何将流与以前的窗口数据连接起来？

、

在spark structured streaming中，将相同in的当前记录集与以前的记录集连接的最佳方式是什么？如何在重启后重新初始化之前的状态？我们已经尝试了HBase来存储之前的状态，但是它变得非常慢。如果我们使用spark任意会话，如何在重启后重新初始化以前的状态？我们现在已经在Kafka streams中实现了这一点。但是想知道在<e

浏览 2提问于2020-07-15得票数 2

1回答

在databricks笔记本中使用多个火花连接

、、、、

我想连接到一个数据库(注册商标)笔记本中的两个数据库表，使用spark和sparklyr：tbl_change_db(sc_one, "first_database_name") sc_two <- sp

浏览 10提问于2022-11-15得票数 1

1回答

将所有内容从ipython中的模块导入到当前命名空间

、

我希望将模块中的所有内容都导入到IPython会话中的全局名称空间中。所以我尝试了from <module> import *，但这不起作用。尽管这在python会话中如预期的那样工作。我如何在IPython中做到这一点？我意识到这是一种糟糕的做法，但我只是想为一个经常使用的模块的</em

浏览 0提问于2012-03-20得票数 0

回答已采纳

3回答

对执行者进行星火会话

、

在部署星火结构流应用程序之后，如何在执行器上获得火花会话，以部署具有相同会话和相同配置设置的另一个作业？

浏览 0提问于2018-02-18得票数 4

回答已采纳

1回答

如何使用sparkSession在数据采集卡中使用火花卡桑德拉连接器写火花放电

、、、、

我使用的是卡桑德拉数据库( cassandra )中的spark-cassandra-connector_2.11-2.3.0.jar和吡火花。我正在从一个键空间读取数据，并将其写入另一个不同的密钥空间。这两个密钥空间有不同的用户名和密码。.load()现在我需要创建另一个会话，因为写表

浏览 6提问于2020-06-10得票数 1

回答已采纳

1回答

从Scala火花代码中调用Pyspark脚本

、、、

Python中有多种资源可以使用Java/Scala代码，但我正在寻找scala->PysparkPythonInterpreter.initializePythonInterpreter()我看到一个错误，上面写着："ImportError:没有一个模块名为pyspark“ 对于

浏览 0提问于2021-08-12得票数 1

回答已采纳

3回答

Spark 1.6.0在集群模式下抛出类广播异常在本地模式下运行良好

、

我在集群模式和本地模式的spark上尝试简单的字数统计示例，它在本地模式下工作得很好，但在集群模式下抛出类强制转换异常这里是代码片段… .set("spark.app.id", "

浏览 0提问于2016-02-21得票数 12

1回答

天蓝色数据库中自定义python模块与spark/dbutils依赖关系

、、、

最近，我在Azure Databricks上使用了预览功能“repos中的文件”，这样我就可以将我的许多通用功能从笔记本转移到模块，并减少为单个任务运行大量笔记本的开销。但是，我的几个函数直接依赖dbutils或spark/pyspark函数(例如dbutils.secrets.get()和spark.conf.set())。由于它们是在笔记本的后台导入的，并且直接绑定到底层会话<

浏览 9提问于2022-03-10得票数 1

回答已采纳

1回答

在自定义包中创建pyspark dataframe？

、、、

我对最佳实践以及如何在包中创建spark会话感到有点困惑，其中包可以在databricks或local上使用。但是假设我有一个函数，它接受一些数据列表或字典，预期的输出是包含数据的pyspark dataframe。我认为单个会话应该足够了，因此需要检查会话是否存在，如果不存在，则创建一个会话。但我只是不确定如何在函数中做到这一点？这是我的代码，为什么它不在一个

浏览 2提问于2020-10-31得票数 0

1回答

如何使用SparkSession的自定义配置文件(不使用spark-submit提交申请)？

、

我有一个独立的python脚本，它通过调用以下几行代码来创建SparkSession，我可以看到它完美地配置了spark-defaults.conf文件中提到的spark会话。spark = SparkSession.builder.appName("Tester").enableHiveSupport().getOrCreate() 如果我想要传递一个参数，另一个包含我想要使用的spark配置<

浏览 23提问于2018-02-07得票数 5

回答已采纳

1回答

如何在所有文件中使用火花变量？

、、、

我正在使用JupyterLab，并且只在本地执行代码。我试图编写一个使用Spark和Python的项目，但是我开始在Spark变量方面遇到一些问题。当我想在其他文件中使用spark变量时，问题就开始了，例如，在代码片段中使用DataProviders.py：

浏览 3提问于2021-07-12得票数 0

回答已采纳

2回答

在两个war文件之间共享会话数据

我有两个war文件，如war1和war2 如果我登录应用程序，会话将在war1中创建，如果am导航到war2，则需要相同的会话数据。我在服务器的context.xml中尝试了context.xml，这样就可以通过将数据存储在servletContext中来访问数据。但问题是，一旦我在chrome中丢失了屏幕，会话数据将存储在servletContext中，并且数据将保持到应用程序运

浏览 0提问于2019-01-18得票数 1

回答已采纳

2回答

AWS ModuleNotFoundError:没有名为“pyarrow”的模块

、、、、

使用AWS EMR w/ Spark 2.4.3export PYSPARK_PYTHON=python3在火花壳中证实了这一点PYTHONPATH会不会因为我不使用anaconda而引起问题？这与星火版和箭版有关吗？这是最奇怪的事

浏览 2提问于2019-08-01得票数 4

回答已采纳

1回答

星星之火:从具有不同内存/内核的单个JVM作业中同时启动

、、、、

为了提高性能，您必须使用不同的信任来启动每个任务，请参见下面的作业类型示例。，那么你如何用不同的会话同时启动多个火花作业呢？等解决问题的可能方法：在相同的SparkSession中为每个星火作业设置不同的会话信任。启动另一个JVM只是为了启动另一个SparkSession，我可以称之为session服务。但你永远不知道有多少工

浏览 2提问于2017-03-09得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云