单核可以运行多个spark任务吗？_可以在spark上运行tf转换吗？_任务真的可以在具有多线程的单核处理器上并发工作吗？ - 腾讯云开发者社区

apache-spark

我用一个executor和一个VCore运行了spark代码。Dataframe被重新划分为25个分区。当我在Spark UI中查看舞台时，我惊讶地发现这25个任务与1vcore并行运行。这一点甚至在REST端点得到了确认。我想知道只有1vcore怎么能运行25个任务： 1>是使用线程的这种并发性 2>如果这些是并发调用，如何知道并发的限制

浏览 22提问于2021-07-17得票数 0

回答已采纳

2回答

理解星火与Scala中的并行性

scala、parallel-processing、apache-spark

我对Spark和Scala中的并行性有一些困惑。我正在运行一个实验，在这个实验中，我必须从磁盘中读取许多(csv)文件，然后更改/处理某些列，然后将其写回磁盘。我是在本地主机模式下运行我的实验，参数是火花上下文的参数local2。我的问题是什么时候应该使用scala的并行集合，什么时候应该使用星火上下文的并行化？

浏览 0提问于2013-11-04得票数 9

1回答

任务真的可以在具有多线程的单核处理器上并发工作吗？

multiprocessing、multitasking

我知道任务可以在多核系统中并发运行。每个任务都被分成不同的核心。但是在单核系统中呢？只是任务切换吗？

浏览 15提问于2018-09-08得票数 0

1回答

为什么超级线程或多线程CPU很重要？

multithreading、cpu

基本上，多线程CPU所做的就是在单核内的多个线程之间来回切换.既然单线程和单核CPU可以通过进程之间的上下文切换来执行多任务，那么为什么多线程CPU很重要呢？

浏览 1提问于2014-08-30得票数 1

回答已采纳

2回答

叉子与单芯螺纹

multithreading、fork

假设我有两个任务，每个任务都需要2秒才能完成任务。在目前的现代机器(包括多核)中，如果我有几个繁重的任务，我应该使用哪种方法？叉+线程，意思是创建一些进程，每个进程包含<em

浏览 4提问于2016-12-16得票数 0

回答已采纳

1回答

我正在尝试弄清楚是否有单个任务使用了executor上的所有可用内核来运行？也就是说，如果一个阶段只包含一个任务，这是否意味着该任务是执行器上的单线程单核心处理，或者该任务是否可以以多线程方式使用所有可用核心？我在Azure Databricks中的一个worker (因此是一个executor)上运行ETL作业，并且在管道中的某一点上，单个作业创建了单个阶段，该阶段运行单个任务来处理整个数据集。该任务</e

浏览 31提问于2019-07-19得票数 0

回答已采纳

3回答

任务并行库-单核并行

c#、.net、task-parallel-library

我计划使用TPL，并将这6个WCF服务调用作为6个任务。现在，应用程序可以部署在单核计算机上，也可以部署在多核计算机上。有人告诉我，在单核机器上使用TPL实际上会增加完成任务所需的时间，因为cpu调度器在对不同任务进行时间拼接时会产生开销。这是真的吗。如果是，我应该继续我的设计，还是应该寻找替代方案。

浏览 2提问于2012-08-27得票数 2

回答已采纳

2回答

CPU调度策略(按多线程)

operating-system

在一般操作系统参考书中，就像操作系统的概念…我认为这听起来像是默认的单CPU /单线程。

浏览 0提问于2015-02-08得票数 0

3回答

如何找出linux操作系统在某一时刻运行的进程？

linux、process、operating-system、system-calls

因此，操作系统在给定的时刻执行多个任务并运行一个进程(假设它是一个单核计算机)。有没有一种方法可以跟踪/轮询并找出哪个进程在什么时间运行，以及它被放入队列并被取回的时间。有没有一种方法可以在不修改linux内核源代码的情况下实现这一点？

浏览 1提问于2009-06-29得票数 1

回答已采纳

1回答

运行同一个应用程序的多个副本的火花执行器

apache-spark

在里写着，如果在具有多个执行器的集群中运行同一个应用程序的多个副本(<e

浏览 4提问于2022-02-15得票数 0

2回答

Spark executor &任务并发性

apache-spark、architecture、internal

在Spark中，一个执行器可以同时运行多个任务，可能是2个、5个或6个。executor具有固定数量的内

浏览 1提问于2016-09-08得票数 2

1回答

：local[K]主URL -作业被卡住了

scala、sbt、apache-spark

由于我使用的是具有多个处理器的一台机器，所以在创建local[8]时，我在主URL字段中提到了SparkContext但是每当我提到多个处理器时，作业就会被随机地卡住(暂停/停止)。但是，当我只使用local来代替local[8]时，任务就会无缝地运行，而不会被困住。val sc = new SparkContext(&qu

浏览 4提问于2013-11-25得票数 7

1回答

如何在Spark中并行读写多个表？

scala、parallel-processing、apache-spark、apache-spark-sql

在我的Spark应用程序中，我尝试从RDBMS读取多个表，执行一些数据处理，然后将多个表写入另一个RDBMS，如下所示(在Scala中)：myDF3.write.mode("append").jdbc(myurl2, outtable3, new java.util.Properties) 我知道从一个表中读取数据可以使用分区进行并行如何并行读取多个表(mytable1、myta

浏览 0提问于2015-08-25得票数 8

3回答

如何从PySpark中的不同线程在一个Sparkcontext中运行多个作业？

python、multithreading、apache-spark、pyspark

从有关的火花文档中可以了解到：在给定的Spark应用程序(SparkContext实例)中，如果多个并行作业是从不同的线程提交的，它们可以同时运行。在本节中，“作业”指的是火花操作(例如，保存、收集)和任何需要运行以评估该操作的任务。Spark的调度程序是完全线程安全的，并且支持这个用例，以支持为多个请求服务的应用程序(例如，对多个用户的查询)。有人能给出一个例子，说明如何使用PySpark实现这一点吗<

浏览 0提问于2015-05-13得票数 24

1回答

在Mesos上的Spark比本地慢得多

apache-spark、spark-streaming、mesos

我在16CPU的64 GB RAM主机上运行了一个Spark Streaming进程。我注意到的一件事是，有一个特定的任务在Mesos上比在Local上花费的时间要多得多。Mesos：(2) 另一个注意:我确实设法在另一个Mesos集群上运行了完全相同的Spark Streaming进程，并且它在合理的

浏览 0提问于2016-05-24得票数 1

2回答

Python两个并发线程不能同时打印

python、multithreading

我正在尝试用Python编写一个小的服务器包装器，在其中我可以启动多个服务器，并使它们在同一终端中打印。每个进程将在一个线程中启动，并将stdout打印到终端。它只是在这里测试程序是否可以同时托管和打印内容。如果只执行t.start()，主脚本工作得很好，它将逐个打印1-3，而且它也是从线程运行的，所以它后面的任何代码都可以工作。有人知道这是怎么回事吗？我想如果它不工作，它至少应该是一致的..

浏览 0提问于2017-09-09得票数 1

1回答

StreamingContext无法绑定到Java使用的端口

streaming、spark-java

我已经启动了Spark master和workers，可以很容易地在HDFS上运行像wordcount这样的MapReduce。现在我想在textstream上运行一个流，当我想创建一个新的StreamingContext时，我会遇到这个错误：有没有办法将StreamingContext的端口更改为随机的空闲端口？

浏览 0提问于2013-07-17得票数 1

回答已采纳

3回答

Azure VM定价-拥有80台单核机器和10台8核机器哪个更好？

azure、azure-virtual-machine、azure-powershell

我曾经使用过Azure VM，可以通过两种方式加速这个过程。2)我可以在一个8核的虚拟机上运行应用程序8次，...again克隆该虚拟机，并在我认为需要的任何数量上运行它，以充分加快作业速度。我在测试中注意到，添加8个单核VM和1个8核VM的加速效果大致相同。假设这是真的，那么单核机器在价格上会更好

浏览 20提问于2013-07-16得票数 8

回答已采纳

2回答

Hadoop/Spark中的多线程

hadoop、apache-spark、hadoop-streaming

根据我的知识，Yarn负责管理/控制Spark/Mapreduce作业资源，这里不能想到多线程。不确定它是否可以在Hadoop Eco系统中的任何其他地方使用。

浏览 14提问于2016-11-16得票数 2

1回答

星火代码在作业、阶段和任务中的分布

apache-spark、apache-spark-sql、spark-dataframe

根据我的理解，整个作业中的每一个动作都被转换成作业，而作业中的每一个洗牌阶段都被转换成一个阶段，每个阶段的每个分区都被转换成任务。请告诉我，如果我错了，我无法得到任何实际的定义。

浏览 0提问于2017-08-29得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云