文章/答案/技术大牛

发布

为什么pyspark脚本的性能没有随着内核和执行器数量的增加而提高？

pyspark是一种基于Python的Spark编程框架，用于处理大规模数据集的分布式计算。尽管增加内核和执行器数量可以提高Spark作业的并行度和处理能力，但pyspark脚本的性能并不总是随着内核和执行器数量的增加而线性提高的原因有以下几点：

数据倾斜：在分布式计算中，数据倾斜是指数据在分区中不均匀分布的情况。当某些分区中的数据量远远超过其他分区时，会导致某些任务的执行时间明显延长，从而影响整个作业的性能。这种情况下，增加内核和执行器数量并不能解决数据倾斜问题，需要通过数据预处理、数据重分区等技术来解决。
网络通信开销：在分布式计算中，不同节点之间需要通过网络进行数据传输和通信。当内核和执行器数量增加时，节点之间的通信量也会增加，可能导致网络带宽和延迟成为性能瓶颈。特别是在大规模集群中，网络通信开销可能会限制整个作业的性能提升。
任务调度和资源管理：增加内核和执行器数量会增加任务的并行度，但同时也增加了任务调度和资源管理的复杂性。Spark需要根据可用资源和任务依赖关系来动态调度任务，确保任务能够在合适的节点上执行。当内核和执行器数量增加时，任务调度和资源管理的开销也会增加，可能导致性能提升不明显。

为了提高pyspark脚本的性能，可以考虑以下几点优化策略：

数据预处理和优化：对数据进行预处理，如数据清洗、过滤、重分区等，以减少数据倾斜和提高数据的均匀性。可以使用Spark提供的数据转换和操作函数来实现。
并行度调优：根据集群的资源情况和作业的特点，合理设置内核和执行器的数量，避免资源浪费和过度调度开销。可以通过调整Spark的配置参数来实现。
缓存和持久化：对于频繁使用的数据集，可以使用Spark的缓存机制将数据存储在内存中，以减少重复计算和IO开销。可以使用cache()或persist()函数来实现。
数据压缩和序列化：对于大规模数据集，可以考虑使用数据压缩和序列化技术来减少网络传输和存储开销。Spark提供了多种数据压缩和序列化格式的支持，如Snappy、Gzip、Avro等。
硬件和网络优化：确保集群的硬件配置和网络带宽能够满足作业的需求。可以考虑使用高性能的网络设备和存储设备，以提高数据传输和IO性能。

对于pyspark脚本的性能优化，腾讯云提供了一系列的云计算产品和服务，如弹性MapReduce（EMR）、云服务器CVM、云数据库CDB等，可以根据具体需求选择适合的产品和服务来提升性能。具体产品介绍和链接地址可以参考腾讯云官方网站的相关页面。

为什么pyspark脚本的性能没有随着内核和执行器数量的增加而提高？

、、

我有一个脚本，通过加载一个预先训练好的模型来进行二进制分类。我想知道为什么当我尝试不同的数量执行器和执行器核心的组合时，我总是得到大致相同的性能。以下是我的pyspark脚本中的重要代码行： start = time.time() # aug_comb_mldf = df

浏览 12提问于2020-12-09得票数 0

1回答

Apache Spark在本地模式下性能下降

、、、

我正在为Spark 2.0.2 运行一个简单的性能测试，我在一台有4核和16 am内存的笔记本电脑上使用Pi估计示例，如下所示：NUM_SAMPLES: Int = 16000000045 sec 我没有</

浏览 3提问于2016-11-21得票数 2

1回答

增加NIFI中的并发任务数并不能提高性能

、

我有一个执行ExecuteStreamCommand脚本的Python处理器。这需要很长时间来执行~5分钟。所以我增加了并发任务的数量，从1，4和8，但这已经发生了。对性能没有影响。我有一台8核的英特尔i9 Mac机，内存为32 GB。我读到，通常并发任务的数量大约等于内核的2到4倍。你能告诉我为什么没有改善吗？如何提高

浏览 0提问于2020-03-03得票数 0

1回答

拓扑，为查询规范化器分配了一个执行器 具有4个执行器的拓扑，分配给查询规范化器最初，我运行拓扑时，只将1执行器分配给QueryNormalizer。为了加快速度，我将QueryNormalizer中的执行器数量更改为4，.The执行延迟改为197.616，进程延迟更改为59.132<code>e 225</code>。根据执行延迟的定义--元组在执行方法中花费的平均时间。execute方

浏览 1提问于2015-07-22得票数 4

回答已采纳

1回答

read()和write()中内存区域参数的大小如何影响IO性能？

、、

)ﬁle，并允许用户利用shell的I/O重定向功能。用于此测试的Linux ext4ﬁle系统是具有4096字节块的Linuxﬁle系统。( st_blksize值为4 096。)这说明了在BUFFSIZE 4,096附近开始的少数定时测量时系统时间的最小值。超过这个限制增加缓冲区大小几乎没有什么积极的作用。 BUFFSIZE如何影响读取文件的性能？随着BUFFSIZE<em

浏览 3提问于2019-05-28得票数 1

回答已采纳

1回答

Spark K-means性能随节点/实例的增加而降低

、、、、

我使用的实例大小为8vCPU和32 am内存。我本以为随着集群上节点数量的增加，Spark的性能会提高(执行时间减少)，但我得到的却是相反的结果。使用更多的工作节点/实例比使用单个工作节点的性能更差(执行时间更长)。对于包含5个、10个和15个工作节点的集群，我也得到了相同的结果；

浏览 11提问于2019-10-23得票数 0

1回答

tensorflow的可扩展性

、

全,在编号的</e

浏览 0提问于2016-11-23得票数 0

1回答

如何使用执行器使我的星火作业运行得更快？

、、、

我知道我的代码没有反模式，因为我的编写代码编辑器中没有任何警告，所以我知道我的代码正在执行分布式和可伸缩的PySpark操作。我目前的工作有两个执行者分配给它，每个两个核心，它运行的任务并行性为16，如火花详细信息页所示。我怎样才能让这份工作跑得更快？

浏览 3提问于2022-01-31得票数 1

回答已采纳

2回答

英特尔涡轮增压与多核性能关系

、、

我看到了一条关于禁用涡轮增压以提高多核性能的建议。.This是链接中的准确措辞：禁用turbo boost，以确保性能随内核数量的增加而增加。我一直认为，更快的时钟速度意味着更多的ups和更高的性能。因此，涡轮增压应该总是有帮助的，至少不应该损害系统的性能。

浏览 3提问于2016-06-01得票数 0

1回答

如何在多CPU内核上高效运行Django

、、、、

我正在开发一个web应用程序，当我增加CPU核心的数量时，Django的性能并没有提高。(实际上1核的性能最高，2,4,8核的性能差别不大)如果是这样，我如何<e

浏览 2提问于2015-12-03得票数 4

1回答

jquery ui自动完成性能

、、

我有一个页面，可以有大量的控件与自动完成附加的数量。(超过70)我发现我的页面变慢了，IE甚至会显示停止脚本的警告。我还发现浏览器使用的内存会随着每次回发而开始增加-它可能最终会达到近300MB，在此之后IE会真正减慢或停止响应。在使用大量的自动完成控件时，有没有人有过类似的经验？有没有办法提高它的性能呢？

浏览 2提问于2011-11-16得票数 2

回答已采纳

1回答

关于超参数整定的两个问题

、、、、

问题1:在同一数据集上测试时，对超参数执行网格搜索是否保证了性能的提高？我问这个问题是因为我的直觉是“是的”，但是在调整我的正则化常数之后，我得到了更低

浏览 0提问于2020-04-05得票数 1

2回答

在tomcat中使用ThreadPool excutor服务来加速请求

、、、、

我的一个请求(平均约10秒)使用多线程可以显著提高性能，因为这是一项仅使用CPU的任务，而且我使用的是>= 8内核。我只是想知道这样做是聪明的，还是只是表面上的改变：当然，对于单用户情况来说，这是一种改进。但是如果负载增加了会发生什么呢？我有一个有限的CPU能力，这是在几个HTTP连接器线程之间共享的时刻。假设我已经对它们进行了优化配置，我将不得不从http连接器线程池中提取一些线程，并将其

浏览 0提问于2011-02-15得票数 2

1回答

增加工作线程数不会影响Netty IO性能

、、

在默认工作线程池大小下运行(在Netty内部设置为2 x内核数量)，性能分析显示吞吐量上限为1k请求/秒，请求速率的进一步增加会导致延迟几乎呈线性增加。当最大CPU利用率显示为60%时，我按照下面的代码增加了工作线程的数量。然而，性能几乎没有任何变化，CPU的上限仍然是60-70%。该进程不受内存、I/O或网络带宽的限制。为什么</em

浏览 26提问于2020-05-17得票数 0

1回答

不影响numpy均值性能的MKL线程数

、、

我正在尝试优化调用numpy.mean()时使用的MKL库线程的数量(我使用的是针对MKL库构建的numpy )。线程的数量可以在运行时使用mkl-service库中的mkl.set_num_threads(n)动态控制。虽然这确实正确地设置了线程的数量，实际上这在htop的CPU使用率中得到了验证，但我很困惑地发现它对运行时没有任何影响。，它将占用相同的时间。C

浏览 23提问于2019-03-23得票数 0

1回答

在webpacker Rails 6中推荐多少个包？

、、

我正在使用webpacker，我发现随着包数量的增加，构建时间也会显著增加。我现在减到只有一个了。但我想知道是否有一个理想的数字可以在不影响开发和生产的构建时间的情况下进行。4个包的构建时间是7秒，1个包的构建时间是3秒。

浏览 14提问于2020-07-09得票数 0

1回答

提高cassandra的性能

、、、

如果我增加稳定的大小，性能将是完美的，请任何人可以列出我想要编辑它的所有关键参数，以提高cassandra的性能。我认为现有的很多参数都想改变它。我尝试编辑cassandra-env.sh以增加内核数量和堆大小 system_memory_in_mb="50000" system_cpu_cores="16" 我没有任何错误，但我在写入时有很

浏览 21提问于2019-09-12得票数 0

1回答

启动更多的CUDA线程块是否比启动更少的线程块有更多的开销？

、、、

我用CUDA做了一些实验，我注意到启动相同的基本内核：void add(int n, float *x, float *y) int index = threadIdx.x(总是512个线程的块)要慢。注意，我总是等着然而，在GPU IIRC上，我们没有通常意义上的线程，但我们只是有不同的物理核心，否则就不会使用。我甚至不认为这可能是内存问题，因为

浏览 3提问于2021-06-10得票数 2

1回答

火花流卡夫卡接收器API - numPartitions

、、

我们无法通过增加numPartitions来增加消耗事件的数量。增加numPartitions似乎不影响性能。KafkaUtils.createStream方法有一个topic_name到numPartitions映射，而每个分区应该在自己的线程中使用。，但这并没有提高性能(我确保每个接收方实际上使用了10个线程)。然而，如果我创建更多的卡夫卡接收器(据我理解，这完全等同于增加线程

浏览 4提问于2017-12-26得票数 0

1回答

火花溢出与指定的执行器内存无关

、、

我注意到了在使用spark 2.0运行pyspark应用程序时的奇怪行为。在我的脚本的第一步中，涉及到一个reduceByKey (因此是洗牌)操作，我观察到洗牌所写的内容大致符合我的预期，但溢出的情况比我预想的要多。我试图通过将每个执行器分配的内存数量增加到原来的8倍来避免这些溢出，但基本上没有发现溢出量的差

浏览 2提问于2016-12-27得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么pyspark脚本的性能没有随着内核和执行器数量的增加而提高？

相关·内容

为什么pyspark脚本的性能没有随着内核和执行器数量的增加而提高？

Apache Spark在本地模式下性能下降

增加NIFI中的并发任务数并不能提高性能

Apache :执行器、执行延迟和进程延迟之间的关系？

read()和write()中内存区域参数的大小如何影响IO性能？

Spark K-means性能随节点/实例的增加而降低

tensorflow的可扩展性

如何使用执行器使我的星火作业运行得更快？

英特尔涡轮增压与多核性能关系

如何在多CPU内核上高效运行Django

jquery ui自动完成性能

关于超参数整定的两个问题

在tomcat中使用ThreadPool excutor服务来加速请求

增加工作线程数不会影响Netty IO性能

不影响numpy均值性能的MKL线程数

在webpacker Rails 6中推荐多少个包？

提高cassandra的性能

启动更多的CUDA线程块是否比启动更少的线程块有更多的开销？

火花流卡夫卡接收器API - numPartitions

火花溢出与指定的执行器内存无关

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐