Python中的并行处理efficient_apriori代码_使用多处理的Python代码并行化_python并行处理并选择最佳代码 - 腾讯云开发者社区

python、mongodb、nosql

关于mongodb db和collect的快速问题，我已经设置并尝试使用python来更新每个文档。基本上，我有一个大约260万条邮政编码记录的集合，并有我的python脚本，它使用邮政编码作为键从csv文件中获取数据。所有邮政编码都是唯一的，DB和CSV都有相应的密钥。我导入的数据本身并不重要，这更多的是为了找到使用python更新文档的最佳方法，因为我稍后将计划用更有意义的数据做一些事情。我在mongo集合中的postcode列中添加了一个索引，但这似乎并没有加快处理速度。当我运行下面的代码时，似乎每个文档需要大约1秒的时间来更新，正如您可以猜到的那样，等待更新所有这些记录的时间太

浏览 60提问于2019-03-25得票数 1

1回答

使用子进程、Python和PSQL的多处理

python、multithreading、subprocess、psql

我有100个地点要处理。每个位置都需要相同的工作流程，因此我开发了一组脚本来实现这一点。首先，我在Python中准备了位置文件。然后，第一个Python代码使用子进程调用另一个(第二个) Python脚本。第二个Python调用模块并执行一些例程，然后再次调用子进程来运行一组PSQL命令。一旦第一个Python脚本调用第二个脚本，它就可以自由地从下一个位置开始。现在，我允许触发第二个Python的5个实例： for x, every in enumerate(location): .... (PREP CODE) if x == 0: process = subpr

浏览 0提问于2018-12-12得票数 1

1回答

将使用rpy2的python代码并行化的最有效方法是什么？

python、r、parallel-processing、rpy2、joblib

我使用的是python3，在其中，我使用rpy2包访问R，传入完成繁重计算的R代码，并将结果返回给python。特别是，我正在使用R (documentation )的lfe函数。我想知道哪个选项更好:在python中进行并行化还是在R中进行并行化，这有关系吗？为什么我们要怀疑其中一个比另一个更有效呢？谢谢。

浏览 18提问于2017-02-03得票数 1

回答已采纳

1回答

unittest.testsuite中的并行测试TestCases

python、unit-testing、selenium-webdriver、test-suite、saucelabs

我使用的是Python和Selenium Webdriver。我有一组包装在testSuite中的testCases，我希望它们可以并行运行，而不管它们的testCase配置如何(其中一些将在本地运行，而另一些将通过saucelabs运行)。我遇到了。这应该是一个杀手，但它就是不能在我的单位正确运行。我试着运行代码，安装了twisted.python (脚本的先决条件)，zope-interface (twisted.python的先决条件)，但我得到了以下错误： Unhandled Error Traceback (most recent call last): File "C

浏览 0提问于2013-01-10得票数 1

回答已采纳

3回答

在Python中使用线程时要注意的注意事项？

python、multithreading

我对Python中的线程非常陌生，有几个初学者的问题。当使用Python模块启动超过50个线程时，我就开始获得threading。线程本身非常苗条，不太需要内存，因此线程的开销似乎是导致内存问题的原因。我能做些什么来增加内存容量或者使Python允许更多的线程吗？使用threading模块可以在Python代码中运行的最大线程数是多少？你做了什么把戏来达到这个数字吗？在使用threading模块时，还有其他需要注意的注意事项吗？

浏览 4提问于2010-05-30得票数 4

回答已采纳

1回答

用spyder在GPU上实现python代码

python、cuda

根据知识，with tf.device('/GPU')可用于在GPU中实现张量流.有没有类似的方法在GPU(Cuda)上实现任何python代码？还是我应该用俾库达？

浏览 2提问于2018-06-04得票数 2

3回答

在python上使用多线程来更快地处理图像？

python、image-processing、numpy、gpu、python-imaging-library

在Python + Python Image Library脚本中，有一个名为processPixel( image，pos)的函数，用于计算图像的函数中的数学索引和图像上的位置。此索引是使用简单的for循环为每个像素计算的： for x in range(image.size[0)): for y in range(image.size[1)): myIndex[x,y] = processPixel(image,[x,y]) 这花费了太多的时间。如何实现线程化来分散工作，加快速度呢？多线程代码能有多快？具体地说，这是由处理器核心的数量定义的吗？

浏览 0提问于2012-01-10得票数 4

回答已采纳

1回答

Python每个线程处理多个进程

python、parallel-processing、multiprocessing、threadpool、python-multiprocessing

我目前正在使用python的带有池的多处理模块同时运行一个函数数百万次。虽然多处理工作良好，但该函数是如此的轻量级，仅使用了每个核心的30%，并且线程仅在锁()过程中才达到最大值。查看我的脚本配置文件，锁定确实是最昂贵的。鉴于每次函数运行都非常短，每次映射到函数时锁定与运行函数之间的折衷是不值得的(实际上，我通过连续运行它获得了更好的性能；15分钟的并行化相对于4.5分钟的串行运行)。函数写入独立文件，因此调用完全独立。是否有可能“模拟”运行/多次调用同一个并行化python脚本(具有不同的输入)以更多地利用CPU？当前代码： pool = Pool(cpu_count(), initi

浏览 1提问于2018-05-17得票数 0

回答已采纳

1回答

Python2.7只使用25%的MacBook Pro

python-2.7、numpy、scikit-learn、anaconda

我正在运行一个MacBook Pro：我正在通过Anaconda安装python2.7。 Last login: Wed Nov 11 21:41:33 on ttys002 Matthews-MacBook-Pro:~ matthewdunn$ python Python 2.7.10 |Anaconda 2.4.0 (x86_64)| (default, Oct 19 2015, 18:31:17) [GCC 4.2.1 (Apple Inc. build 5577)] on darwin Type "help", "copyright", &

浏览 2提问于2015-11-12得票数 0

2回答

将Python中的CPU计算外部化为多核并发

python、multithreading、concurrency

我有一个PyQt5应用程序，它在我的开发机器(核心i7 Windows 7)上运行得很好，但是在我的目标平台()上存在性能问题。在对当前代码进行“优化”之前，我一直在进一步详细研究Python并发性(即确保所有UI代码都在MainThread中，所有逻辑代码都在单独的线程中)。我了解到GIL很大程度上阻止了CPython解释器实现真正的并发性。我的问题是:使用IronPython或Cython作为解释器更好，还是将所有逻辑发送到可以使用多核的外部非Python函数，并让PyQt应用程序简单地更新UI？如果采用后一种语言，哪种语言最适合高速并行计算？

浏览 2提问于2017-10-09得票数 0

回答已采纳

7回答

OpenMP和Python

python、parallel-processing、openmp

我有为共享内存机器(在C和FORTRAN中)编写OpenMP代码以执行矩阵加法、乘法等简单任务的经验(看看它是如何与LAPACK竞争的)。我对OpenMP有足够的了解，可以执行简单的任务，而不需要查看文档。最近，我转到Python进行我的项目，除了绝对的基础之外，我对Python没有任何经验。我的问题是：在Python中使用OpenMP最简单的方法是什么？最简单的，我指的是在程序员方面花费最少的精力(即使它是以增加系统时间为代价的)？我之所以使用OpenMP，是因为串行代码可以转换成一个工作的并行代码，其中分散着几个!$OMP代码。实现粗略并行化所需的时间少得惊人。有没有办法在Pyth

浏览 22提问于2012-07-06得票数 82

回答已采纳

1回答

运行调用使用PBS提交的外部MPI程序的并行Python线程

python、multithreading、multiprocessing、cluster-computing、pbs

我对python非常陌生，我不确定在分布式集群上实现多线程/多进程代码的最佳方法是什么。我试图使用Python编写一个包装器脚本，该脚本使用PBS队列系统调用运行在大型集群上的外部MPI程序。下面给出了一个(非常)简化的脚本类型版本，代码移到特定目录中，运行外部MPI程序并检查结果，以查看是否有任何重大更改。 #!/local/python-2.7.1/bin/python2.7 import os import subprocess as sp import coordinate_functions as coord_funcs os.chdir('/usr/work/cmur

浏览 7提问于2011-11-15得票数 0

1回答

Postgresql如何执行PL/Python代码

postgresql、plpython

当执行PL/Python过程时，python解释器将执行Python代码。我的问题是，Python解释器是作为一个单独的进程运行，还是一个连接到调用数据库进程的共享库？我关心的是，当我们称之为plpy.execute(.)时会发生什么。如果python解释器作为一个单独的进程运行，我认为将sql查询的结果传递回python解释器需要大量开销，这需要从文件或管道中读取。

浏览 5提问于2022-09-08得票数 1

回答已采纳

2回答

在aws中始终使用concurrent.futures.ThreadPoolExecutor抛出超时异常

amazon-web-services、aws-lambda、python-3.7、concurrent.futures

我在aws lambda中有下面的代码可以从API获得响应，直到状态完成为止。我使用了来自concurrent.futures的concurrent.futures。这是示例代码。 import requests import json import concurrent.futures def copy_url(headers,data): collectionStatus = 'INITIATED' retries = 0 print(" The data to be copied is ",data) while (collec

浏览 2提问于2020-01-30得票数 3

2回答

Python中的多处理/多线程？

python、performance、algorithm、memory-management

我有一个代码，我希望它被多次处理(多处理)，并且多个进程中每个进程的输出应该存储在一个公共内存中，然后进行相应的处理。每个单独的进程执行一段代码(维护一个字典)，并且每个进程应该将数据并排存储在一个公共内存中(或者并排存储，如果不可能，则将所有字典存储在最后。) 对于.e.g process1 -> dict1, process2 -> dict2, process3 -> dict3 >main_dict = dict1 + dict2 + dict3 我正在用Python执行这段代码。我也可以在这里做多线程，但多线程实际上并不像我听说的那样并行……这样

浏览 0提问于2012-04-12得票数 0

2回答

在AWS Lambda函数中使用Python多处理队列

python、aws-lambda、multiprocessing、queue

我有一些python，它可以创建多个进程来更快地完成任务。当我创建这些进程时，我传入一个队列。在进程内部，我使用queue.put(数据)，以便能够在进程之外检索数据。它在我的本地机器上运行得很好，但是当我将zip上传到AWS函数(Python3.8)时，它说Queue()函数在AWS中运行得不是很好，我只是去掉了队列功能，所以我知道这是我目前唯一挂起的。我确保通过使用"pip多进程-t ./“和"pip boto3 -t ./”将多处理包直接安装到python项目。我是python的新手，特别是AWS，但是我最近遇到的研究可能会指向SQS。阅读这些SQS ，我不确定这是

浏览 8提问于2020-01-08得票数 6

回答已采纳

1回答

如何在中创建任务之间的依赖关系

python、google-cloud-dataflow、apache-beam、dataflow、apache-beam-io

我是apache的新手，并探索apache数据流的python版本。我希望按一定顺序执行数据流任务，但它以并行模式执行所有任务。如何在中创建任务依赖关系？示例代码：(在下面的代码中，sample.json文件包含5行) import apache_beam as beam import logging from apache_beam.options.pipeline_options import PipelineOptions class Sample(beam.PTransform): def __init__(self, index): self.index

浏览 0提问于2018-03-17得票数 0

1回答

LSF:提交一个使用多处理器模块或同时提交多个脚本的Python脚本，这些脚本是“预拆分”吗？

python、multiprocessing、lsf

在Python中，我有一个任务要完成X次，我将使用LSF来加快速度。最好是提交一个包含多个Python脚本的作业，这些脚本可以在并行中单独运行，还是一个使用多处理器模块的脚本呢？我的问题是，我不相信LSF知道如何将Python代码分成几个进程(我不知道LSF是如何做到这一点的)。但是，我也不希望有几个Python脚本在周围浮动，因为这看起来效率低下，没有条理。手头的任务包括解析6个非常大的ASCII文件，并将输出保存在Python中供以后使用。我想并行地解析这六个文件(每个文件大约需要3分钟)。LSF允许Python告诉它“嗨，这里有一个脚本，但是你要把它分成这六个过程”吗？LSF需要Py

浏览 2提问于2014-05-27得票数 3

回答已采纳

3回答

Amazon云实例之间的Python多处理

python、amazon-ec2、multiprocessing、python-multithreading

我希望在一些亚马逊EC2实例上运行一个长时间运行的python分析流程。代码已经使用python multiprocessing模块运行，并且可以利用单个机器上的所有内核。分析是完全并行的，每个实例都不需要与其他任何实例通信。所有的工作都是“基于文件的”，每个进程独立地处理每个文件……因此，我计划在所有节点上装载相同的S3卷。我想知道是否有人知道设置多处理环境的任何教程(或有任何建议)，以便我可以在任意数量的计算实例上同时运行它。

浏览 2提问于2011-06-24得票数 4

回答已采纳

1回答

关于Python的HPC课程？

python、hpc

我正在用Python开发一个模拟和数据处理管道。目前我还在“让它工作”，但几个月后，我将不得不“尽快”。总的来说，我不太擅长HPC，尤其是Python。哪些在线(或欧洲)课程至少包含以下主题： Python中的并行计算，以及 Python和C的接口？基于意见的部分(抱歉)：我找到的唯一一门课程是莱比锡的Python ()。有人试过Python学院吗？我没有找到任何独立的评论，但有一个很大的代价，所以我不想去盲目。

浏览 2提问于2017-01-20得票数 0

4回答

在python中同时运行两行代码？

python、python-2.7

如何在Python2.7中同时运行两行代码？我想这叫做并行处理之类的，但我不能太确定。

浏览 6提问于2013-11-28得票数 0

回答已采纳

2回答

Python对等网络

python、networking、p2p、bitcoin、peer

我想制作我自己的密码货币。我不想只是重新编译比特币的源代码和重命名它。我想从头开始做这件事，只是为了更多地了解它。我正在考虑使用Python作为实现的语言，但我听说，在性能方面，Python不是最好的。我的问题是，用Python编写的网络是否能够在数百万个对等点的可能性下很好地运行(我知道不会发生这种情况，但我希望使我的网络具有可伸缩性)。

浏览 0提问于2014-03-12得票数 0

回答已采纳

1回答

在Python 2.x中快速创建多个SSL请求

python、performance、ssl、https

我有一个Python程序，它必须与世界另一端的第三方服务器进行大量的HTTPS通信。每当程序想要与该服务器通信时，它都会启动一个新的HTTPS请求。我逐渐认识到这是非常低效的，因为每次都需要进行SSL握手，这占用了大量的往返，这是非常昂贵的，因为我们离服务器太远了。有没有办法在第一个HTTPS请求发出后快速发出后续的HTTPS请求？(我对SSL了解不多，我不知道这是否意味着保持连接活动，或者其他任何事情。) (我看到的一件事是，但它只在Python3.2中可用，而我们正在使用Python2.7。)

浏览 0提问于2012-04-04得票数 3

1回答

查找Flynn的OpenMP和MPI分类代码示例

python、c、parallel-processing、mpi、openmp

查找所有Flynn的分类示例代码，用于C/C++或Python代码来理解任何密码都可以，我只是想学点东西。我试着找出其中的一些，但没有结果。 SIMD SISD MISD MIMD

浏览 4提问于2021-01-29得票数 1

回答已采纳

1回答

如何使用更多的CPU运行python脚本？

numpy、parallel-processing、mpi4py、parallelism-amdahl

我希望使用更多的处理器来运行我的代码，以尽量减少运行时间。虽然我试着去做，但没有达到预期的结果。我的代码非常大，这就是为什么我在这里给出一个非常小而简单的代码(尽管它不需要并行作业来运行这段代码)，只是为了知道如何在python中完成并行工作。如有任何意见或建议，将不胜感激。 import numpy as np import matplotlib.pyplot as plt from scipy.integrate import odeint def solveit(n,y0): def exam(y, x): theta, omega = y d

浏览 2提问于2019-07-22得票数 0

1回答

python程序的核数与cpu数

operating-system、python-multiprocessing

我有一个有32个处理器的CPU，每个处理器都有16个核心。以下是32‘处理器cat /proc/cpuinfo的截断输出。 processor : 31 vendor_id : GenuineIntel cpu family : 6 model : 79 model name : Intel(R) Xeon(R) CPU E5-2686 v4 @ 2.30GHz stepping : 1 microcode : 0xb000037 cpu MHz : 2700.787 cache size : 46080 KB physical id : 0 sib

浏览 0提问于2019-08-01得票数 1

1回答

在apache spark/Storm中运行python脚本

python、hadoop、apache-spark

我有一个用python编写的算法(不兼容hadoop，即不兼容mapper.py和reducer.py)，它在本地系统(不是hadoop)上运行得很好。我的目标是在hadoop中运行它。选项1: Hadoop流。但是，我需要将这个python脚本转换为mapper和reducer。还有别的办法吗？选项2:通过Storm运行此python脚本。但是，我使用的是cloudera，它没有Storm。我要么需要在cloudera中安装storm，要么需要使用Spark。如果我在cloudera安装storm。这是更好的选择吗？选项3:通过Spark (Cloudera)运行此python脚本。有

浏览 0提问于2014-11-29得票数 0

1回答

在Jenkins上运行脚本中的并行命令

python、jenkins

我有一个python脚本，在其中我使用subProcess运行两个命令。我希望这些命令并行运行。当我在我的机器上运行python脚本时，这些命令确实并行运行，但是当我通过Jenkins运行脚本时，它会一个接一个地运行它们。如何在jenkins中并行运行这些命令？ reg_path = os.environ['PWD'] command1 = f'python3 {python_script_path} {reg_path} ' command2 = f'python3 {python_script_path} {reg_path}

浏览 3提问于2022-09-16得票数 -1

1回答

运行两个python进程

python、python-2.7、interpreter、running-other-programs

我正在运行两个由两个不同的文本编辑器(Eclipse )编辑的python代码，从任务管理器中我看到了两个python.exe进程。，这两个进程会互相干扰吗？，我很担心，因为我在这两个脚本中使用了几乎相同的变量名，而且这两个代码都在处理相同的数据输入，数据结构非常相似。

浏览 2提问于2014-07-11得票数 4

回答已采纳

2回答

使用top命令并行化的Python程序看上去如何？

python、c、top、parallelism

我在一个共享集群上工作。我看到人们在这个集群上运行并行c代码，当我使用top查看正在运行的进程时，显示它使用(例如) 400%的CPU，因为他们在单个代码实例中使用四个处理器。现在有人正在运行一个并行化的Python代码(据我所知)。然而，不是top显示的代码使用了400%的CPU，而是显示为四个不同的进程，每个进程都使用自己的处理器( 100%)。我想知道，Python (当并行化时)是否使用top显示运行的不同进程(相对于C)，还是这段Python代码实际上不是并行运行的？我不知道Stack Exchange会不会是一个更适合这个问题的地方。因为我正在使用top，所以我认为这个地方会

浏览 0提问于2014-06-13得票数 3

回答已采纳

2回答

运行目录中的所有Python文件

python、bash、matplotlib

在一个目录中运行所有Python文件的最佳方式是什么？ python *.py 仅执行一个文件。在shell脚本(或make文件)中为每个文件编写一行似乎很麻烦。我需要这个b/c，我有一系列的小matplotlib脚本，每个创建一个png文件，并希望创建所有的图像一次。附言:我正在使用bash shell。

浏览 1提问于2011-02-16得票数 17

回答已采纳

2回答

Scala -用于在多个线程内工作的最佳API

multithreading、scala、multiprocessing

在Python中，我使用一个名为futures的库，它允许我以简洁和清晰的方式使用N个工作进程池进行处理工作： schedulerQ = [] for ... in ...: workParam = ... # arguments for call to processingFunction(workParam) schedulerQ.append(workParam) with futures.ProcessPoolExecutor(max_workers=5) as executor: # 5 CPUs for retValue in executor.map(

浏览 1提问于2014-12-12得票数 0

回答已采纳

1回答

是否有任何理由在多处理模块上对普通python脚本(而不是ipython笔记本)使用Ipy并行？

python、ipython、ipython-parallel

对于普通的python脚本(而不是ipython笔记本)，是否有任何理由使用Ipy并行？

浏览 3提问于2016-06-23得票数 4

回答已采纳

1回答

Spark作业仅在主服务器上运行

python、apache-spark、mapreduce、pyspark

我有几个python作业需要用spark来执行。不过，python代码并没有使用任何spark特定的分布式库。它只是使用pandas、scipy和sklearn来操作数据。我使用以下命令提交要触发的作业：spark-submit --master spark://ip:7077 python_code.py 当我提交几个这样的作业时，所有的作业都只在master上执行。master上的CPU占用了100%，但是workeer节点都是空闲的。我认为spark的资源管理器将在整个集群中分配负载。我知道我的代码没有使用spark提供的任何分布式库，但是有没有一种方法可以将完整的作业分发到不同的节

浏览 2提问于2016-04-29得票数 0

1回答

使用python和依赖项进行多处理

python、multithreading、concurrency、dependencies

我有一个有10个函数的程序，我想从并发中获利，让它更有效率。我提取了函数之间的依赖关系，如下所示： f1 <- f2,f3,f4,f5 f2 <- f6 f3 <- f7,f8,f9 f4 <- f10 f5 <- f10 f8 <- f10 f9 <- f10 我能用多进程库来实现这一点吗？有没有人能给我一段开始的代码？我的问题与这个问题非常相似，但我想使用Python库中的build来得到它。谢谢,

浏览 0提问于2013-09-15得票数 1

1回答

内存错误并行Python (并行的大数据)

python、dictionary、parallel-processing

所以我从一堆不同的文件中读取了很多数据。主要的速度障碍之一是读取数据。问题是，这些文件位于各自的目录中，用于它们的时间步骤，其中包含该时间步骤的每个变量。基本上，我有一些像这样的功能。 def ReadFiles(path,points,directories,variables): data = {} for j in range(len(variables)): data[variables[j]] = np.zeros((len(timeDirs),numPts)) for i in range(len(timeDirs)): tfi

浏览 2提问于2016-02-10得票数 1

1回答

在5个不同线程中调用函数，在Python2.7中并行执行

python、multithreading、multiprocessing

这是我第一次在python中使用多线程。我在python2.7.9中发现了许多与多线程和多处理相关的文档，并对进行了研究。但我不知道如何实现我的应用程序。我有一个基于self.count的应用程序，在下面的代码是5。我必须创建一个5个线程或进程，当我调用d.sum(1,2)时，这应该是在5个不同的线程中调用sum函数并并行执行，用线程名和结果更新结果字典中的结果。现在我现在的方法是连续发生的。，但我希望使用线程或进程将其作为并行处理。请帮助实现这一点。提前谢谢。代码片段是非常感谢的。到目前为止我有密码。 class Base(object): def __init__(self

浏览 2提问于2015-11-28得票数 1

3回答

Python线程速度出乎意料地慢

python、multithreading、parallel-processing

我决定学习如何在Python中实现多线程，并做了一个比较，看看在双核CPU上我会获得什么样的性能提升。我发现我的简单多线程代码实际上比顺序等效代码运行得慢，我不知道为什么。我设计的测试是生成一个大的随机数列表，然后打印最大值 from random import random import threading def ox(): print max([random() for x in xrange(20000000)]) 在我的Intel Core2 Duo上，ox()大约需要6秒才能完成，而ox();ox()大约需要12秒。然后，我尝试从两个线程调用ox()，看看完成的速度有

浏览 2提问于2010-06-26得票数 5

回答已采纳

1回答

并行Python使分形和资源在pp下序列化

python、python-2.7、fractals、parallel-python

我制作了一个python脚本来制作分形图像。我尝试使用pp python模块来更快地编写这个源代码。大问题是：image.putpixel((x，y)，(i %8* 16，i%4* 32，i%2*64)。这行源代码是在使用类似作业时给我一些关于: cPickle.UnpickleableError:不能挑选对象的信息。我认为这个资源不能在pp下序列化。知道吗？谢谢。致以问候。我的源代码： from PIL import Image #size of image imgx = 600 imgy = 400 #make image buffer image = Image.new("

浏览 1提问于2013-02-25得票数 0

回答已采纳

1回答

无法使用pyexasol从Exasol并行导出

python、python-3.x、parallel-processing、python-multiprocessing、exasol

我正在尝试使用PyExasol并行地从Exasol获取数据。我遵循这里的示例- https://github.com/badoo/pyexasol/blob/master/examples/14_parallel_export.py 我的代码如下所示： import multiprocessing import pyexasol import pyexasol.callback as cb class ExportProc(multiprocessing.Process): def __init__(self, node): self.node = node

浏览 19提问于2019-10-10得票数 0

2回答

Python +火花的替代方案是什么？

python、apache-spark、pyspark

我喜欢Python，我也喜欢Spark，但是它们不能很好地结合在一起。特别地，很难在spark中使用python函数(必须为python中的函数创建JVM绑定) 在py4j处于中间的情况下，很难调试火花放电因此，我想知道是否有任何替代吡火花，支持本机python，而不是通过适配器层？参考文献

浏览 0提问于2018-04-23得票数 6

回答已采纳

2回答

从锈蚀cpython并行运行Python代码

python、rust、cpython

我试着用铁锈来加速数据传输。该管道包含一些我不想修改的Python代码，因此我试图按照-使用和多线程从Rust运行它们。但是，性能与我所期望的不一样，它实际上与在单个线程中顺序运行python代码位相同。在阅读文档时，我理解在调用以下内容时，您实际上得到了一个指向一个Python解释器的指针，该解释器只能创建一次，即使您单独从多个线程运行它。 let gil = Python::acquire_gil(); let py = gil.python(); 如果是这样的话，这意味着Python实际上也阻止了所有在Rust中的并行执行。有办法解决这个问题吗？下面是我测试的代码：

浏览 2提问于2020-02-10得票数 2

回答已采纳

8回答

如何在Python中并行化列表理解计算？

python、parallel-processing、list-comprehension

列表理解和映射计算至少在理论上都应该相对容易并行化:列表理解中的每个计算都可以独立于所有其他元素的计算来完成。例如，在表达式中 [ x*x for x in range(1000) ] 每个x*x计算都可以(至少在理论上)并行进行。我的问题是:有没有什么Python模块/Python实现/Python编程技巧可以并行化列表理解计算(以便使用所有16 / 32 / ...核心或通过计算机网格或云分布计算)？

浏览 1提问于2011-03-09得票数 53

回答已采纳

1回答

在崩溃前看到R-studio中RAM的使用情况吗？

r、rstudio

对于一些项目，我将从Python转换到R，我很难理解R中的RAM管理。我有两个简单的问题我们能看到R目前使用了多少RAM吗？就像在Spyder一样，人们可以看到，比方说，20%的当前RAM是满的。这将使我能够理解是否可以用代码移动一个，或者内存崩溃是否接近。我是否需要设置R可以使用的最大内存量，还是一切都是自动的，就像Python中的那样( Spyder需要它就吃RAM )？非常感谢！

浏览 7提问于2016-10-06得票数 0

回答已采纳

1回答

如何使用make调用python脚本来并行处理数百个文本文件？

python-2.7、makefile

我在一个名为" in /“的文件夹中有数百个文本文件。我需要运行一个python脚本，每次获取一个文件，处理它并将其放入名为"out/“的文件夹中。我已经准备好了执行此操作的python脚本。由于要处理的文本文件数量非常大(10000个)，并且所有文件处理都是独立的，所以我想使用"make -j“来充分利用我的8核CPU。我创建了一个make文件，如下所示： SCRIPT_DIR:=/home/xyz/abc/scriptFolder<br/> IN_DIR:=/home/xyz/abc/data/in/in10000<br/> OUT_DIR:

浏览 1提问于2013-10-25得票数 2

1回答

multiprocessing.pool.MaybeEncodingError:在最后一个对象中发生错误发送结果

python、parallel-processing、multiprocessing、pickle、pool

在使用multiprocessing.Pool类多次执行函数时，我一直存在问题。我在Windows10上用PyCharm 2017.3使用Python3.8.3。我正在执行的函数是打开excel文件并将其从我的硬盘序列化到自定义对象，我想在以后迭代这些对象。该错误总是在函数的最后一次执行之后发生。下面是上面的内容： multiprocessing.pool.MaybeEncodingError: Error sending result: '[<IntegListe.IntegrityList object at 0x037481F0>, <IntegListe.I

浏览 0提问于2020-07-24得票数 3

回答已采纳

4回答

Python支持多线程吗？它能加快执行时间吗？

python、multithreading

对于多线程是否在Python中工作，我有点困惑。我知道有很多关于这方面的问题，我读过很多，但我仍然很困惑。根据我自己的经验，我已经看到其他人在StackOverflow上发布了他们自己的答案和例子，在Python中多线程确实是可能的。那么，为什么每个人都说Python被GIL锁定了，而且一次只能运行一个线程？很明显是起作用了。还是有什么区别，我没有在这里？许多海报/答复者也不断提到线程是有限的，因为它没有使用多个内核。但我要说，它们仍然是有用的，因为它们同时工作，从而使合并的工作更快地完成。我的意思是，为什么不存在Python线程模块呢？更新：到目前为止，谢谢你的所有回答。据我所知，多

浏览 2提问于2014-01-05得票数 125

回答已采纳

1回答

IO绑定任务多线程和CPU绑定任务多处理

python、concurrency

介绍了多线程和多线程处理，但它没有说明什么是一般有效的，还是只在Python环境中有效。例如，它说：并发性既包括多处理(适合于CPU绑定任务)，也包括线程(适合于IO绑定任务)。以前，我已经用其他编程语言(如C/C++ )开发了并发应用程序，这句话对我来说似乎很奇怪。为什么多线程一般不适合于CPU绑定任务和IO绑定任务的多处理？AFAIK和AFAIK都可以有效地用于这两项任务。两者之间的决定取决于其他条件，例如任务粒度、共享状态的数量和任务之间的执行顺序依赖，以及进程/线程创建成本(对于进程来说，特别是在某些OSes中)。上面的语句是否特定于Python环境及其全局锁解释器限制？

浏览 2提问于2020-03-03得票数 4

1回答

如何在Python2.7中使用MPI进行并行计算？

python、parallel-processing

我写了一个python代码来进行遗传算法的优化，但是它太慢了。我想知道如何利用多个CPU在并行模式下运行相同的程序？为了更清楚，我的代码将调用另一个python代码，比如说一个接一个调用100次，我想在4个CPU之间进行分配。因此，每个CPU要处理25倍的外部python代码。从而提高了速度。如果有人能帮我解决is问题，我将不胜感激。提前感谢！

浏览 1提问于2015-01-19得票数 0

1回答

Python -多线程字/行计数

python、mapreduce、word-count

我正在设法处理python中的多线程问题。我有计算单词数，文本行数的工作代码，并用每个单词的计数创建一个数据集。它在类似于代码注释中提到的小文件上运行得很快。不过，我通常使用glob来提取多个文件。当我这样做时，我的运行时间显著增加。同时，由于我的脚本是单线程的，我看到我还有另外3个核心空闲着，而另一个内核没有运行。我想我应该给pythons多线程模块一次机会，以下是我迄今为止所做的(不工作)： #!/bin/python # # test file: http://www.gutenberg.org/ebooks/2852.txt.utf-8 import fileinput from

浏览 1提问于2012-06-03得票数 3

回答已采纳