为什么我的R代码在使用foreach时不是并行CPU

在使用R语言中的foreach包时，如果你的R代码在使用foreach时没有实现并行CPU，可能是由于以下几个原因：

缺少并行计算库：在使用foreach包进行并行计算之前，你需要确保已经安装了支持并行计算的库，例如doParallel、doMC等。这些库可以帮助你在R中实现并行计算。
未正确设置并行计算环境：在使用foreach包时，你需要设置并行计算环境，以告诉R要使用多少个CPU核心来执行并行计算。你可以使用registerDoParallel()函数来设置并行计算环境，并指定要使用的CPU核心数量。
循环体不适合并行计算：在使用foreach包时，并行计算的效果取决于循环体的性质。如果循环体中的每个迭代都是相互独立的，那么并行计算可以显著提高代码的执行速度。然而，如果循环体中的迭代之间存在依赖关系，那么并行计算可能无法提供明显的性能优势。

为了解决这个问题，你可以尝试以下步骤：

确保已经安装了支持并行计算的库，例如doParallel、doMC等。你可以使用以下命令来安装这些库：
确保已经安装了支持并行计算的库，例如doParallel、doMC等。你可以使用以下命令来安装这些库：
设置并行计算环境，并指定要使用的CPU核心数量。例如，如果你想使用4个CPU核心进行并行计算，可以使用以下代码：
设置并行计算环境，并指定要使用的CPU核心数量。例如，如果你想使用4个CPU核心进行并行计算，可以使用以下代码：
确保循环体中的迭代是相互独立的，以便实现并行计算的效果。

总结起来，要实现R代码在使用foreach时的并行CPU计算，你需要确保安装了支持并行计算的库，正确设置并行计算环境，并确保循环体中的迭代是相互独立的。这样可以提高代码的执行速度，并充分利用CPU资源进行并行计算。

腾讯云相关产品和产品介绍链接地址：

腾讯云弹性MapReduce（EMR）：腾讯云提供的大数据处理平台，支持并行计算和分布式存储。详情请参考：腾讯云弹性MapReduce（EMR）
腾讯云容器服务（TKE）：腾讯云提供的容器管理平台，支持快速部署和管理容器化应用。详情请参考：腾讯云容器服务（TKE）
腾讯云函数计算（SCF）：腾讯云提供的无服务器计算服务，支持按需运行代码，无需关心服务器管理。详情请参考：腾讯云函数计算（SCF）

GPU上的前置多列并行算法

、、、

我有这样的代码来并行地编写我的结果。我在R中使用foreach和doParallel库。 output_location='/home/Desktop/pp/' library(foreach) library(doParallel) library(data.table) no_cores <- detectCores() registerDoParallel(makeCluster(no_cores)) a=Sys.time() foreach(i=1:100,.packages = c('f

浏览 1提问于2018-06-21得票数 5

回答已采纳

2回答

R中有R代码的简单OpenCL示例？

、

是否可以使用OpenCL，但使用R代码？我仍然对OpenCL和GPU编程没有很好的理解。例如，假设我有以下R代码： aaa <- function(x) mean(rnorm(1000000)) sapply(1:10, aaa) 我喜欢这样，我可以用mclapply代替lapply。有办法为OpenCL做到这一点吗？还是使用OpenCL作为mclapply的后端？我猜这是不可能的，因为我还没有找到一个例子，所以我有两个问题：这是可能的吗?如果是的话，可以使用上面的函数aaa给出一个完整的示例吗？如果这不可能，你能解释一下原因吗？我对GPU编程不太了解。我看GPU和GPU一

浏览 9提问于2015-07-19得票数 9

2回答

提高嵌套循环的性能

、、、、

我简化了这个例子的程序，所以我基本上加载了一个文件，并将文件中的值添加到列表中。 IList<string> MyList = new List<string>(); Main () { foreach(Row r in InputFile) { foreach(Cell c in r) { AddToList(c.Value); } } } public void AddToTheList(string value) { MyList.Add(value); } 我希望加快循环的

浏览 4提问于2014-06-17得票数 0

回答已采纳

2回答

Parallel.ForEach问题

、、、

我使用Parallel.ForEach循环在C# / VS2010中进行处理，我有几个问题。首先，我有一个流程需要从远程GDI服务中提取信息，然后需要动态构建图像(GDI)。我有一个类，它将所有的功能封装到一个单独的对象中，其中包含了Load()和CreateImage()两个主要方法，其中包含了这个对象中所有的GDI管理/ WebRequests“黑盒”。然后创建一个包含需要处理的所有对象的GenericList，并使用以下代码迭代列表： try { Parallel.ForEach(MyLGenericList, ParallelOptions

浏览 2提问于2011-05-17得票数 9

回答已采纳

2回答

在R的并行计算中，使用C- in函数，使用降雪包.问题: Mac显示装载车轮和几乎结冰。

、、

我有一个R包，它包含C-I函数，名为myFun。我想在我的并行计算中把这个叫做myFun。这个myFun本身在我的Mac上工作得很好，但是当通过并行计算函数sfClusterApplyLB调用它时，它表现出奇怪的行为:我的Mac显示加载轮，而R几乎结冰。过了一会儿，R停止冻结，sfClusterApplyLB返回并行化的结果。我真的想避免这种冻结条件，因为当R控制台结冰时，我甚至不能上下滚动！为了说明这一点，我有一个小示例代码。我有一个小C代码，它循环100次，同时每20秒输出迭代次数，每次迭代时睡眠1秒： # include <R.h> # include <Rin

浏览 3提问于2014-04-11得票数 1

回答已采纳

1回答

如何控制mclapply导致的潜在分支炸弹，尝试ulimit但不起作用

、、、、

我在R脚本中使用mclapply进行并行计算。它节省了总的内存使用量，而且速度很快，所以我想把它保存在我的脚本中。但是，我注意到在运行脚本期间生成的子进程数量超过了我使用mc.cores指定的核心数量。具体地说，我在一个有128个核心的服务器上运行我的脚本。在运行脚本时，我将mc.cores设置为18。在脚本运行期间，我使用htop检查了与脚本相关的进程。首先，我可以找到这样的18个进程： 3_GA_optimization.R是我的脚本。这一切看起来都不错。但我也发现有100多个进程同时运行，具有相似的内存和CPU使用率。下面的屏幕截图显示了其中的一些：这样做的问题是，虽然我只需要18个核

浏览 26提问于2021-05-16得票数 0

回答已采纳

2回答

WhenAll与WaitAll并行

、、、

我试图理解WaitAll和WhenAll是如何工作的，并且有以下问题。从方法中获得结果有两种可能的方法： return Task.WhenAll(tasks).Result.SelectMany(r=> r); return tasks.Select(t => t.Result).SelectMany(r => r).ToArray(); 如果我正确理解的话，第二种情况就像在tasks上调用tasks并从中获取结果一样。看来第二种情况的性能要好得多。我知道WhenAll的正确用法是使用await关键字，但我仍然想知道为什么这些行的性能会有如此大的差异。在分

浏览 1提问于2014-12-17得票数 3

回答已采纳

1回答

用于合并排序的PRAM(并行)算法

、

我正在阅读算法导论第三版中的多线程合并排序。然而，我对以下合并排序算法所需的处理器数量感到困惑： MERGE-SORT(A, p, r) 1 if p < r 2 q = (p+r)/2 3 spawn MERGE-SORT(A, p, q) 4 MERGE-SORT(A, q + 1, r) 5 sync 6 MERGE(A, p, q, r) 合并是标准的合并算法。现在这个算法需要多少处理器?？虽然我假设它应该是O( n)，但书中声称它是O(log )，为什么？注意，我没有对合并过程进行多线程处理。用一个例子来解释会很有帮助。提前谢谢。

浏览 5提问于2012-05-18得票数 0

1回答

防止多线程网站消耗过多资源

、、、、

我已经为一个客户端建立了一个批量发送电子邮件的网站，这需要在一个单一的发送发送80,000封电子邮件。它基本上为发送创建了一个新线程，以便可以将控制权交还给UI (以便可以加载反馈页面)，然后为每个公司创建一个新线程，以便向其收件人发送电子邮件。所有电子邮件都使用以下代码进行排队： // Loop through the companies and send their mail to the specified recipients // while creating a new thread for each company // A new thread

浏览 0提问于2012-03-09得票数 3

回答已采纳

2回答

具有实体框架更新的TPL

、

我有一个业务案例，对于给定源表中的每条记录，需要在不同的表中进行大量更改，并且这些sourceTable记录中的每条记录都需要单独处理。所以我有以下伪代码： MyEntityFrameworkContext ctx; foreach (sourceRecord sr in ctx.sourceTable) { try { using (MyEntityFrameworkContext tctx = new MyEntityFramworkContext) { string result1 = MakeUpdatesToS

浏览 2提问于2011-10-19得票数 0

回答已采纳

1回答

在AWS EMR上执行Presto查询时没有工作进程并行

、

我已经在AWS EMR上设置了一个presto集群，从S3存储桶中查询。当我运行查询时，我正在探索集群概述指标，我注意到即使有2个可用的工作节点，也没有工作并行。我想知道为什么会这样。

浏览 13提问于2019-07-11得票数 1

1回答

新硬件运行R码比旧硬件慢

、

为了测试一个新系统并了解性能，我重新运行了一个，它有一个用于机器学习的定时代码块。 New: (8个核心，16个线程；base/boost clock = 3.7/4.3 GHz)，Fedora 28 ：(4个核心，8个线程；基/升压时钟= 2.5/3.5 GHz)，Windows 7 结果令我震惊--新系统比旧系统慢了20%以上。非硬件差异： Windows 7与Fedora 28 (不知道这是否会影响性能，但报告有显著差异)。默认情况下，Windows中的R有更多的优化库吗？ R的版本(来自system的Fedora: R-3.5.0-4.fc28 )和使用的包不一样，但由于

浏览 0提问于2018-07-31得票数 0

回答已采纳

2回答

用python多处理函数执行

、、

我有一个熊猫数据，它包括大约100万行，它包含用户输入的信息。我编写了一个函数来验证用户输入的数字是否正确。我想要做的是，在多个处理器上执行这个函数，以克服在单个处理器上进行大量计算的问题。我所做的是将数据块分割成多个块，其中每个块包含50K行，然后使用python多处理器模块分别对每个块执行处理。问题是，只有第一个进程正在启动，并且它仍然使用一个处理器，而不是在所有处理器上分配负载。下面是我写的代码： pool = multiprocessing.Pool(processes=16) r7 = pool.apply_async(validate.validate_phone_number

浏览 2提问于2022-02-07得票数 0

2回答

运行时间foreach包

、

我在R中使用foreach包时遇到了问题。实际上，当我编译以下代码时： tmp=proc.time() x<-for(i in 1:1000){sqrt(i)} x proc.time()-tmp 这段代码是： tmp=proc.time() x<- foreach(i=1:1000) %dopar% sqrt(i) x proc.time()-tmp 关于并行计算的R控制台文章： utilisateur système écoulé 0.464 0.776 0.705 对于正常的循环： utilisateur

浏览 0提问于2015-06-10得票数 0

1回答

将一定数量的OpenCL工作项放入一个CPU有什么意义？

我试图理解为什么在一个维度上，CPU中的工作项比GPU中的工作项多。平台0设备0 == CPU == DEVICE_VENDOR: Intel DEVICE NAME: Intel(R) Core(TM) i5-5257U CPU @ 2.70GHz MAXIMUM NUMBER OF PARALLAEL COMPUTE UNITS: 4 MAXIMUM DIMENSIONS FOR THE GLOBAL/LOCAL WORK ITEM IDs: 3 MAXIMUM NUMBER OF WORK-ITEMS IN EACH DIMENSION: (1024 1 1 ) MAXIMUM NU

浏览 0提问于2019-04-08得票数 2

2回答

多核GotoBLAS2

、、

我正在尝试在Unix上的R3.0上使用GotoBLAS2。我从TACC网站下载了GotoBLAS2源代码，对其进行了编译，并按照链接中的说明将libRblas.so替换为libgoto2.so。R中的简单矩阵运算，如“行列式”，比以前快了20倍(我使用的是大矩阵)，这很好。但是，我现在不能并行使用很多内核。例如，下面的代码永远运行。但是如果我使用注释掉的"for“而不是"foreach"，只需要一秒钟。当我使用R的默认BLAS库时，我可以运行下面的代码(使用很多内核)(当然，这需要更多的时间，因为BLAS没有优化)。 library("foreach"

浏览 0提问于2013-11-24得票数 1

2回答

在奔腾4 HT机器上使用R中的多核

、

我在办公室使用奔腾4HT机器运行R，一些代码需要plyr包，我通常需要等待6-7分钟才能完成脚本运行，而我看到我的处理器只有一半的利用率。我听说在R中使用多核软件包是为了更好地利用多核处理器，我的案例适合这个吗？谢谢!

浏览 0提问于2010-08-23得票数 4

回答已采纳

1回答

为ML相关的web抓取代码加载数千个URLS非常慢，需要效率提示

、、、、

我正在通过网络抓取各种网站的数据来构建一个数据集，用于股票信号预测算法。我的算法的建立方式涉及到对for循环进行分层并加载数千个URL，因为每个链接都引用了股票及其各种定量统计数据。需要帮助提高处理速度。有什么建议吗？我已经和一些不同的人讨论过如何解决这个问题，有些人建议使用矢量化，但这对我来说是新的。我也尝试过切换到数据表，但我没有看到太多的变化。eval行是我学会了以我想要的方式操作数据的技巧，但我认为这可能是它速度慢的原因，但我对此表示怀疑。我也想知道远程处理，但这可能超出了R的范畴。对于下面的代码，假设我想要加载来自不同网站的其他变量还有4个类似的部分，所有这些块都在一个更大的F

浏览 36提问于2019-02-11得票数 1

回答已采纳

1回答

带有线程的基本Mapreduce比顺序版本慢

、、

我试图使用线程对mapreduce做一个单词计数器，但是这个版本比顺序版本慢得多。对于一个300 it的文本文件，mapreduce版本大约需要80秒，而顺序版本则要花费更少的时间。我的问题是由于不理解为什么，因为我已经完成了所有阶段的地图缩减(分裂，映射，洗牌，减少)，但我不知道为什么慢，因为我已经使用了大约6个线程进行测试。我在想，与执行时间相比，线程的创建可能是昂贵的，但由于大约需要80年代，我认为这显然不是问题所在。你能看看代码是什么吗？我很确定代码运行良好，问题是我不知道是什么导致了缓慢。最后一件事，当使用超过300 my的文本文件时，程序填满了我的计算机的所有内存，有任何方法来优化

浏览 4提问于2021-03-22得票数 1

回答已采纳

1回答

为什么向量化通常比循环更快？

、、、、

为什么，在执行操作和一般底层操作的硬件的最低层(即:运行代码时所有编程语言的实际实现都是通用的)，矢量化通常比循环快得多？计算机在循环时会做什么，而在使用向量化时不会做什么(我说的是计算机执行的实际计算，而不是程序员编写的计算)，或者它有什么不同？我一直无法说服自己为什么会有如此显著的差异。我可能会被说服，矢量化代码减少了一些循环开销，但计算机仍然必须执行相同数量的操作，不是吗？例如，如果我们将一个大小为N的向量乘以一个标量，我们将有N个乘法可以执行，不是吗？

浏览 4提问于2016-01-30得票数 87

回答已采纳

1回答

在教科书中的一个多问题CPU示例中，为什么分支指令后的指令必须等待一个周期才能发布？

、

这是一个例子，在第3.8节利用ILP使用动态调度，多个问题，和推测的计算机架构-一个定量的方法。给定动态调度，两个问题的处理器和程序集代码如下所示(实质上是增加数组的每个元素) Loop: LD F2,0(R1) DADDIU R2,R2,#1 SD R2,0(R1) DADDIU R1,R1,#8 BNE R2,R3,LOOP 然后，书中显示了发布、执行和编写结果的时间，如图3.19所示：，我的问题是：为什么迭代2的LD R2,0(R1)是在第四个周期而不是与BNE相同的循环中发布的？我能够理解为什么以

浏览 3提问于2020-11-27得票数 0

回答已采纳

1回答

lme()不同的结果分别运行在革命R (MKL应负责任？)

、、、

更新(2014年8月)：我从来没有发现这件事的真相，也没有收到任何关于革命论坛的反馈。然而，这一问题似乎已在革命R 7.2中得到解决(R 3.0.3，也是学术版本)。我在几百次以下运行lme()测试，所有测试都产生了相同的结果，正如预期的那样。我刚刚在一台新的PC上安装了革命R7.0(R3.0.2)的学术版本，下面的代码得到了奇怪的结果。每次代码运行时，都会给出不同的结果。在CRAN下，结果总是一样的(我认为应该是这样)。代码片段来自test.data.table()版本1.8.10的测试527，它指出了错误。 library(nlme) all.equal(lme(distance ~ a

浏览 1提问于2013-12-18得票数 6

3回答

Python多线程基础混淆

、、、、

我有以下代码： import time from threading import Thread def fun1(): time.sleep(5) def fun2(): time.sleep(5) def fun3(): time.sleep(5) def fun4(): time.sleep(5) if __name__ == '__main__': t1 = Thread(target=fun1, args=()) t2 = Thread(target=fun2, args=()) t3 = Thread(target=fun3, args

浏览 2提问于2016-08-26得票数 2

回答已采纳

1回答

XMLWriter与并行

、、

我有一组数据库结果，我正在循环这些结果，希望将这些结果写入XML。本质上，我有一个var列表，其中每个var都有一组属性(即List<image>，图像具有image.name、image.path、image.id等)。我希望将每个图像的每个属性都写入XML。我在并行循环中循环遍历图像列表。我就是这样设置的： using(XMLWriter writer = XMLWriter.Create(outputfile) { Parallel.ForEach({ writer.WriteStartElement("DOCUMENT&#

浏览 3提问于2011-10-17得票数 1

回答已采纳

2回答

C#-WPF奇怪的异步行为

、、、、

我的WPF窗口有一种奇怪的行为。总之，我有一个WPF窗口，它对已加载的事件执行异步操作。 if (AppContext.OnlineMode) Task.Run(() => SynchronizeMails()); 这个函数(synchronizeMails)做了很多事情(异步联系webservice，插入数据库，刷新GUI，.)，在第一次启动时，它花费了很长的时间。我有一个按钮，允许用户断开连接，绑定到一个显示messageBox的命令，这取决于当前的状态。对于我的情况，synchronizeMails将bool设置为true，以防止多个同步，并防止治疗期间退出。我的命令实现查

浏览 3提问于2015-10-01得票数 1

回答已采纳

2回答

完全按顺序执行的计算任务

、、

我有几个计算密集型的方法，我试图使用异步等待并行运行。我有一个大约80,000个对象的列表，我将这些对象输入一个返回任务的函数中： public static void Main(string[] args) { //...blah blah blah... var runner = new Runner(); //in a nutshell, I manage to get an object that has an async method on it. runner.Run().Wait(); //and I wait for it to complete.

浏览 0提问于2014-09-17得票数 1

回答已采纳

1回答

使用带有/或异步/等待的Parallel.ForEach

、、、

我试着验证我的图像URL，看看它们是否有效。我有这么多人，要花上几个小时才能完成这项任务。因此，我决定异步地这样做。我想知道做下面的代码是否有很大的区别或优势。我的主要职能是： Async Function testUrl_async(ByVal myImageurl As String) As Task(Of Boolean) myHttpResponse = Await myHttpClient.GetAsync(myImageurl) If myHttpResponse.IsSuccessStatusCode Then mySuccess = True

浏览 3提问于2015-06-23得票数 3

回答已采纳

1回答

计算SHA1迭代的最快方法

、

众所周知，在大多数情况下，并行计算大量哈希函数(如SHA1)涉及到GPU的使用。但是，在连续地执行某些事情时，例如计算sha1(sha1(sha1(...sha1(x))))并行似乎没有那么有用。最近我遇到了这个问题，我开始使用python在我的Mac笔记本上运行一个程序，以270 k/秒的速度运行。移动到C实现时，我能够获得750 k/秒的哈希数。奇怪的是，使用VirtualBox与Kali和相同的C实现，大约是130万散列/秒。 (人们可以在网上找到一些讨论，为什么Linux版本的SHA1代码可能比Mac版本更快，即使前者是通过虚拟化层，但这超出了我的问题范围。) 问:如果我想尽可能快地

浏览 0提问于2018-06-27得票数 0

回答已采纳

1回答

是否可以使用多处理对一个h5py文件进行并行读取？

、、

我试图加快从h5py数据集文件中读取块(将它们加载到内存中)的过程。现在，我尝试通过多处理库来完成这个任务。 pool = mp.Pool(NUM_PROCESSES) gen = pool.imap(loader, indices) 其中加载程序的功能如下所示： def loader(indices): with h5py.File("location", 'r') as dataset: x = dataset["name"][indices] 这有时确实有效(这意味着预期的加载时间除以进程的数量，从而并行化)。但是，

浏览 4提问于2015-03-25得票数 6

回答已采纳

1回答

Python多处理比单线程慢

、

我一直在处理多处理问题，并且注意到我的算法在并行时比单线程慢。在我的代码中，我不共享内存。我很确定我的算法(见代码)，它只是嵌套循环，是CPU绑定的。不过，不管我做什么。并行代码在我所有的计算机上运行速度要慢10-20%。我还在一个20个CPU虚拟机上运行了这个程序，并且每次都要执行单线程操作(实际上比我的计算机还要慢)。 from multiprocessing.dummy import Pool as ThreadPool from multi import chunks from random import random import logging import time fro

浏览 3提问于2016-07-06得票数 2

回答已采纳

3回答

cpu在执行指令和空闲时是否消耗不同的功率？

、、、

为什么CPU在2 2Ghz时消耗不同的功率？它正在执行指令。它没有执行任何指令。不管CPU是否正在执行指令，CPU不应该消耗相同的电源吗？(因为功率取决于频率，而不是指令的执行)

浏览 0提问于2010-10-31得票数 0

回答已采纳

3回答

将异步方法传递给Parallel.ForEach

、、

我在阅读有关Parallel.ForEach的文章时指出，"Parallel.ForEach与传递异步方法不兼容“。因此，为了检查一下，我编写了以下代码： static async Task Main(string[] args) { var results = new ConcurrentDictionary<string, int>(); Parallel.ForEach(Enumerable.Range(0, 100), async index => { var res = await DoAsyncJob(index

浏览 0提问于2018-11-27得票数 5

回答已采纳

4回答

为什么引入无用的MOV指令会加速x86_64组装中的紧循环？

、、、、

背景：在使用嵌入式汇编语言优化一些代码时，我注意到了一个不必要的MOV指令，并删除了它。令我惊讶的是，删除不必要的指令导致我的程序慢下来。我发现添加了任意的、无用的指令，从而进一步提高了性能。效果是不稳定的，基于执行顺序的更改：相同的垃圾指令将上下转换成一行，从而产生减速。我知道CPU可以进行各种优化和精简，但是，这似乎更像是黑魔法。数据：我的代码的一个版本有条件地编译三个垃圾操作，在循环中间运行2**20==1048576。(周围的程序只是计算散列)。我的旧机器(Intel(R) Core(TM)2 CPU 6400 @2.13 GHz)上的结果： avg time (ms)

浏览 5提问于2013-07-27得票数 230

回答已采纳

1回答

嵌套并行和折叠循环之间有区别吗？

、

我知道，启用嵌套并行将允许嵌套的omp并行for循环也被并行化。但是，我在嵌套的for循环中使用折叠(2)(用于for的内部)。有什么不同吗？为什么或者为什么不？假设最好的情况:循环索引与其他条件相同时不依赖。

浏览 1提问于2017-12-05得票数 1

回答已采纳

1回答

使用Server的所有资源

、

我对Server上的一个数据库有问题。我有一个只有一张桌子的数据库。这个表有超过500万行，我想运行一个select查询。当我试图在这个表上运行SELECT *时，服务器将在3分钟内完成任务，并且从不使用最大的硬件。服务器具有以下配置：服务器HP 拉姆32 CPU 2*8核心 HDD 500 raid 5 我用运行了一个硬件测试，服务器运行正常。我有一个问题:为什么Server不使用100%的硬件来更快地运行查询？ Server刚刚使用了3%-5%的CPU和20 meg (每秒)从硬读取. 我使用Server 2008 R2数据中心版和Windows 2012 r2，所有这些都会被更新

浏览 0提问于2017-08-29得票数 -1

1回答

在Parallel.ForEach之外设置断点时无效的列表计数

、、、、

我理解在使用TPL Parallel.ForEach时，我们不需要显式地编写代码来“等待”其中的任务完成。然而，我正在做一个从源列表到目标列表的1000个元素的简单转换。在设置Parallel.ForEach循环外部和之后的断点时，我看到目标列表中的项的无效/不完全计数.为什么？ List<int> myList = new List<int> { }; for (int i = 0; i < 1000; i++) { myList.Add(i); } List<int> newList = new List<int>(); Par

浏览 0提问于2014-08-09得票数 2

回答已采纳

1回答

R:大型数据集上的字符串操作(如何加快速度？)

、

我有一个大的data.frame (>4M行)，其中一个列包含字符串。我想在每个文本字段(例如gsub)上执行几个字符串操作/匹配正则表达式。我在想怎样才能加快行动速度？基本上，我在表演一堆 gsub(patternvector," [token] ",tweetDF$textcolumn) gsub(patternvector," [token] ",tweetDF$textcolumn) .... 我在8GB内存Mac上运行R，并试图将其移动到云端(亚马逊EC2大型实例的内存为64 8GB)，但速度并不快。我听说过几个包(bigmemory，ff)

浏览 1提问于2013-11-04得票数 1

回答已采纳

1回答

TPL数据流管道的吞吐量

、、、

我们有一个TPL数据流管道，有以下几个模块：转换块A: Http post调用转换块B:数据库IO 转换块C:一些单元转换数据(基本上是CPU密集型任务) 转换块D:发布到谷歌PubSub 行动区E: Http post call 我们试图以最大的吞吐量( CPU利用率为100%)运行这个管道。我们所做的事情： ·将每个区块的MaxDegreeOfParallelism设置为1000 ·使用Semaphore限制管道的最大数量(现在是500个) ·消息通过Google PubSub订阅(其流量控制设置为maxOutstandingElementCount= 10

浏览 1提问于2017-09-07得票数 4

1回答

C#位图-找不到如何删除OutOfMemoryException

、、

如果我执行下面的代码，OutOfMemoryException发生在以下两行之一 using (Bitmap bitmap1 = new Bitmap(FrameToFilePath(interval.Start - 1))) 或者这条线 using (Bitmap bitmap2 = new Bitmap(FrameToFilePath(interval.End + 1))) 当内部for语句执行大约1000次时。但是，我不知道为什么会发生OutOfMemoryException。我认为我已经编写了足够多的using来释放Bitmap对象。内存泄漏发生在哪里？ class Program

浏览 2提问于2015-01-04得票数 5

回答已采纳

2回答

为什么没有任何软件强制使用多核？

、、

这纯粹是一个假设性的问题。首先，我必须提出一个免责声明:我完全不知道处理器是如何在低级别上工作的，甚至是在高级别上，无论低层次和高层次的解释是如何被欣赏的，因为我仍然可以把我的头集中在答案上(也许要花几个小时)。所以问题是:为什么有软件不能利用多个核心或线程？或者更好的说法，为什么多线程支持必须在软件中被编码，而不是处理器会自动分配给所有内核的东西，而不管代码是什么？我非常天真的看法是，软件会要求CPU进行一些计算，那么为什么CPU不能有一个“主线程”，它只会将计算分配给其他线程，然后在它们出现时将结果转发给软件？因为我知道很多软件一次只能使用一个核心，而且从我对CPU工作方式的天真理解

浏览 0提问于2019-08-30得票数 0

回答已采纳

1回答

Wookie通用Lisp服务器是否并行处理请求？

、

我有一个基于Wookie的应用程序，可以接受nginx背后的请求。这个应用程序一般都能工作，但我遇到了一些类似请求的问题。例如，当应用程序接受一个长时间运行的请求( R1 )从数据库中的数据集(mongodb，通过cl-mongo)生成报告时，它似乎对在网络上发送R1响应之前出现的任何后续请求(R2)都没有响应。客户端报告在与服务器进行R2通信时出错，但是在服务器完成R1并最终发送回复后，它尝试处理R2 (从调试输出中可以看出) --执行正确的路由等(为时已晚)。在请求处理例程中添加blackbird承诺没有帮助(而且可能是过分的，因为Wookie是设计为异步的)。那么处理这件事的正确方

浏览 0提问于2015-01-21得票数 2

回答已采纳

1回答

为什么在某些机器上增加额外的签入循环会产生很大的差异，而在其他机器上则会产生很小的差异？

、

我一直在做一些测试，看看额外的边界检查在循环中产生了多大的差异。这是因为您在访问数组时考虑了C#、Java等语言插入隐式边界检查的成本。更新:我在几台额外的计算机上尝试了相同的可执行程序，这给正在发生的事情带来了更多的光明。我列出了最初的电脑，第二位是我的现代笔记本电脑。在我的现代笔记本电脑上，在循环中增加额外的检查只会增加1%到4%的时间，而原来的硬件只会增加3%到30%。 Processor x86 Family 6 Model 30 Stepping 5 GenuineIntel ~2793 Mhz Ratio 2 checks : 1 check = 1.0310 Ratio 3

浏览 2提问于2013-06-12得票数 7

1回答

为什么人们要使用ThreadPoolExecutor而不是直接函数调用？

此代码(snippet_1)是从改编而来的 import concurrent.futures import urllib.request URLS = ['http://www.foxnews.com/', 'http://www.cnn.com/', 'http://europe.wsj.com/', 'http://www.bbc.co.uk/'] # Retrieve a single page and report the URL and contents def lo

浏览 0提问于2019-08-17得票数 1

回答已采纳

1回答

在Rmpi程序中消耗100% CPU的主程序

、、

我使用Rmpi (v.0.6-2)包来并行化我的R(v.2.15)代码。我的代码如下： library(Rmpi) source("slaveFunction04.r") mpi.spawn.Rslaves(nslaves=2) mpi.bcast.Robj2slave(slaveFunction04) mpi.remote.exec(slaveFunction04()) mpi.close.Rslaves() mpi.quit() 当从进程正在执行slaveFunction04时，我希望主进程是空闲的，消耗的资源非常少，就像你在C或Fortran中使用MPI时发生的那样。但是

浏览 1提问于2013-03-16得票数 1

1回答

禁用GCC自动并行化

、

我运行的是MinGW G++ 4.8.1，当我更改以下代码时： for (Room &r : TempRooms2) { r.vNeighbours.clear(); } 至 for (Room &r : TempRooms2) { r.vNeighbours.clear(); r.Layer=-1; } 该程序之前运行得很好，但在libwinpthread-1.dll中出现了段错误而崩溃。现在，我以前没有使用过这个G++ 4.8.1版本的线程功能，在测试它们之后发现它们在我的操作系统上并不稳定，所以当我想要使用线程时，我需要在将来更改到

浏览 0提问于2013-07-05得票数 0

回答已采纳

2回答

运行任意数量的函数，每个函数都在各自的线程上运行。

、、

在并行运行的对象集合上执行相同功能的最有效方法是什么？我知道我可以在一个循环中完成new Thread(() => MyFunc(myParam)).Start()，但是有更好的方法吗？这似乎是一种非常丑陋的做法。

浏览 6提问于2015-05-30得票数 4

回答已采纳

1回答

我如何使用"parallel for“而不是几个"for"？

、、

我正在试着为sobel写一个更快的代码，但是我不能理解用它来做几个for循环？我应该使用和循环数量一样多的并行吗？这是有效的吗？有没有人能解释一下代码:代码如下： for (int y = 0; y < Image.Height; y++) { for (int x = 0; x < Image.Width * 3; x += 3) { r_x = g_x = b_x = 0; //reset the gradients in x-direcion values r_y = g_y = b_y = 0; //reset the

浏览 5提问于2021-10-20得票数 2

1回答

不使用多核功能的randomForestSRC包R中的rfsrc()命令

、、、

我使用R(对于Windows7，32 -bit)来使用randomForests进行文本分类。由于数据集庞大，我在互联网上查找以加快模型的建立，并看到了randomForestSRC包。我已经遵循了包安装手册中的所有步骤，但是在执行rfsrc()命令时，R(与randomforest()相同)只使用其中一个逻辑核，最大cpu利用率为25%。根据手册，我使用了以下命令。 options(mc.cores=detectcores()-1, rf.cores = detectcores()-1) 我正在使用Windows7Professional 32位Service Pack 1，在英特尔i3

浏览 1提问于2015-04-22得票数 4

回答已采纳

2回答

Scala未来多核-性能缓慢

、、

import java.util.concurrent.{Executors, TimeUnit} import scala.annotation.tailrec import scala.concurrent.{Await, ExecutionContext, Future} import scala.util.{Failure, Success} object Fact extends App { def time[R](block: => R): Long = { val t0 = System.nanoTim

浏览 3提问于2018-01-10得票数 0

回答已采纳

1回答

并行*在Azure机器学习工作室中的应用

、、、

我刚刚开始熟悉R. 当我计划在我的项目中使用时，我已经开始研究为并行性提供了什么，因此，我找到了，它说并行性是在充分利用所有可用内核的好处的框架下完成的，而不需要更改R代码。本文还展示了一些性能基准，但其中大多数都展示了在进行数学操作时的性能效益。到目前为止还不错。此外，我还想知道它是否也并行了幕后的*apply函数。我还发现这2篇文章描述了如何在一般情况下并行化*apply函数：：描述使用包、par*apply函数族和clusterExport促进并行性。：使用parallel包、par*apply函数族和将值绑定到环境。所以我的问题是，当我在中使用*apply函数时

浏览 2提问于2016-10-09得票数 1

回答已采纳