我刚刚在.NET中做了一个简单的测试,对长度为1000的100个随机整数数组进行排序,看看使用Paralell.ForEach
循环是否比普通的旧foreach
循环更快。
这是我的代码(我很快就把它们拼凑在一起了,所以请忽略代码的重复和整体糟糕的外观)
using System;
using System.Net;
using System.Collections.Generic;
using System.Threading;
using System.Threading.Tasks;
using System.Linq;
public class Program
{
public static int[] RandomArray(int minval, int maxval, int arrsize)
{
Random randNum = new Random();
int[] rand = Enumerable
.Repeat(0, arrsize)
.Select(i => randNum.Next(minval, maxval))
.ToArray();
return rand;
}
public static void SortOneThousandArraysSync()
{
var arrs = new List<int[]>(100);
for(int i = 0; i < 100; ++i)
arrs.Add(RandomArray(Int32.MinValue,Int32.MaxValue,1000));
Parallel.ForEach(arrs, (arr) =>
{
Array.Sort(arr);
});
}
public static void SortOneThousandArraysAsync()
{
var arrs = new List<int[]>(100);
for(int i = 0; i < 100; ++i)
arrs.Add(RandomArray(Int32.MinValue,Int32.MaxValue,1000));
foreach(var arr in arrs)
{
Array.Sort(arr);
};
}
public static void Main()
{
var start = DateTime.Now;
SortOneThousandArraysSync();
var end = DateTime.Now;
Console.WriteLine("t1 = " + (end - start).ToString());
start = DateTime.Now;
SortOneThousandArraysAsync();
end = DateTime.Now;
Console.WriteLine("t2 = " + (end - start).ToString());
}
}
以下是两次击球后的结果:
t1 = 00:00:00.0156244
t2 = 00:00:00.0156243
..。
t1 = 00:00:00.0467854
t2 = 00:00:00.0156246
..。
所以,有时更快,有时也差不多。
可能的解释:
有什么想法?
发布于 2016-11-05 13:25:58
只有当循环中的代码需要大量时间才能执行时,才应该使用Parallel.ForEach()
。在这种情况下,创建多个线程、对数组进行排序,然后将结果组合到一个线程上比在单个线程上对其排序要花费更多的时间。例如,下面的代码片段中的Parallel.ForEach()
执行时间比普通的ForEach循环要少:
public static void Main(string[] args)
{
var numbers = Enumerable.Range(1, 10000);
Parallel.ForEach(numbers, n => Factorial(n));
foreach (var number in numbers)
{
Factorial(number);
}
}
private static int Factorial(int number)
{
if (number == 1 || number == 0)
return 1;
return number * Factorial(number - 1);
}
但是,如果我将var numbers = Enumerable.Range(1, 10000);
更改为var numbers = Enumerable.Range(1, 1000);
,则ForEach循环要比Parallel.ForEach()
快。
发布于 2016-11-05 13:56:36
在处理小任务(执行这些任务不需要花费大量时间)时,请查看分割器类;在您的示例中:
public static void SortOneThousandArraysAsyncWithPart() {
var arrs = new List<int[]>(100);
for (int i = 0; i < 100; ++i)
arrs.Add(RandomArray(Int32.MinValue, Int32.MaxValue, 1000));
// Let's spread the tasks between threads manually with a help of Partitioner.
// We don't want task stealing and other optimizations: just split the
// list between 8 (on my workstation) threads and run them
Parallel.ForEach(Partitioner.Create(0, 100), part => {
for (int i = part.Item1; i < part.Item2; ++i)
Array.Sort(arrs[i]);
});
}
我得到了以下结果(i7 3.2GHz 4核HT,.Net 4.6IA-64)-平均运行100次:
0.0081 Async (foreach)
0.0119 Parallel.ForEach
0.0084 Parallel.ForEach + Partitioner
正如你所看到的,foreach
仍然在顶端,但是Parallel.ForEach + Partitioner
非常接近获胜者
发布于 2016-11-05 13:32:19
检查算法的性能是一项棘手的工作,小规模的性能很容易受到代码外部各种因素的影响。请参阅我在这里回答一个几乎重复的问题以获得更深入的解释,以及一些指向基准测试模板的链接,您可以通过这些链接来更好地衡量算法的性能。
https://stackoverflow.com/questions/40443350
复制相似问题