我有一个简单的计算点积和的C#和C++代码。
C#代码为:
using System;
namespace DotPerfTestCS
{
class Program
{
struct Point3D
{
public double X, Y, Z;
public Point3D(double x, double y, double z)
{
X = x;
Y = y;
Z = z;
}
}
static void RunTest()
{
unchecked
{
const int numPoints = 100000;
const int numIters = 100000000;
Point3D[] pts = new Point3D[numPoints];
for (int i = 0; i < numPoints; i++) pts[i] = new Point3D(i, i + 1, i + 2);
var begin = DateTime.Now;
double sum = 0.0;
var u = new Point3D(1, 2, 3);
for (int i = 0; i < numIters; i++)
{
var v = pts[i % numPoints];
sum += u.X * v.X + u.Y * v.Y + u.Z * v.Z;
}
var end = DateTime.Now;
Console.WriteLine("Sum: {0} Time elapsed: {1} ms", sum, (end - begin).TotalMilliseconds);
}
}
static void Main(string[] args)
{
for (int i = 0; i < 5; i++) RunTest();
}
}
}
而C++是
#include <iostream>
#include <vector>
#include <time.h>
using namespace std;
typedef struct point3d
{
double x, y, z;
point3d(double x, double y, double z)
{
this->x = x;
this->y = y;
this->z = z;
}
} point3d_t;
double diffclock(clock_t clock1,clock_t clock2)
{
double diffticks=clock1-clock2;
double diffms=(diffticks*10)/CLOCKS_PER_SEC;
return diffms;
}
void runTest()
{
const int numPoints = 100000;
const int numIters = 100000000;
vector<point3d_t> pts;
for (int i = 0; i < numPoints; i++) pts.push_back(point3d_t(i, i + 1, i + 2));
auto begin = clock();
double sum = 0.0, dum = 0.0;
point3d_t u(1, 2, 3);
for (int i = 0; i < numIters; i++)
{
point3d_t v = pts[i % numPoints];
sum += u.x * v.x + u.y * v.y + u.z * v.z;
}
auto end = clock();
cout << "Sum: " << sum << " Time elapsed: " << double(diffclock(end,begin)) << " ms" << endl;
}
int main()
{
for (int i = 0; i < 5; i++) runTest();
return 0;
}
C#版本(启用优化的Release x86,x64甚至更慢)输出为
Sum: 30000500000000 Time elapsed: 551.0299 ms
Sum: 30000500000000 Time elapsed: 551.0315 ms
Sum: 30000500000000 Time elapsed: 552.0294 ms
Sum: 30000500000000 Time elapsed: 551.0316 ms
Sum: 30000500000000 Time elapsed: 550.0315 ms
而C++ (默认的VS2010版本构建设置)会产生
Sum: 3.00005e+013 Time elapsed: 4.27 ms
Sum: 3.00005e+013 Time elapsed: 4.27 ms
Sum: 3.00005e+013 Time elapsed: 4.25 ms
Sum: 3.00005e+013 Time elapsed: 4.25 ms
Sum: 3.00005e+013 Time elapsed: 4.25 ms
现在,我希望C#代码会稍微慢一点。但是130倍的速度对我来说太慢了。有人能给我解释一下这是怎么回事吗?
编辑
我不是一个C++程序员,我只是从互联网的某个地方拿到了diffclock代码,并没有真正检查它是否正确。
使用std::difftime,C++结果是
Sum: 3.00005e+013 Time elapsed: 457 ms
Sum: 3.00005e+013 Time elapsed: 452 ms
Sum: 3.00005e+013 Time elapsed: 451 ms
Sum: 3.00005e+013 Time elapsed: 451 ms
Sum: 3.00005e+013 Time elapsed: 451 ms
这似乎是对的。
发布于 2011-10-15 02:41:04
您的差异时钟代码是错误的。
如果您将C++代码更改为使用std::clock
和std::difftime
,它将显示实际的运行时:
#include <iostream>
#include <vector>
#include <ctime>
using namespace std;
typedef struct point3d
{
double x, y, z;
point3d(double x, double y, double z)
{
this->x = x;
this->y = y;
this->z = z;
}
} point3d_t;
void runTest()
{
const int numPoints = 100000;
const int numIters = 100000000;
vector<point3d_t> pts;
for (int i = 0; i < numPoints; i++) pts.push_back(point3d_t(i, i + 1, i + 2));
auto begin = clock();
double sum = 0.0, dum = 0.0;
point3d_t u(1, 2, 3);
for (int i = 0; i < numIters; i++)
{
point3d_t v = pts[i % numPoints];
sum += u.x * v.x + u.y * v.y + u.z * v.z;
}
auto end = clock();
cout << "Sum: " << sum << " Time elapsed: " << double(std::difftime(end,begin)) << " ms" << endl;
}
int main()
{
for (int i = 0; i < 5; i++) runTest();
return 0;
}
结果:
Sum: 3.00005e+013 Time elapsed: 346 ms
Sum: 3.00005e+013 Time elapsed: 344 ms
Sum: 3.00005e+013 Time elapsed: 346 ms
Sum: 3.00005e+013 Time elapsed: 347 ms
Sum: 3.00005e+013 Time elapsed: 347 ms
即在vs2010之外的默认发布模式优化下运行应用程序。
编辑
正如其他人所指出的,在C++中使用clock()并不是对函数计时的最准确方法(就像在C#中一样,Stopwatch
比DateTime
更好)。
如果你使用的是windows,你总是可以使用QueryPerformanceCounter来实现高分辨率的计时。
发布于 2011-10-15 02:42:20
我相信你会发现你的diffclock
实现产生的是十分之一秒,而不是毫秒(假设CLOCKS_PER_SECOND
是准确命名的)。纠正这个问题,C#实现的运行速度大约慢了30%,这似乎是合适的。
发布于 2011-10-15 02:38:24
最明显的原因是JIT,但一旦证实它不是原因,我就有了另一种解释。
"new Point3D“出现了100000次。这是100000个堆分配,稍后会释放这些分配。在C++版本中,向量也是基于堆的,这意味着当它增长时,会有一个realloc。但是,当向量增长时,它每次都会增长超过一个point3d_t。我预计在C++版本中只有30个左右的realloc调用。
https://stackoverflow.com/questions/7771947
复制相似问题