OpenCV:C ++和C性能比较?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (76)

现在我正在使用OpenCV API(C++)开发一些应用程序。此应用程序处理视频。

在个人电脑上,一切工作真的很快。今天我决定在Android上移植这个应用程序(使用相机作为videoinput)。一切工作正常,除了性能。我对我的应用程序进行了基准测试,发现该应用程序以4-5 fps工作,不可接受,我希望它能以大约10 fps的速度工作。

它是否能够完全重写我的应用程序?

提问于
用户回答回答于

我在Android和优化方面做了很多工作(我写了一个视频处理应用程序,可以在4ms的时间内处理一个帧),所以我希望我会给你一些相关的答案。

OpenCV中的C和C ++接口没有太大的区别。有些代码是用C编写的,有一个C ++包装器,还有一些反之亦然。两者之间的任何显着差异(如Shervin Emami衡量)都是回归,错误修复或质量改进。你应该坚持最新的OpenCV版本。

为什么不重写?

你会花很多时间,你可以用得更好。C接口很麻烦,引入错误或内存泄漏的机会很高。在我看来,你应该避免它。

建议优化

A.打开优化。

编译器优化和缺少调试断言都会对运行时间产生很大影响。

B.分析应用程序。

C.算法。

D.在重要的地方使用C.

E.避免隐藏成本

F.使用矢量化

一个小例子:

float* a, *b, *c;
// init a and b to 1000001 elements
for(int i=0;i<1000001;i++)
    c[i] = a[i]*b[i];

可以重写如下。它更详细,但更快。

float* a, *b, *c;
// init a and b to 1000001 elements
float32x4_t _a, _b, _c;
int i;
for(i=0;i<1000001;i+=4)
{  
    a_ = vld1q_f32( &a[i] ); // load 4 floats from a in a NEON register
    b_ = vld1q_f32( &b[i] );
    c_ = vmulq_f32(a_, b_); // perform 4 float multiplies in parrallel
    vst1q_f32( &c[i], c_); // store the four results in c
}
// the vector size is not always multiple of 4 or 8 or 16. 
// Process the remaining elements
for(;i<1000001;i++)
    c[i] = a[i]*b[i];
用户回答回答于

在做出这样的决定之前,应该对代码进行配置文件以在代码中找到热点。没有这些信息,你为了加快速度而做出的任何改变都是猜测。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励