首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >目前最快的Mask R-CNN实现是什么

目前最快的Mask R-CNN实现是什么
EN

Stack Overflow用户
提问于 2019-12-18 22:49:22
回答 3查看 3.1K关注 0票数 7

我在边缘设备(带有NVIDIA GTX 1080)上运行Mask R-CNN模型。我目前正在使用Detectron2 Mask R-CNN实现,我相信推理速度大约为5FPS。

为了加快速度,我研究了其他推理引擎和模型实现。例如ONNX,但我无法获得更快的推理速度。

TensorRT在我看来非常有前途,但我还没有找到一个现成的“开箱即用”的实现。

有没有其他成熟和快速的推理引擎或其他技术来加速推理?

EN

回答 3

Stack Overflow用户

发布于 2019-12-19 14:12:35

在GTX 1080上,几乎不可能获得更高的Mask R-CNN推理速度。你可以查看Facebook AI Research的detectron2

否则,我建议使用YOLACT -(您只需查看系数),它可以实现实时实例分割。

另一方面,如果您不需要实例分割,您可以使用YOLO、SSD等进行对象检测。

票数 3
EN

Stack Overflow用户

发布于 2020-11-22 14:29:09

带有DNN_BACKEND_CUDADNN_TARGET_CUDA/DNN_TARGET_CUDA_FP16的OpenCV 4.5.0。

具有1024 x 1024输入图像的Mask RCNN

代码语言:javascript
运行
复制
Device             | FPS
------------------ | -------
GTX 1080 Ti (FP32) | 29
RTX 2080 Ti (FP16) | 60

测量的FPS包括NMS,但不包括其他预处理和后处理。网络完全在GPU上端到端运行。

基准测试代码:https://gist.github.com/YashasSamaga/48bdb167303e10f4d07b754888ddbdcf

票数 1
EN

Stack Overflow用户

发布于 2021-03-17 22:21:56

就像@kk哈利特已经提到的,要进一步加速Mask R-CNN是非常困难的。

我发现的最快的实例分割模型是YolactEdge: Real-time Instance Segmentation on the Edge (Jetson AGX Xavier: 30 FPS, RTX 2080 Ti: 170 FPS)

它的性能比Mask R-CNN或Yolact还要差,但仍然很好。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59394530

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档