前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ONNXRUNTIME | Faster-RCNN ONNX模型在C++与Python推理不一致原因找到了

ONNXRUNTIME | Faster-RCNN ONNX模型在C++与Python推理不一致原因找到了

作者头像
OpenCV学堂
发布2022-04-11 11:48:04
1.6K0
发布2022-04-11 11:48:04
举报

点击上方↑↑↑“OpenCV学堂”关注我

onnxruntime 推理python与c++支持

现象

最近用torchvision中的Faster-RCNN训练了一个自定义无人机跟鸟类检测器,然后导出ONNX格式,Python下面运行效果良好!显示如下:

然后我就想把这个ONNXRUNTIME部署成C++版本的,我先测试了torchvision的预训练模型Faster-RCNN转行为ONNX格式。然后针对测试图像,代码与测试效果如下:

代码语言:javascript
复制
transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])

sess_options = ort.SessionOptions()
# Below is for optimizing performance
sess_options.intra_op_num_threads = 24
# sess_options.execution_mode = ort.ExecutionMode.ORT_PARALLEL
sess_options.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL
ort_session = ort.InferenceSession("faster_rcnn.onnx", sess_options=sess_options)
src = cv.imread("D:/images/cars.jpg")
image = cv.cvtColor(src, cv.COLOR_BGR2RGB)
blob = transform(image)
c, h, w = blob.shape
input_x = blob.view(1, c, h, w)
def to_numpy(tensor):
    return tensor.detach().cpu().numpy() if tensor.requires_grad else tensor.cpu().numpy()

# compute ONNX Runtime output prediction
ort_inputs = {ort_session.get_inputs()[0].name: to_numpy(input_x)}
ort_outs = ort_session.run(None, ort_inputs)
boxes = ort_outs[0] # boxes
labels = ort_outs[1] # labels
scores = ort_outs[2] # scores
print(boxes.shape, boxes.dtype, labels.shape, labels.dtype, scores.shape, scores.dtype)

index = 0
for x1, y1, x2, y2 in boxes:
    if scores[index] > 0.5:
        cv.rectangle(src, (np.int32(x1), np.int32(y1)),
                     (np.int32(x2), np.int32(y2)), (0, 255, 255), 1, 8, 0)
        label_id = labels[index]
        label_txt = coco_names[str(label_id)]
        cv.putText(src, label_txt, (np.int32(x1), np.int32(y1)), cv.FONT_HERSHEY_PLAIN, 1.0, (0, 0, 255), 1)
    index += 1
cv.imshow("Faster-RCNN Detection Demo", src)
cv.waitKey(0)
cv.destroyAllWindows()

运行结果如下:

然后我把python代码转行为C++的代码,运行结果如下:

发现很多类型都变成 background类型 了,就是类型预测错误了!C++与Python推理使用的label-map文件完全一致,我晕了!

原因与修改

我仔细核对了两边预测输出三个层分别是boxes、labels、scores、解析顺序都没有错!然后我把python中输出三个层数据类型打印出来如下:

代码语言:javascript
复制
print(boxes.shape, boxes.dtype, labels.shape, labels.dtype, scores.shape, scores.dtype)

输出打印结果如下:

代码语言:javascript
复制
(100, 4) float32 (100,) int64 (100,) float32

可以证明:

代码语言:javascript
复制
Boxes 数据类型是浮点数Labels数据类型是int64scores数据类型是浮点数

而我在ONNXRUNTIME C++获取输出的语句如下:

代码语言:javascript
复制
const int* labels_prob = ort_outputs[1].GetTensorMutableData(); // labelscv::Mat det_labels(boxes_shape[0], 1, CV_32S, (int*)labels_prob);

直接用 int类型而不是int64 获取labels数据了,我立刻意识到是因为数据类型不一致导致的内存错误,我知道OpenCV中有个数据类型是int64,于是我把第一行代码改成:

代码语言:javascript
复制
const int64* labels_prob = ort_outputs[1].GetTensorMutableData();

发现OpenCV Mat没有支持int64的,无法创建这样的Mat对象!

所以我放弃了,直接读取数组,代码如下:

代码语言:javascript
复制
int64 classId = labels_prob[i];std::cout<< "class id: " << classId << std::endl;

就这样,再次运行演示程序,发现结果跟python版本的完全一致!

就这样我又改好了一个bug!

总结:

代码语言:javascript
复制
模型推理时刻注意C++的中数据类型问题!

最后show一下我的成果:

扫码查看OpenCV+Pytorch系统化学习路线图

 推荐阅读 

CV全栈开发者说 - 从传统算法到深度学习怎么修炼

2022入坑深度学习,我选择Pytorch框架!

Pytorch轻松实现经典视觉任务

教程推荐 | Pytorch框架CV开发-从入门到实战

OpenCV4 C++学习 必备基础语法知识三

OpenCV4 C++学习 必备基础语法知识二

OpenCV4.5.4 人脸检测+五点landmark新功能测试

OpenCV4.5.4人脸识别详解与代码演示

OpenCV二值图象分析之Blob分析找圆

OpenCV4.5.x DNN + YOLOv5 C++推理

OpenCV4.5.4 直接支持YOLOv5 6.1版本模型推理

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档