开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ONNXRuntime问题:输出:源维度和目标维度的数量Y [ShapeInferenceError]不匹配

ONNXRuntime是一个开源的深度学习推理引擎，用于在不同硬件平台上运行训练好的深度学习模型。它支持多种编程语言和框架，并提供了高性能的推理能力。

针对你提到的问题，"输出:源维度和目标维度的数量Y [ShapeInferenceError]不匹配"，这是一个形状推断错误。在深度学习模型推理过程中，输入和输出的张量形状需要满足一定的规则，以确保计算的正确性。当源维度和目标维度的数量不匹配时，就会出现这个错误。

解决这个问题的方法是检查模型的输入和输出张量的形状定义是否正确，并确保它们在推理过程中保持一致。可以通过以下步骤来解决这个问题：

检查模型的输入和输出张量的形状定义。可以使用ONNXRuntime提供的工具或者其他工具来查看模型的结构和形状信息。
确保输入张量的形状与模型期望的形状一致。可以通过查看模型的文档或者使用ONNXRuntime提供的API来获取输入张量的形状信息。
检查模型的输出张量的形状是否与期望的形状一致。如果不一致，可以尝试调整模型的输入数据或者重新训练模型，以确保输出张量的形状与期望的形状一致。
如果以上步骤都没有解决问题，可以尝试使用ONNXRuntime提供的调试工具来进一步分析和解决问题。ONNXRuntime提供了一些用于调试的API和工具，可以帮助定位和解决形状推断错误。

推荐的腾讯云相关产品：腾讯云AI推理（Tencent Cloud AI Inference），该产品提供了高性能的深度学习推理服务，支持ONNX模型的部署和推理。您可以通过以下链接了解更多信息：https://cloud.tencent.com/product/tcainference

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

用opencv的dnn模块做yolov5目标检测[通俗易懂]

最近在微信公众号里看到多篇讲解yolov5在openvino部署做目标检测文章，但是没看到过用opencv的dnn模块做yolov5目标检测的。于是，我就想着编写一套用opencv的dnn模块做yolov5目标检测的程序。在编写这套程序时，遇到的bug和解决办法，在这篇文章里讲述一下。

01

YoloV5一系列实践详情，Github代码已开源

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G 本文主要讲解几个部分，（适合一些在读的研究生啥也不会然后接到一些项目无从下手，如果是大佬的话就可以跳过了）先看看网络摄像头的效果吧（在2060的电脑上运行）转自《知乎——kaka》实践时间Pipeline 2021年9月18日，在github上发布了一套使用ONNXRuntime部署anchor-free系列的YOLOR，依然

03

深度探索ONNX模型部署

这篇文章从多个角度探索了ONNX，从ONNX的导出到ONNX和Caffe的对比，以及使用ONNX遭遇的困难以及一些解决办法，另外还介绍了ONNXRuntime以及如何基于ONNXRuntime来调试ONNX模型等，后续也会继续结合ONNX做一些探索性工作。

02

模型部署：pytorch转onnx部署实践（下）

在深度学习模型部署时，从pytorch转换onnx的过程中，踩了一些坑。本文总结了这些踩坑记录，希望可以帮助其他人。

02

用opencv的DNN模块做Yolov5目标检测(纯干货，源码已上传Github)

最近在微信公众号里看到多篇讲解yolov5在openvino部署做目标检测文章，但是没看到过用opencv的dnn模块做yolov5目标检测的。于是，我就想着编写一套用opencv的dnn模块做yolov5目标检测的程序。在编写这套程序时，遇到的bug和解决办法，在这篇文章里讲述一下。

01

RNNsearch、Multi-task、attention-model...你都掌握了吗？一文总结机器翻译必备经典模型（一）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载，共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。第 1 期：RNNsearch、Multi-task、attention-mode

02

使用onnx对pytorch模型进行部署

1.onnx runtime安装# 激活虚拟环境conda activate env_name # env_name换成环境名称# 安装onnxpip install onnx # 安装onnx runtimepip install onnxruntime # 使用CPU进行推理# pip install onnxruntime-gpu # 使用GPU进行推理复制代码2.导出模型import torch.onnx # 转换的onnx格式的名称，文件后缀需为.onnxonnx_file_name = "xx

02

【22】进大厂必须掌握的面试题-30个Informatica面试

在大数据时代，任何公司的成功都取决于数据驱动的决策和业务流程。在这种情况下，数据集成对于任何业务的成功秘诀都是至关重要的，并且掌握诸如Informatica Powercenter 9.X之类的端到端敏捷数据集成平台必将使您走上职业发展的快速通道。使用Informatica PowerCenter Designer进行ETL和数据挖掘的职业是前所未有的最佳时机。

04

TorchVision对象检测RetinaNet推理演示

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识 torchvision对象检测介绍 Pytorch1.11版本以上支持Torchvision高版本支持以下对象检测模型的迁移学习： - Faster-RCNN- Mask-RCNN- FCOS- RetinaNet- SSD- KeyPointsRCNN 其中基于COCO的预训练模型mAP对应关系如下：最近一段时间本人已经全部亲测，都可以转换为ONNX格式模型，都可以支持ONNXRUNTIME框架的

02

ONNXRUNTIEM版本升级到1.13的大坑

一直使用的是ONNXRUNTIME1.7.0版本做推理测试，周末有空就把ONNXRUNTIME版本从1.7.0升级到1.13.1版本了。

02

腾讯发布推理框架TNN全平台版本，同时支持移动端、桌面端和服务端

TNN是腾讯开源的新一代跨平台深度学习推理框架，也是腾讯深度学习与加速Oteam云帆的开源协同成果，由腾讯优图实验室主导，腾讯光影研究室、腾讯云架构平台部、腾讯数据平台部等团队一起协同开发。在经过4个多个月的迭代完善后，TNN新版本v0.3版本正式发布，是首个同时支持移动端、桌面端、服务端的全平台开源版本。TNN新版本在通用性、易用性、性能方面进一步获得提升。 TNN地址： https://github.com/Tencent/TNN 01 通用性在保证模型统一、接口统一的前提下，依托于硬件厂商提供的加

03

基于AidLux的自动驾驶智能预警应用方案

自动驾驶汽车，又称无人驾驶车、电脑驾驶车、无人车、自驾车，是一种需要驾驶员辅助驾驶或者完全不需要操控的车辆。作为自动化载具，自动驾驶汽车可以不需要人类操作即能感知环境及导航。

02

ONNXRUNTIME部署一键人像抠图模型

一键人像抠图，实时支持的模型，整个代码实现是基于Pytorch完成，通过脚本可以一键导出ONNX格式模型，官方提供了ONNXRUNTIME模型部署推理演示的Python版本代码。项目的github地址如下：

02

Python3实现两个Excel文件内容

最近在工作中，需要人工比对大量的excel格式报表，刚好刚学了Pyhon入门基础知识，想着写个东西练练手，不但能提高代码编写能力，还能减轻工作量，提高工作效率。说干就干，简单的理了逻辑。首先，将目标表和源表的内容分别写入到字典中，Excel表中不确定有没有字段是唯一值，所以选择了行号作为key值，一行的内容放到list中，然后从源表中取一行去目标表中遍历。想好之后开始敲代码了，在代码编写过程中遇到很多的问题，都是遇到一个查一个。基本的比对功能实现后，就想着在加个日志记录下比对结果。写下此文记录下，just do it. 下面是全部代码

02

Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测|附代码数据

最近我们被客户要求撰写关于深度学习循环神经网络RNN的研究报告，包括一些图形和统计输出。

00

腾讯发布推理框架TNN全平台版本，同时支持移动端、桌面端和服务端

TNN是腾讯开源的新一代跨平台深度学习推理框架，也是腾讯深度学习与加速Oteam云帆的开源协同成果，由腾讯优图实验室主导，腾讯光影研究室、腾讯云架构平台部、腾讯数据平台部等团队一起协同开发。在经过4个多个月的迭代完善后，TNN新版本v0.3版本正式发布，是首个同时支持移动端、桌面端、服务端的全平台开源版本。TNN新版本在通用性、易用性、性能方面进一步获得提升。

01

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

SFT（Supervised Fine-Tuning）监督微调是指在源数据集上预训练一个神经网络模型，即源模型。然后创建一个新的神经网络模型，即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关，因此在目标模型中不予采用。微调时，为目标模型添加一个输出大小为目标数据集类别个数的输出层，并随机初始化该层的模型参数。在目标数据集上训练目标模型时，将从头训练到输出层，其余层的参数都基于源模型的参数微调得到。

00

Sequence to Sequence Learning with Neural Networks论文阅读

作者（三位Google大佬）一开始提出DNN的缺点，DNN不能用于将序列映射到序列。此论文以机器翻译为例，核心模型是长短期记忆神经网络（LSTM），首先通过一个多层的LSTM将输入的语言序列（下文简称源序列）转化为特定维度的向量，然后另一个深层LSTM将此向量解码成相应的另一语言序列（下文简称目标序列）。我个人理解是，假设要将中文翻译成法语，那么首先将中文作为输入，编码成英语，然后再将英语解码成法语。这种模型与基于短语的统计机器翻译(Static Machine Translation, SMT)相比，在BLUE(Bilingual Evaluation Understudy)算法的评估下有着更好的性能表现。同时，作者发现，逆转输入序列能显著提升LSTM的性能表现，因为这样做能在源序列和目标序列之间引入许多短期依赖，使得优化更加容易

02

YOLOv8对象检测 + ONNXRUNTIME 部署 C++ 源码演示！

ONNXRUNTIME是主流的深度学习部署框架之一，支持ONNX格式模型在CPU、GPU、ARM等不同硬件平台上加速推理，支持C++、Python、Java、C#、JS等不同语言SDK。C++版本安装包下载如下：

02

YOLOv7-Pose尝鲜，基于YOLOv7的关键点模型测评

目前人体姿态估计总体分为Top-down和Bottom-up两种，与目标检测不同，无论是基于热力图或是基于检测器处理的关键点检测算法，都较为依赖计算资源，推理耗时略长，今年出现了以YOLO为基线的关键点检测器。玩过目标检测的童鞋都知道YOLO以及各种变种目前算是工业落地较多的一类检测器，其简单的设计思想，长期活跃的社区生态，使其始终占据着较高的话题度。

01

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

SFT（Supervised Fine-Tuning）监督微调是指在源数据集上预训练一个神经网络模型，即源模型。然后创建一个新的神经网络模型，即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关，因此在目标模型中不予采用。微调时，为目标模型添加一个输出大小为目标数据集类别个数的输出层，并随机初始化该层的模型参数。在目标数据集上训练目标模型时，将从头训练到输出层，其余层的参数都基于源模型的参数微调得到。

05

【2021微信大数据挑战赛】常见问题之TI-ONE平台使用相关

TI-ONE平台安装cuda指引：https://cloud.tencent.com/developer/article/1845781

FlowSeq、mBART、BERT-fused、mRASP、mRASP2...你都掌握了吗？一文总结机器翻译必备经典模型（三）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载，共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。第 1 期：RNNsearch、Multi-task、attention-model

02

YOLOD也来啦 | 优化YOLOv5样本匹配，顺带设计了全新的模块

本文首发于【集智书童】，白名单账号转载请自觉植入本公众号名片并注明来源，非白名单账号请先申请权限，违者必究。

04

使用ECOC编码提高多分类任务的性能

逻辑回归、支持向量机等机器学习算法可以对二元数据集进行分类，但是无法处理超过 2 个目标类标签的多类分类任务。对于多类分类或多标签分类任务，我们需要使用某些技巧或者其他机器学习算法来训练数据集。

03

YOLOX在OpenVINO、ONNXRUNTIME、TensorRT上面推理部署与速度比较

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识 YOLOX目标检测模型旷视科技开源了内部目标检测模型-YOLOX，性能与速度全面超越YOLOv5早期版本！如此神奇原因在于模型结构的修改，下图说明了改了什么地方：把原来的耦合头部，通过1x1卷积解耦成两个并行的分支，经过一系列处理之后最终取得精度与速度双提升。实验对比结果如下：论文与代码模型下载地址： https://arxiv.org/pdf/2107.08430.pdfhttps://github

04

NLP硬核入门-Seq2Seq和Attention机制

本文需要的前序知识储备是：循环神经网络RNN，词向量WordEmbedding，门控单元VanillaRNN/GRU/LSTM。

01

YOLOD也来啦 | 优化YOLOv5样本匹配，顺带设计了全新的模块

在提出新结构之前，对FPN+ PAN结构进行了分析。发现在这种组合架构中，用于检测小目标的检测网络的深度比用于检测大目标的网络的深度要浅（图3）。

02

Seq2Seq、SeqGAN、Transformer…你都掌握了吗？一文总结文本生成必备经典模型（一）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 2 期进行连载，共介绍 10 个在文本生成任务上曾取得 SOTA 的经典模型。第 1 期：Seq2Seq（RNN）、Seq2Seq（LSTM）、Seq2Seq+

01

【EC】论文研读-显式自编码器的进化多任务优化方法

论文研读-显式自编码器的进化多任务优化方法 Evolutionary Multitasking via Explicit Autoencoding EMT-A/EMEA 此篇文章为 L. Feng, L. Zhou, J. Zhong, A. Gupta, Y. Ong, K. Tan, A.K. Qin, Evolutionary Multitasking via Explicit Autoencoding, IEEE Transactions on Cybernetics. 49 (2019) 345

02

CVPR 提前看：视觉常识的最新研究进展

1、What it Thinks is Important is Important: Robustness Transfers through Input Gradients

01

基于内容的图像检索技术：从特征到检索

构建词库是离线操作，主要对目标数据集中的文本进行解析提取词干信息，建立当前数据集的词库，然后基于词库，对数据集中所有文档提取本文特征。构建词库在整个检索系统生命周期开始阶段实施，一般情况仅执行一次，是针对目标检索文本数据集进行的非频繁性操作。

01

ONNXRUNTIME | Faster-RCNN ONNX模型在C++与Python推理不一致原因找到了

点击上方↑↑↑“OpenCV学堂”关注我 onnxruntime 推理python与c++支持现象最近用torchvision中的Faster-RCNN训练了一个自定义无人机跟鸟类检测器，然后导出ONNX格式，Python下面运行效果良好！显示如下：然后我就想把这个ONNXRUNTIME部署成C++版本的，我先测试了torchvision的预训练模型Faster-RCNN转行为ONNX格式。然后针对测试图像，代码与测试效果如下： transform = torchvision.transforms

04

onnx2pytorch和onnx-simplifier新版介绍

【GiantPandaCV导语】本文是ONNX2Pytorch思路分享以及onnx-simplifier新版简要介绍。ONNX2Pytorch工具已经测试了onnx model zoo中的大量分类模型并转换正确，欢迎使用，github地址：https://github.com/BBuf/onnx2nn。GiantPandaCV几个月前遭受恶意举报，今天终于解除封印了。感谢众多粉丝们的长期等待和支持，我们会在此继续分享学习经验。

01

计算机视觉"新"范式: Transformer | NLP和CV能用同一种范式来表达吗？

自从Transformer出来以后，Transformer便开始在NLP领域一统江湖。

03

Sequence to Sequence Learning with Neural Networks

参考译文：https://blog.csdn.net/qq_28385535/article/details/86421359

04

OpenCV部署yolov5v-v6.1目标检测（附源代码）

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G 使用OpenCV部署yolov5v-v6.1目标检测，包含C++和Python两个版本的程序。使用ONNXRuntime部署yolov5-v6.1目标检测，包含C++和Python两个版本的程序。支持yolov5s，yolov5m，yolov5l，yolov5n，yolov5x， yolov5s6，yolov5m6，yolov5

04

pix2pix模型(雪花算法原理)

Pix2pix算法(Image-to-Image Translation,图像翻译) 来源于论文：Image-to-Image Translation with Conditional Adversarial Networks

02

百分点认知智能实验室出品：机器翻译是如何炼成的（下）

在“机器翻译是如何炼成的（上）”的文章中，我们回顾了机器翻译的发展史。在本篇文章中，我们将分享机器翻译系统的理论算法和技术实践，讲解神经机器翻译具体是如何炼成的。读完本文，您将了解：

01

YOLOv5-v6.0学习笔记

YOLOv5-6.0版本的Backbone主要分为Conv模块、CSPDarkNet53和SPPF模块。

03

Neural Machine Translation 论文阅读

这是2015年发表在ICLR上的论文，也是NLP中Attention机制的开山之作，Attention机制是为了解决一般的RNN Encoder-Decoder对长句子表现不佳的问题而设计的。从论文题目中我们可以看到，作者希望通过Attention机制将输入句子input和输出句子output进行"对齐"（SMT中也有所谓的词对齐模型）。但是，由于不同语言的句法语法结构千差万别，想将源句子与翻译句子严格的对齐是很困难的，所以这里的对齐实际上是软对齐（soft-alignment），也就是不必将源句子显式分割，因而又被形象地称为注意力机制（Attention Mechanism）

01

TensorRT详细入门指北，如果你还不了解TensorRT，过来看看吧！

作为在英伟达自家GPU上的推理库，这些年来一直被大力推广，更新也非常频繁，issue反馈也挺及时，社区的负责人员也很积极，简直不要太NICE。

04

一文读懂基于神经网络的图片风格转移

将A图片的风格转移到B图片上，指的是将A图片的抽象艺术风格（如线条、色彩等等）和B图片的内容框架合成为一幅图。自然地，A图片称为风格图，而B图片就称为内容图。就像这样：

03

NLP硬核入门-PointerNet和CopyNet

PointerNet和CopyNet是同一类网络模型，只是在不同的论文里叫法不同，后文统一用PtrNet来表示。

02

英伟达few-shot图像转换

1 摘要无监督的图像到图像转换方法学习任务是：将给定类别的图像映射/转换到不同类别的“类似”图像。尽管当前方法取得了巨大成功，但需要在训练时获取源类和目标类中的许多图像；这极大地限制了它们的使用。

01

学界 | 普适注意力：用于机器翻译的2D卷积神经网络，显著优于编码器-解码器架构

深度神经网络对自然语言处理技术造成了深远的影响，尤其是机器翻译（Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Jean et al., 2015; LeCun et al., 2015）。可以将机器翻译视为序列到序列的预测问题，在这类问题中，源序列和目标序列的长度不同且可变。目前的最佳方法基于编码器-解码器架构（Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Bahdanau et al., 2015）。编码器「读取」长度可变的源序列，并将其映射到向量表征中去。解码器以该向量为输入，将其「写入」目标序列，并在每一步用生成的最新的单词更新其状态。基本的编码器-解码器模型一般都配有注意力模型（Bahdanau et al., 2015），这样就可以在解码过程中重复访问源序列。在给定解码器当前状态的情况下，可以计算出源序列中的元素的概率分布，然后使用计算得到的概率分布将这些元素的特征选择或聚合在解码器使用的单个「上下文」向量中。与依赖源序列的全局表征不同，注意力机制（attention mechanism）允许解码器「回顾」源序列，并专注于突出位置。除了归纳偏置外，注意力机制还绕过了现在大部分架构都有的梯度消失问题。

02

如何用 Keras 为序列预测问题开发复杂的编解码循环神经网络?

本文介绍了如何利用Keras框架开发基于序列数据的循环神经网络模型，并给出了一个序列到序列预测问题的实例。首先介绍了如何定义一个简单的编码器-解码器模型，然后利用Keras的Sequential模型定义了一个基于LSTM的编码器-解码器模型，最后利用Keras的Dataset API从数据集中加载数据并划分训练集和测试集。在划分数据集之后，使用Keras的Sequential模型定义了一个基于LSTM的编码器-解码器模型，并使用Keras的Keras Tuner对模型进行超参数调优。最后，使用Keras的Keras Tuner对模型进行超参数调优，并使用测试集对模型进行评估。实验结果表明，该模型在序列到序列预测问题上的性能优于传统的循环神经网络模型。

00

使用ONNXRuntime部署阿里达摩院开源DAMO-YOLO目标检测，一共包含27个onnx模型(代码开源)

ONNXRuntime是微软推出的一款推理框架，用户可以非常便利的用其运行一个onnx模型。ONNXRuntime支持多种运行后端包括CPU，GPU，TensorRT，DML等。可以说ONNXRuntime是对ONNX模型最原生的支持。

02

ONNX 开始

此为修改模型的。如果要修改某节点的，见参考 onnx_cut.py 的 _onnx_specify_shapes()。

02

Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测|附代码数据

LSTM 网络是一种循环神经网络 (RNN)，它通过循环时间步长和更新网络状态来处理输入数据。网络状态包含在所有先前时间步长中记住的信息。您可以使用 LSTM 网络使用先前的时间步长作为输入来预测时间序列或序列的后续值。要训练 LSTM 网络进行时间序列预测，请训练具有序列输出的回归 LSTM 网络，其中响应（目标）是训练序列，其值偏移了一个时间步长。换句话说，在输入序列的每个时间步，LSTM 网络学习预测下一个时间步的值。

00

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭