以图像为输入和单像素输出的神经网络_DGL中以节点为输入、边为输出的图神经网络_卷积神经网络，将RGB图像作为输入，并输出每个像素10个元素的向量 - 腾讯云开发者社区

、、

提前感谢您阅读本文。因此，我正在尝试编写一个神经网络来识别图像中的特定徽标。我基本上有一个特定纵横比的滑动窗口，它会将当前窗口缩放到输入的预期大小。该窗口将输入输入到网络中，并查看输出以确定窗口中的内容是否是我正在寻找的徽标。在这种情况下，它将在窗口边缘绘制一个框，勾勒出徽标的轮廓。我的问题在于，神经网络报告的图像其他部分的置信度太高，最终会在各处绘制如此多的方框，以至于不可能看到原始图像的大部分。所以很明显，神经网络出了问题。为了输入图像，我尝试将其展开为灰度和彩色。这两种方式都不起作用。我也尝试过不同的输入大小。当它开始变得太小时，它会变得更糟，但即使在57x22x3彩色展开的输入，

浏览 0提问于2012-12-18得票数 0

3回答

Matlab神经网络的字符识别

、、

我正在做我的最后一个项目。我选择实现一个用于字符识别的神经网络。我的计划是将包含26个英文字母的26张图像作为训练数据，但我不知道如何将这些图像转换为我的神经网络的输入。假设我有一个具有两层的反向传播神经网络-一个隐藏层和一个输出层。输出层有26个神经元，产生26个字母。我自己创建了26个图像(大小为100*100像素的24位bmp格式)，每个图像都包含一个英文字母。我不需要做图像分割，因为我是图像处理的新手，所以你们能给我一些关于如何在Matlab中将图像转换为输入向量的建议(或者我需要做边缘，形态学或其他图像预处理的东西吗？) 非常感谢。

浏览 1提问于2011-10-21得票数 0

回答已采纳

1回答

用神经网络进行图像识别？

、、、

我正在创建一个神经网络，用来训练在图像中使用Neuroph识别数字。我想通过提供输入原始图像的不同变化来使我的神经网络更好。以“70.jpg”为例，我想提供70的模糊图像，70…的模糊图像等，对神经网络进行训练。我正在使用和任何建议来实现我的需求？

浏览 1提问于2015-10-03得票数 3

1回答

什么样的神经网络结构适合于图像的图像学习？

、、、、

从输入图像到输出图像存在映射。假设输入图像是一张纸，中间有一个方形的孔，输出图像是当光线照射在纸上时输入图像的阴影，它看起来也像一个正方形，但有一些模糊和大小不同。(实际的模式要比这个正方形的洞复杂得多)我正在尝试实现一个神经网络，它可以学习这种映射，当给定输入图像时，网络可以预测输入图像的“阴影”。我尝试使用一个卷积的自动编码器结构(如这个https://blog.keras.io/building-autoencoders-in-keras.html)，将目标图像从输入图像替换为self到输出图像训练集。但看起来不太好用。我想知道什么样的神经网络适合这个任务？什么样的损失函数是合适的？

浏览 0提问于2018-04-23得票数 2

1回答

在MATLAB中使用单元阵列作为神经网络向导的输入？

、、

我有一个1x1000单元格数组，用于数字0的28x28图像。我将此作为神经网络向导中的输入。但是我不确定我应该在目标输出部分得到什么。我尝试了一个简单的1x1000零数组(0)和一个1x1000单元格的零数组。我完全不知道目标输出的变量类型应该是什么。如果有人能帮忙，那就太棒了。谢谢。

浏览 3提问于2016-01-15得票数 0

回答已采纳

1回答

用全批量训练将字母图像训练成神经网络

、、、、

根据(Perceptron)，我想建立一个简单的(在最简单的水平上是为了学习目的)的神经网络(Perceptron)，它可以训练识别"A“字母。在本教程中，在建议的示例中，他们构建了一个可以学习“和”逻辑运算符的网络。在这种情况下，我们有一些输入(4*3矩阵)和一个输出(4*1矩阵)：每次用输入矩阵减去输出矩阵，计算误差和更新率等。现在我想给一个图像作为输入，在这种情况下，我的输出是什么？我如何定义这个图像是一个"A“字母？一种解决方案是将"1“定义为"A”字母，将"0“定义为”非A“，但如果我的输出是标量，如何用隐藏层减去它并计算误差和更

浏览 2提问于2016-11-18得票数 1

回答已采纳

1回答

用神经网络估计图像中的距离

、

用神经网络估计静止图像或视频流中的距离可行吗？我有一个激光测距仪，提供视频输出以及距离测量。然而，距离测量需要将激光照射到环境中，这并不总是理想的或允许的。我想有一个选择，把这个转变为“被动”模式，图像被输入到一个神经网络，然后提供一个距离估计，而不需要激活激光。网络最初将在主动模式下接受来自游侠查找器的image+distance对的训练。我不是神经网络方面的专家，虽然Google发现神经网络在图像分类和姿态估计方面有很多用途，但我找不到任何现有的距离估计技术。这看起来可行吗，还是我在浪费时间？一个基本的前馈网络，每N像素一个输入就足够了，还是我需要一个不同的架构？

浏览 3提问于2016-04-03得票数 5

回答已采纳

3回答

如何制作OCR程序？

、

我想做一个以图像为输入并输出文本的程序。现在，我知道我可以使用神经网络将单个字符的图像转换为该字符。困难的部分是:给定一个包含文本的图像，我如何在每个字符周围生成所有矩形？我可以使用什么方法来做到这一点？

浏览 0提问于2011-07-01得票数 11

回答已采纳

1回答

是否有一个python函数可以将图像转换为一组图像“windows”？

、、

我正在训练一个卷积神经网络(在tensorflow-gpu中)来分割组织学幻灯片。我的问题是预测方法非常慢。将神经网络的结构设置为接收75×75 RGB像素阵列作为输入，并将分类为中心像素。换句话说，对于神经网络接收的每一个75x75像素窗口，它只对一个像素进行分类(位于窗口的中心)：我用这种方式建立了神经网络，这样它就可以被放大并应用到任何大小的图像中。每个“窗口”的存在纯粹是为了将其中心像素(神经网络对其进行分类)进行上下文化。该预测方法遍历输入图像中的每个像素，并使用其对应的75x75RGB窗口对其进行分类。我目前生成75x75窗口的方法是python编写的，速度慢，不必要的序列化

浏览 5提问于2020-07-06得票数 0

1回答

如何在保持大小的同时放大缩放的图像？

、、

我有一个神经网络(用java制造)，它使用mnist数据集对手写数字进行分类。我有一个图形用户界面，用户将画一个数字(左边的数字)，当用户点击“猜测”按钮时，绘图被转换为400×470图像，然后缩小到20×20图像，然后以28×28图像为中心，输入到右边输出的网络中。下面是GUI的样子：然而，我的问题是，当我有一个数字没有占据面板的大部分(如上面的图像中的3)，被用作网络输入的缩小图像太小，这导致网络错误地猜测。下面是当数字被画得很小时的最终输入图像：以下是数字大绘制时的最终输入图像：我要问的是:是否有办法使绘制的数字与绘制的数字相同大小，同时仍将图像大小保持为2

浏览 0提问于2019-08-06得票数 0

回答已采纳

5回答

如何将图像输入到神经网络？

、、、

我知道神经网络是如何工作的，但是如果我想将它们用于图像处理，比如实际的字符识别，我不能理解如何将图像数据输入到神经网络中。我有一个非常大的A字母的图像。也许我应该尝试从图像中获取一些信息/规范，然后使用该规范的值的向量？它们会成为神经网络的输入吗？谁已经做了这样的事情，你能解释一下怎么做吗？

浏览 2提问于2010-01-18得票数 37

1回答

如何在神经网络算法中同时处理文本和图像输入

、、

我正在研究神经网络机器学习算法。我想知道NN功能列表中适用的输入数据格式。是否有可能将文本和图像一起处理为CNN的输入或使用任何其他机器学习算法。我将如何理解输出。

浏览 2提问于2017-07-26得票数 1

2回答

调整图像大小Matlab

、

我想要调整图像的大小，但它应该在调整大小时保持高/宽的比例。我要做的是，首先检查哪边(宽或高)是长的。如果宽度很长，我会将150设置为宽度的大小，并在不影响图像形状的情况下调整高度，反之亦然。我说的是这个调整大小的图像用于边缘检测算法，输出的二值图像被发送到神经网络，这需要固定数量的输入。在这种情况下，图像的一侧(宽度或高度)是150，而另一侧小于150(因图像而异)。但是我想把黑色添加到另一面(小于150)，直到它的大小是150。因此，我可以向神经网络发送150*150个输入。问题是如何将黑色添加到另一边(小于150)，直到它的大小为150？提前感谢

浏览 5提问于2011-04-28得票数 0

4回答

人工神经网络图像变换

、、

我有一对图像(输入-输出)，但我不知道从A(输入)到B(输出)的转换。我想录制图像A并获得图像B。从物理上讲，我可以更改设置以获得A或B，但我想通过软件来完成。如果我理解得很好，一个经过训练的人工神经网络能够做到这一点，有一个输入可以给出相应的输出，对吗？如果输入的是一个新的(但类似于其他的)图像，有没有软件/ANN可以通过输入一些输入-输出对来“训练”它，从而能够提供正确的输出？谢谢

浏览 1提问于2015-07-24得票数 4

2回答

用于图像处理的OpenCV神经网络

、、、、

我新来的人工智能世界，并尝试了一些实践。看来我需要一些第三方的经验。假设我需要消除图像缺陷(实际上任务更棘手)。我希望经过训练的神经网络能够对缺陷区域进行插值。基于这些原因，我尝试创建简单的神经网络。它有输入:灰度图像与差(72*54)和相同的图像，没有缺陷。隐层有2*72*54个神经元。主要代码段 cv::Ptr<cv::ml::ANN_MLP> ann = cv::ml::ANN_MLP::create(); int inputsCount = imageSizes.width * imageSizes.height; std::vector<i

浏览 3提问于2017-06-19得票数 2

2回答

如何在同一张图片中定位多个对象？

、、、

我是TensorFlow的新手。目前，我正在TensorFlow网站上测试一些分类的例子“卷积神经网络”，它解释了如何将输入图像分类到预定义的类中，但问题是:我不知道如何在同一张图像中定位多个对象。例如，我有一个包含一只猫和一只狗的输入图像，我希望我的图形在输出中显示这两个图像中都有“一只猫和一只狗”。

浏览 0提问于2017-02-21得票数 16

1回答

基于神经网络的手写体分词

、、、、

所以我要做的就是把手写的英文草书单词分割成单独的字符。我在人工智能中应用了一种简单的启发式方法，对单词进行了基本的过度分割，如下所示：我正在用Matlab对此进行编码。该方法包括预处理、倾斜校正大小归一化等，然后将笔画细化到1像素宽度，并使用图像的像素列和来识别图像中存在的连字。像素和低于阈值的每一列都是可能的分割点。问题是，像“u”，“v”，“m”，“n”和“w”这样的开放字符也具有较低的像素列和，并被分割。我使用的方法是本文中介绍的方法的修改版本：现在为了改进这种安排，我必须使用神经网络来纠正这些分割点，并将它们识别为糟糕的分割。我将为此编写一个'newff‘函数，

浏览 2提问于2016-05-02得票数 1

1回答

用于神经网络的pybrain图像输入数据集

、、

我正在尝试编写一个神经网络，它(经过适当的训练)识别某些路标，并为每种类型的路标返回不同的输出。在我开始训练我的网络之前，我在pybrain网站上注意到，他们的数据集总是一个值数组，每个条目都包含一个输入和一个目标。我为NN提供的图像已经转换为灰度像素数据(一个简单的数字数组)。为了训练每一组数据，我是否需要为每个像素添加一个目标值？如果是的话，我该怎么做呢？

浏览 0提问于2013-07-02得票数 1

1回答

是否可以使用神经网络插值数据？

、、、

我对人工智能和神经网络完全陌生。我目前正在从事一个等离子体物理模拟项目，它需要一个非常高分辨率的数据集。我们目前有两个相同问题的模拟结果运行在不同的分辨率-其中一个的分辨率高于另一个。然而，我们需要更高的分辨率才能有效地利用这些数据。不幸的是，由于计算能力的限制，我们无法进行更高分辨率的仿真。因此，我们试图以某种方式对数据进行插值，我们必须得到一个合理的估计，如果我们要以更高的分辨率运行它，那么模拟结果可能是什么。在SciPy中，我尝试使用传统的插值技术和函数对数据进行插值。然而，插值结果有时会在某些点上下降约20 %至30 %。问题陈述与我的想法因此，我想知道是否有可能使用神经网络来生成

浏览 0提问于2021-07-29得票数 2

2回答

卷积输出

、、

假设我们有一个5x5大小的图像和一个3x3大小的内核，上面有步幅2和填充。在通过神经网络中的卷积层之后，输出图像的大小是多少。

浏览 16提问于2018-10-21得票数 1

1回答

形状提取应该使用哪种损失函数？

、、、

我需要建立一个神经网络来识别多个特定形状的配置(方形，三角形…)。在图像中并改变它们的颜色作为输出。因此，神经网络将以32x32x1 (灰度)作为输入，32x32x3作为输出。我的问题是:我应该用什么样的函数来训练我的神经网络。因为我读了一些文章来找出来，这不是一个分类或回归问题(据我所理解)，所以我有点迷失了，因为我是新来的。考虑到我有一个与输入映像相对应的输出映像的数据库，我可以在上训练网络，在这个项目中使用Tensorflow进行

浏览 1提问于2020-10-31得票数 0

回答已采纳

3回答

用于多模式识别的神经网络输出层

、

假设我有一种方法或其他神经网络可以正确地对图像进行模式检测。在图像中有多个模式的情况下，我应该如何设计神经网络？假设在一幅图像中，有X个模式需要检测，那么最好的方法是什么？AFAIK输出层神经元的值应该是-1,1。我如何知道是否有X个识别的模式？这是否意味着我必须对它可以识别的模式数量设置硬编码限制(因为输出神经元的数量是固定的)？

浏览 2提问于2011-01-06得票数 2

1回答

在卷积神经网络(CNN)中，当转换图像时，运算是用点乘积还是用元素方向乘法之和？

、、、、

下面的例子摘自deeplearning.ai中的讲座，结果是元素逐元乘积(或“元素向乘法”)之和。红色数字表示过滤器中的权重： (1*1)+(1*0)+(1*1)+(0*0)+(1*1)+(1*0)+(0*1)+(0*0)+(1*1) = 1+0+1+0+1+0+0+0+1 = 4 📷 但是，大多数资源都表示使用的是点产品： “我们可以将神经元的输出重新表示为，其中有偏置项。换句话说，我们可以用y=f(x*w)计算输出，其中b是偏置项。换句话说，我们可以通过执行输入向量和权向量的点乘积，加上偏差项来生成logit，然后应用变换函数来计算输出。” 布杜马，尼基尔；Locascio，尼古

浏览 0提问于2018-03-19得票数 6

回答已采纳

1回答

如果神经网络能够优化传统的图像处理算法？

、

我并不是说神经网络能够完成传统图像处理的工作，我想说的是，如果存在一种神经网络，它可以用传统方法的参数作为输入，输出更多不需要人工adjustment.Intuitively的通用参数，我的想法比直接使用神经网络效率低，但我对神经网络的数学知识不太了解。

浏览 10提问于2022-04-08得票数 1

回答已采纳

1回答

基于CNN的多图像超分辨率研究

、

我正在编写一个程序，它可以以多个低分辨率图像作为输入，并输出高分辨率图像。我的理解是，对于单个图像的超分辨率，卷积神经网络工作得很好。我只需要一个只有三个卷积层的网络，就像这里描述的那样。然后，我可以用大量的低分辨率图像和它们对应的高分辨率图像(具有均方误差代价函数)来训练网络，理论上应该是可行的。不过，如果我想获得更高的精度，我可以通过查看多幅低分辨率图像来获得更多关于潜在的高分辨率图像的信息。因此，我的问题是:如何修改这个基于神经网络的算法，使其能够以多幅图像(同一对象)作为输入，从而输出更精确的高分辨率图像？我会假设这要复杂得多，因为多幅图像可能会以一个像素的零头，或者从一个稍微不

浏览 0提问于2018-02-03得票数 1

回答已采纳

1回答

利用图像训练的人工神经网络

、、、

我感兴趣的是创建一个使用Microsoft检测像笔这样的对象的软件。我回顾了100幅正面图像和200幅负片图像，以便用人工神经网络进行采集。我的问题是:如何将这些图像转换成人工神经网络的输入？我想最后一层有一个神经元，因为是一个输出是笔还是不是笔，我猜输入也是一个，我想总共使用3层。但我不知道是否应该转换矩阵中的正负图像，或者我能做些什么？

浏览 4提问于2014-02-15得票数 3

回答已采纳

1回答

手写数字的神经网络

、、

我在这方面的第一个方法与神经网络无关。我会简单地将手写输入(数字1-3)与模型图像进行比较，在模型图像中，它将通过索引比较两个图像的像素，并查看它们是否具有相同的RGB值。这种方法效果不佳，只有当手写数字与基本图像有共同的像素时才有效。现在我想实现某种神经网络，但我有一些问题。所有图像都由全黑或全白像素组成，每个图像都是500x500像素。我对神经网络有一个基本的了解，其中有反向传播，偏差，权重，隐藏层，等等。我抽象地理解它们的作用，但我对如何实现神经网络感到困惑。计算机可以识别的模式是什么？我想指出的是，我并不局限于神经网络，我对这个问题的其他解决方案持开放态度，但神经网络似乎是解决这

浏览 2提问于2016-11-27得票数 0

3回答

当有许多输出时，使用哪个损失函数？

、、、

类似于1000x1像素图像的数据来自于该设备。图像中的某处可能是1个、2个或更多个对象。我要建立一个神经网络来检测物体。我想做1000个输出。每个输出将指示该输出中是否有对象。建议我使用哪个损失函数。在我看来，“分类交叉”是不合适的，因为例如:在训练数据中，我将指示对象位于10和90像素。神经网络将预测对象的像素分别为11和89。这不是一个很大的损失。但对于网络来说，它的损失将与预测500和900像素的对象相同。什么样的损失函数适用于这种情况？我正在使用Keras

浏览 0提问于2019-06-15得票数 0

1回答

我的神经网络有更好的激活功能吗？

、、、、

我正在写一个程序来识别手写的字母。我有作为BufferedImages导入的500 as *500 as图像，我将每个像素的getRBG()值作为神经网络的输入，因此有25万个输入。getRGB()的值从-16777216 (表示写入)到-1 (表示白色背景)。从输入到第一个隐藏节点的权重是随机的，从0到1。我一直使用乙状结肠函数1/(1+e^(-x))作为我的激活函数，得到0到1之间的所有值。但是，我的问题是，由于输入太多，所以当我取它们的点乘积时，我得到了一个巨大的数值(例如，1.3E8或-1.3E8)。然后，当我将这个数字放入sigmoid函数中时，结果总是全部为1s或全部0，因此它本质

浏览 0提问于2018-05-01得票数 0

回答已采纳

3回答

用学习人工神经网络求解输入

我最近又开始钻研人工神经网络，既进化又训练。我有一个问题，如果有的话，应该用什么方法来解决会导致目标输出集的输入问题。这个有名字吗？我试图寻找的一切都会引导我反向传播，这并不一定是我所需要的。在我的搜索中，我最接近表达我的问题的是这告诉我，确实会有很多解决方案的网络，有不同数量的节点为层，他们将不会是琐碎的解决方案。我有一个想法，就是使用在学习过程中建立的权重，向一组理想的输入迈进。还有其他人有做这种事的经验吗？为了详细说明:假设您有一个带有401个输入节点的网络，它表示一个20x20灰度图像和一个偏差，两个隐藏层由100+25节点组成，以及6个输出节点表示一个分类(符号、罗马数

浏览 3提问于2014-12-28得票数 8

1回答

如何设计轮廓识别模型？特别是，如何塑造输出层？

、、、

我想设计和训练一个神经网络来自动识别边缘，在一些显微图像。首先，我将使用Keras，稍后我可能会考虑PyTorch。图像的结构比较简单，有的区域比较暗，有的区域比较清晰，比较容易分辨，任务是在黑暗区域和清晰区域之间选择轮廓的像素。黑暗和清晰之间的转换是渐进的，所以我的结果不是一条边缘像素线，而是一条10或15宽的边缘像素带。我手动注释了200多张图片，所以对于每一幅图像，我有另一幅图像，大小相同，其中等高线的像素是黑色的，所有其他像素都是白色的。我已经看过许多关于如何设计、编译和拟合模型(神经网络)以及如何使用人工注释的数据测试模型的教程。然而，大多数教程都涉及分类问题，其中输出层中的

浏览 0提问于2021-06-07得票数 1

回答已采纳

2回答

使神经网络具有分层输出更好吗？

、、、

我对神经网络非常陌生，最近我建立了用于车牌号码分类的神经网络。它有3层:1输入层，16*24(382神经元)数字图像，150 dpi；1隐层(199神经元)，乙状结肠激活函数；1 softmax输出层(10神经元)，每个数字0到9。我想把我的神经网络扩展到车牌上的字母分类。但我担心，如果我只是简单地在输出中添加更多的类，例如在分类中添加10个字母，总共20个类，神经网络将很难将特征从每个类中分离出来。而且，当输入是数字的输入，神经网络错误地将其归类为概率最大的字母时，即使所有数字输出的概率之和超过了这一概率之和，也会引起问题。因此，我想知道是否有可能以下列方式建立分层神经网络：有三个神经

浏览 17提问于2018-01-13得票数 0

回答已采纳

2回答

图像均值减法和像素均值减法有什么不同？

、、、

我知道我们需要将输入数据放在中心，以便促进具有全局标量学习率的神经网络训练。但是，减去所有通道(R，G，B)上的像素意味着什么，而不是图像的均值呢？此外，对我来说，使用图像均值更有意义，因为我们训练网络中图像的不同空间区域可能具有不同的均值，并且减去在整个图像上计算的恒定像素均值将不会正确地居中输入。附注:我正在研究一个图像分割问题，所以如果上下文影响了答案，请指出它。

浏览 2提问于2018-02-19得票数 3

1回答

我如何实现一个简单的点计数问题使用回归，而不是一个分类方法在毕道尔？

、、、、

我想弄清楚如何解决一个非常简单的问题，那就是，一幅图像中有多少像素是白色的。我有20x20像素图像(零矩阵)，1到20个像素随机设置为1。通过使用CrossEntropyLoss()和Adam优化器对模型进行分类，检查一些教程，我可以解决这个问题： nn.Linear(20*20, 100), nn.ReLU(), nn.Linear(100, 30), nn.ReLU(), nn.Linear(30, 20)``` 这里，我的输出是一个大小为20的向量，图像包含1到20个白色像素(一个)的概率，使用argmax()，我可以简单地撤回最可能的“类”。我现

浏览 3提问于2022-03-31得票数 1

1回答

Caffe中神经网络的数据组织

、、、

我正在准备用于神经网络的数据。我对所有的文件都迷茫了。许多Caffe示例提供了预先准备的数据，但我希望准备自己的数据。我的目标是让我的神经网络使用输入图像(让我们称之为x)并输出不同的图像(让我们称之为y)。我决定使用HDF5文件来使用python存储数据(我知道怎么做)。然而，我想要“显示”神经网络x和y，并让它输出y-hat，就像在类似于期望输出的图像y。但是，我不知道大多数卷积神经网络是如何将输入和期望的输出封装到神经网络中的(即分类网是如何向标签提供数据的)。我是否应该将x和y放入同一个HDF5数据集，然后再放入Caffe数据层？如果是这样，我是否要组织数据集，如：(x1，y1，x2

浏览 4提问于2016-06-23得票数 1

2回答

神经网络是如何处理相关图像数据的？

、、

我是TensorFlow和深度学习的新手。我正在尝试创建一个完全连接的神经网络，用于图像处理。我有点困惑。我们有一个图像，比如说28x28像素。这将有784个输入到NN。对于不相关的输入，这是很好的，但图像像素通常是相关的.举个例子，想想一张牛眼的照片。当我们将所有像素排列在一个阵列中，用于一个完全连接的网络时，神经网络如何理解这一点？它是如何确定相关性的？

浏览 2提问于2016-05-31得票数 1

回答已采纳

1回答

将uint32中的索引图像转换为双倍

、、

我读了下面的 of im2double 类支持：强度和真彩色图像可以是uint8、uint16、双重、逻辑、单一**或int16。索引图像可以是uint8、uint16、double或逻辑。二进制输入图像必须是逻辑的。输出图像是双倍的我正在一台64位机器上工作(也就是说，MATLAB使用8字节来表示类型为double的变量)。我有一个uint32类型的索引映像，我相信我应该能够将它转换为double类型，但是im2double似乎不支持它，也就是说，我得到了以下错误：使用im2double预期输入1 ( Image )为下列类型之一时出错：双，逻辑，uint8，uint16，

浏览 2提问于2012-07-29得票数 1

1回答

将图像堆叠作为CNN的单一输入

、、、

我是新手，我需要你的帮助。如何组合3个不同的图像作为CNN神经网络的单一输入？简单地说，我使用3个图像的列表作为单个输入和一个输出。让我们假设： x1=[img1,img2,img3] ====> y1 x2=[img1,img2,img3] ====> y2 x3=[img1,img2,img3] ====> y3 谢谢!

浏览 13提问于2021-06-04得票数 0

1回答

在open CV中使用单应性在同一场景的同一摄像机中拍摄的两幅图像之间的视图映射，但摄像机位置不平行

、、、、

我正在尝试理解同一场景的两个图像之间的映射点，只是摄像机的位置不同。像这样说 ? 对于粗略的草图和笔迹我深表歉意。取自cam1的样本图像 ? 和取自cam2的样本图像 ? 。试图在这两个图像之间进行映射。因为使用的两个摄像头是相同的(罗技摄像头)。我假设相机校准不是必需的。因此，在SIFT描述符和特征匹配的帮助下，使用图像中的良好匹配作为RANSAC的单应性的输入。我得到3*3矩阵。来验证视图映射。我在cam1图像中选择了几个对象(例如图像中的存储箱)，并尝试使用warp_perspective使用3*3矩阵映射cam2图像中的同一对象，但输出效果不佳。说这样的话 ? 已选择cam1图像中对

浏览 38提问于2021-05-07得票数 0

1回答

Keras中单个输入的多个输出向量

、、、、

我想在Keras中创建一个神经网络，将手写的文字转换成计算机字母。我的第一步是将一个句子转换成一个数组。我的阵列有形状(1, number of letters,27)。现在我想把它输入我的深层神经网络和训练。但是，如果尺寸不符合我的图像，我该如何正确地输入呢？以及如何实现我的预测函数给我一个输出数组的(1, number of letters,27)

浏览 1提问于2017-10-27得票数 2

回答已采纳

1回答

什么时候使用一个只有一个输出神经元的神经网络，何时使用多个输出神经元？

、、

我试着理解在输出层中使用只有一个输出神经元和多个神经元的神经网络之间的区别。我知道，有了这种神经网络，我可以像异或逻辑门那样求解，事实上，我可以使用一个神经网络，在隐藏层中神经元较少。但我不太清楚什么时候为什么要用这种拓扑的神经网络，在这种拓扑结构中，人工神经网络在输出层有多个神经元。有谁知道区别吗？

浏览 2提问于2021-01-06得票数 0

回答已采纳

1回答

神经网络梯度计算

、、、、

我在读关于对抗性图像和破坏神经网络的文章。我正试着一步一步地完成这篇文章，但对我缺乏经验的人来说，我很难理解下面的说明。目前，我对MNIST数据集有一个logistic回归模型。如果你给出一个图像，它会预测出最有可能的数字. saver.restore(sess, "/tmp/model.ckpt") # image of number 7 x_in = np.expand_dims(mnist.test.images[0], axis=0) classification = sess.run(tf.argmax(pred, 1), feed_dict={x:x_in}) p

浏览 3提问于2017-03-17得票数 0

回答已采纳

1回答

在数据集中倒置图像增加大量神经网络训练时间

、、、

我已经用神经网络工作了几个月了，我有一个小小的谜团，我自己解决不了。我想要创建和训练一个神经网络，它可以识别56*56像素灰度图像中的简单几何形状(方形、圆圈和三角形)。如果我使用黑色背景和白色形状的图像，一切都运行得很好。训练时间约18次，准确率接近100% (通常为99.6 %~ 99.8%)。但当我倒置图像时，所有这些都发生了变化(即，现在是白色背景和黑色形状)。训练时间猛增到大约600个时代，在最初的500-550个时期，什么也没有发生。在最初的500-550个时代，损失几乎没有减少，似乎有些东西“卡住”了。为什么培训时间会增加这么多，我该如何减少(如果可能的话)？

浏览 2提问于2022-05-18得票数 2

1回答

ImageNeuralNetwork错误不会下降

、、

我正在努力学习并修改Java的ImageNeuralNetwork示例。到目前为止，我的问题是，当我给神经网络更多的图像，是32X32，让它训练，错误永远不会下降到低于14%，并在开始时，它跳遍了整个地方。我的图像是BW，它们被分为27个类别。所以我知道有27个输出神经元。我的问题是，为什么NN不学习，我尝试设置不同的隐藏层(1或2层)与不同的神经元计数，但没有任何帮助。有人能告诉我我做错了什么吗？就像我说的，我刚从NNs开始，我在这里有点迷茫编辑:如果我给它更少的图像作为输入，以了解错误下降，但这并不能真正解决问题，如果我想分类很多图像，我将被困在错误永远不会下降。

浏览 2提问于2014-11-07得票数 1

回答已采纳

1回答

如何在神经网络中增加更多的输出？

、、、、

当然，没有人能够为所有可能的图像输出建立神经网络来进行图像识别和分类。所以，如果我制作一个神经网络，它接受数组输入，得到作为鸟的输出，或者不是鸟。在我学习完第一个网络之后，我是否可以为更多的图像添加更多的输出，或者这将使学习消失。所以我加上固定的输入号码和一个输出，然后再多加一个和多一个，这适用还是不适用？

浏览 2提问于2017-02-16得票数 0

回答已采纳

1回答

图像质量神经网络方案

、、、

我试图创建一个神经网络项目，以确定彩色图像的质量，并返回是否通过质量检查。这一质量检查将在包含50%好照片和50%坏照片的2000份样本中确定和培训。假设我正在执行的检查是1280x1280像素与RGB无阿尔法通道。我正在尝试创建以下神经网络输入层==> 1280 * 1280 *3= 4915200个神经元 2x隐层==>层1= 1638400，2层= 409600神经元输出层==> 1神经元我的问题是，在简单的异或训练中，我们可以很容易地用两个输入，一个隐藏层，包括两个神经元和一个输出神经元。然而，当它成为现实世界的应用时，内存就成了一个巨大的问题。所需的内存量超

浏览 5提问于2015-05-21得票数 0

回答已采纳

1回答

全卷积变分自编码器

、、、

我想做一个神经网络，它使用黑白图像作为输入，并输出它的彩色版本。在这个过程中，重要的是图像的大小必须保持不变。通常，这是通过使用完全卷积网络与GAN或AE architecture。现在我决定实现一个VAE版本，但是当我在互联网上查找它时，我发现了潜在空间是线性/密集的版本，这意味着它破坏了整个卷积。对于这类神经网络，VAE不是一种有效的方法吗？或者有人可以提供解决方案/代码来帮助这种情况？(Pytorch更喜欢)

浏览 0提问于2019-08-17得票数 1

3回答

神经网络-不同的输入层

、、、

我刚开始做图像识别项目，想把神经网络加入其中。现在，我可以将图像转换成一个重要点位置的列表。我想把那份名单递给安。现在我读了几篇关于ANNs的文章，我总是看到输入层是恒定的。问题是，点数可能会根据op输入图片的不同而变化。是否有与这项任务相对应的特殊类型的人工神经网络？(如果英语不好，对不起:)

浏览 6提问于2014-04-13得票数 1

回答已采纳

3回答

CNN中的“连接的稀疏性”是如何使网络具有更少的参数的？

、、、、

我正在学习吴家祥关于卷积神经网络的讲座，他给出了CNN比非卷积神经网络参数少的两个原因。它们是：参数共享缺乏联系。虽然我能理解第一个原因导致CNN的参数更少。我不明白为什么连接的稀薄性，即“一个层中的每个输出来自少量的输入”导致网络具有较少的参数。第二个原因是不是有点多余？谁能解释一下吗？

浏览 0提问于2020-07-09得票数 2

1回答

我能把卷积神经网络看作是完全连通的神经网络吗？

、

例如，有一个3乘3的图像，具有两个2x2滤波器的卷积神经网络将图像进行卷积。最后，输出维数为2x2x2。，我能把上面的过程看作是下面的步骤吗？由于使用了2x2滤波器，在滑过整个图像后，我得到了4幅小图像。并利用这4幅小图像作为一个完全连接的神经网络的输入。最后，我还可以得到8个输出。我真的不知道CNN的反向传播，所以我试图从经典的完全连接的神经网络中理解它。通过输入一幅小图像，就可以在完全连接的神经网络中更新一次权值，这与在CNN中更新滤波器的权重是一样的吗?。我想对了吗？

浏览 1提问于2017-01-29得票数 0

回答已采纳