开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么我们将Mnist训练图像重塑为(60000,28,28,1)，而不是像这样直接使用(60,28,28)？

我们将Mnist训练图像重塑为(60000,28,28,1)的原因是为了适应深度学习模型的输入要求。深度学习模型通常需要输入一个四维的张量作为输入数据，其中第一个维度表示样本数量，第二和第三个维度表示图像的高度和宽度，最后一个维度表示图像的通道数。

Mnist数据集中的图像是灰度图像，每个像素的取值范围为0到255之间的整数。将图像重塑为(60000,28,28,1)的形状，意味着我们将每个图像从原来的二维矩阵形式转换为一个三维矩阵，其中第一个维度表示样本数量，第二和第三个维度表示图像的高度和宽度，最后一个维度表示图像的通道数。在这种情况下，由于图像是灰度图像，通道数为1。

这种重塑的方式有以下几个优势和应用场景：

适应深度学习模型的输入要求：大多数深度学习模型都要求输入为四维张量，因此将图像重塑为(60000,28,28,1)的形状可以直接作为模型的输入。
提高模型的可扩展性：将图像重塑为(60000,28,28,1)的形状可以方便地处理多个样本，使模型具有更好的可扩展性。
方便进行图像处理操作：将图像重塑为三维矩阵形式后，可以方便地进行各种图像处理操作，如图像增强、滤波等。
与其他深度学习库和框架兼容：许多深度学习库和框架都支持以(样本数量,高度,宽度,通道数)的形式作为输入数据，因此将图像重塑为这种形状可以与这些库和框架兼容。

腾讯云相关产品和产品介绍链接地址：

腾讯云AI开放平台：https://cloud.tencent.com/product/ai
腾讯云图像处理：https://cloud.tencent.com/product/tiia
腾讯云机器学习平台：https://cloud.tencent.com/product/tiia

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

基于MNIST手写体数字识别--含可直接使用代码【Python+Tensorflow+CNN+Keras】

【此处我们打印出该图像对应的数字作为标题，方便查看】 plt.title(Y_train[imgNum]) plt.show() cmap常用于改变绘制风格，如黑白gray，翠绿色virdidis，使用...(Y_test, num_classes=10) # 将训练所用的图像调整尺寸，由于图像是黑白图像，所以最后一维的值是1 # reshape作用：将数组中数据重新划分,X_train、X_test将reshape...，由于图像是黑白图像，所以最后一维的值是1 # reshape作用：将数组中数据重新划分,X_train、X_test将reshape(60000，28，28，1) # print(X_train.shape...【此处我们打印出该图像对应的数字作为标题，方便查看】 # plt.title(Y_train[imgNum]) # plt.show() mnist=tf.keras.datasets.mnist...，由于图像是黑白图像，所以最后一维的值是1 # reshape作用：将数组中数据重新划分,X_train、X_test将reshape(60000，28，28，1) #

4.5K3 0

独家 | 教你用不到30行的Keras代码编写第一个神经网络（附代码&教程）

激活参数是指我们想要使用的激活函数，实际上，激活函数将根据给定的输入计算输出。最后，[28*28]的输入形状是指图像的像素宽度和高度。 ?...这些都是很好的问题……对这些问题的深入解释稍微超出了我们NN的入门范围，但我们将在后面的文章中讨论这些问题。在我们将数据输入到新创建的模型之前，我们需要将输入重塑为模型可以读取的格式。...我们输入的原始形状是[60000，28，28]，它基本上表示60000个像素高和宽为28 x 28的图像。我们可以重塑我们的数据，并将其分为[60000]个训练图像和[10000]个测试图像。 ?...当我们的数据集被分割成训练和测试集，我们的模型被编译，我们的数据被重塑和编码后，我们现在可以准备训练我们的神经网络了！为此，我们将调用fit函数并传入所需的参数。 ?...你刚刚构建了你自己的神经网络，重塑和编码了一个数据集，并且训练了你的模型！当您第一次运行python脚本时，keras将下载mnist数据集并将遍历训练5次！

6862 0

AI 技术讲座精选：数学不好，也可以学习人工智能（四）——图解张量

你可能会问，为什么不直接叫数字呢？我也不知道，可能数学家们觉得 scalar 听起来比较酷？确实，scalar 叫起来要比 number 酷些。...Jupyter Notebook 将文档与代码的功能集为一体。也就是说，其融讲解和编程于一体。 为什么要把数据转换成 Numpy 数组呢？原因很简单。...不，这里指的并不是基努·里维斯（Keanu Reeves）的那个电影，而是类似Excel 表格的这样一个数据结构。我们可以将其可视化为具有行／列的数字网格。...训练集用来教会神经网络，测试集则是神经网络学习后试图分类的目标。 MNIST 都是灰度图像，也就是说可以将其编码为2维 tensor。...TensorFlow 是这样存储图片的： (sample_size, height, width,color_depth) 因此，我们可以得到 MNIST 数据集的4维 tensor，形式如下： (60000,28,28,1

9386 0

盘一盘 Python 系列 10 - Keras (上)

4D 图像数据图像通常具有 3 个维度：宽度，高度和颜色通道。虽然是黑白图像 (如 MNIST 数字) 只有一个颜色通道，按照惯例，我们还是把它当成 4 维，即颜色通道只有一维。...这样的视频剪辑将存储在形状为 (40, 240, 1280, 720, 3) 的张量中。 ? 5 维张量的数据表示图如下： ?...参数个数为 78500，为什么不是 784×100 = 78400 呢？别忘了偏置项（bias）哦，(784+1)×100 = 78500。...参数个数为 1010，考虑偏置项，(100+1)×10 = 1010。最下面还列出总参数量 79510，可训练参数量 79510，不可训练参数量 0。为什么还有参数不需要训练呢？...咋一看子类化和函数式非常像，但有个细微差别，构造函数里面只有各种层，没有 input，而做计算的地方全部在 call() 里进行。这样就把创建层和计算两者完全分开。

1.8K1 0

GAN入门教程 | 从0开始，手把手教你学会最火的神经网络

所以，让我们首先考虑一下我们需要在网络中得到什么。判别器的目标是正确地将MNIST图像标记为真，而判别器生成的标记为假。...这是一种将损失减小到单个标量值的方法，而不是向量或矩阵。 ? 现在我们来设置生成器的损失函数。我们想让生成网络的图像骗过判别器：当输入生成图像时，判别器可以输出接近1的值，来计算Dg与1之间的损失。...现在我们已经得到损失函数，需要定义优化程序了。生成网络的优化程序只需要升级生成器的权重，而不是判别器的。同样的，当训练判别器的时候，我们需要固定生成器的权重。...我们为判别器设置了两套不同的训练方案：一种是用真实图像训练判别器，另一种是用生成的“假图像”训练它。有时使用不同的学习速率很有必要，或者单独使用它们来规范学习的其他方面。其他方面是指的什么？...这就是为什么我们建立判别器来产生未缩放的输出，而不是通过一个sigmoid函数将其输出推到0或1。

2K3 0

为什么还会Flow?

你会问为什么不干脆叫它们一个数字呢？我不知道，也许数学家只是喜欢听起来酷？标量听起来确实比数字酷。实际上，你可以使用一个数字的张量，我们称为0维张量，也就是一个只有0维的张量。...我们为什么想把数据转换为Numpy数组？很简单。因为我们需要把所有的输入数据，如字符串文本，图像，股票价格，或者视频，转变为一个统一得标准，以便能够容易的处理。..., test_labels) = mnist.load_data() 这个数据集被分成两个部分：训练集和测试集。...于是我们可以认为，MNIST数据集的4D张量是这样的： (60000,28,28,1) 彩色图片彩色图片有不同的颜色深度，这取决于它们的色彩（注：跟分辨率没有关系）编码。...一张典型的JPG图片使用RGB编码，于是它的颜色深度为3，分别代表红、绿、蓝。

4.4K7 1

MacBook显卡不跑AI模型太浪费：这个深度学习工具支持所有品牌GPU

那么为什么要用 GPU 呢？最初 GPU 并不是为深度学习专门设计的，但并行计算的本质似乎与图形处理类似。...OpenCL 通用并行计算开放标准并不是为 N 卡专门设计的，因此不论你的笔记本 GPU 是 AMD、 Intel，还是 NVIDIA，它都能支持。 ?...这样以来，我们就已安装所有设备，并且可以使用 GPU 来运行深度学习项目了。在 fashion mnist 上创建 CNN 分类器首先，启动 Jupyter Notebook。...我们训练的卷积神经网络模型在时尚分类任务上达到了 91% 的准确率，训练只用了 2 分钟！这个数字可能看起来并不惊艳，但想想 CPU 训练要多久吧： ?...从以上结论中我们可以看到，借助 Macbook Pro 搭载的 GPU 进行深度学习计算要比简单地用 CPU 快 15 倍。通过 PlaidML，使用自己的笔记本电脑训练深度学习模型将变得更加简单。

2.5K2 0

机器学习-使用TF.learn识别手写的数字图像

给出一个数字的图像，我们的工作将预测它是哪一个数字，我们使用Jputer Notebook编写相关代码。首先是介绍的内容的概述，展示如何下载数据集并可视化图像。...接下来，我们将训练一个分类器，评估它，并用它来预测新的图像。然后我们将可视化分类器学习的权重获得对它如何在底层工作的直觉。让我们从安装TensorFlow开始，现在进入代码： ? ? ? ? ?...这就是为什么我们不得不重塑这个阵列先显示它。现在我们可以初始化分类器了，在这里，我们将使用线性分类器。...那么这些权重告诉我们什么呢？要理解这一点我们将展示四张数字为1的图片： ? 它们都略有不同，但看看中间的像素。请注意，它已填入每个图像。...我们能够想象这些，因为我们开始了有784像素，我们学会了10个权重，一个对于每种类型的数字。然后我们将权重重塑为2D数组。文中代码块 #!

7811 0

观点 | 小心训练模型，数据少也可以玩转深度学习

我们将测试集分为两部分，上半部分用于评估训练过程的收敛，而下半部分用于测量样本预测的准确度。我们甚至没有调整这些模型，对于大多数超参数，仅仅只是使用合理的默认值。...下面是我对原文模型出现问题的猜测：激活函数是十分重要的，而 tanh 神经网络又难以训练。这也就是为什么激活函数已经大量转而使用类似「RELU」这样的函数。确保随机梯度下降是收敛的。...比如 dropout 结合随机梯度下降导致了一个像 bagging 一样糟糕的处理，但是这是发生在网络参数上，而不是输入变量。...在 CNN 中，我们实际上把图像的属性编码进模型本身。例如，当我们指定一个大小为 3x3 的过滤器时，实际上是在直接告诉网络本地连接的像素的小集群将包含有用的信息。...此外，我们还可以把图像的平移和旋转不变性直接编码进模型。所有这些都将模型偏差至图像属性，以极大地降低方差，提升预测性能。你并不需要拥有谷歌量级的数据。

1.1K5 0

小心训练模型，数据少也可以玩转深度学习

我们将测试集分为两部分，上半部分用于评估训练过程的收敛，而下半部分用于测量样本预测的准确度。我们甚至没有调整这些模型，对于大多数超参数，仅仅只是使用合理的默认值。...为什么会这样？众所周知，深度学习模型的训练往往对细节要求极高，而知道如何「调参」是一件非常重要的技能。...下面是我对原文模型出现问题的猜测：激活函数是十分重要的，而 tanh 神经网络又难以训练。这也就是为什么激活函数已经大量转而使用类似「RELU」这样的函数。确保随机梯度下降是收敛的。...在 CNN 中，我们实际上把图像的属性编码进模型本身。例如，当我们指定一个大小为 3×3 的过滤器时，实际上是在直接告诉网络本地连接的像素的小集群将包含有用的信息。...此外，我们还可以把图像的平移和旋转不变性直接编码进模型。所有这些都将模型偏差至图像属性，以极大地降低方差，提升预测性能。你并不需要拥有谷歌量级的数据。

7865 1

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

本文提出了 DeepDefense，这是一种用于训练 DNN 提高模型鲁棒性的对抗正则化方法。与很多已有的使用近似和优化非严格边界的方法不同，研究者准确地将一个基于扰动的正则化项结合到分类目标函数中。...图 1：左上，该类似递归型的网络以重塑的图像 x_k 为输入，并相继地通过利用一个预设计的攻击模块计算每个 r^(i)_k（0≤i<u）。...图 3：一张来自 MNIST 测试集并标注为「0」的图像 (x_k)，并基于 DeepFool 生成对抗样本以欺骗不同的模型，包括：(b) 参考模型，(c)-(e)：带有对抗性训练的精调模型、Parseval...为解决这一问题，我们提出了一个名为 DeepDefense 的训练方案，其核心思想是把基于对抗性扰动的正则化项整合进分类目标函数，从而使模型可以学习直接而精确地防御对抗性攻击。...我们将很快公开发布再现这一结果的代码和模型。本文为机器之心编译，转载请联系本公众号获得授权。

1.2K8 0

从潜在向量生成大图像 - 第二部分

我们已经看到一个生成网络从完全随机的权重中创建出相当有趣的图像，所以这个思想就是首先训练一个能产生合格的28x28 MNIST图像这样的网络，然后在同一个网络上产生一个能够满足我们的两个目标的分辨率更大的图像...一开始，一批训练图像将通过一个分类器网络，这个网络将学习识别每个MNIST图像的真实数字标签（这是学习使用神经网络进行分类的基本课程）。...如果之前描述的用于将图像分类为正确数字标签的卷积网络分类器也正在学习从图像中提取更高阶的概念和特征，那么使用这个卷积网络而不是像素重构损失来告诉我们的图像有多好应该也很有趣。...我决定初始化每个子块内relu层的权重，使其比通常的要大得多（即标准差为1.0），这样这些块将分别产生更多有趣的子图像。然而，残差网络每个块最后的tanh层，权重将被初始化为非常接近零。...但是这样做是以图像看起来有趣的程度为代价来提高的分辨率。

83510 0

你真的了解深度学习生成对抗网络（GAN）吗？

生成器的损失将取决于它在用假图像“愚弄”判别器的能力，即判别器仅对假图像的分类错误，因为生成器希望该值越高越好。因此，GANs建立了一种反馈回路，其中生成器帮助训练判别器，而判别器又帮助训练生成器。...从这个向量，我们的生成器将输出一个长度为784的向量，稍后我们可以将其重塑为标准MNIST的28x28像素。为了建立训练过程，我们将需要做以下工作： 1 . 损失函数 2 ....这些预测的损失将通过生成器反向传播，这样生成器的权重将根据它欺骗判别器的程度进行具体更新（5a）生成一些假图像进行预测（5b）使用判别器对假图像进行分批次预测并保存输出。...（6）使用判别器的预测训练生成器。注意，我们使用全为1的 _real_labels_ 作为目标，因为我们的生成器的目标是创建看起来真实的图像并且预测为1！...因此，生成器的损失为0将意味着判别器预测全为1. 瞧，这就是我们训练GAN生成MNIST图像的全部代码！只需要安装PyTorch即可运行。下面的gif就是经过超过40个训练周期生成的图像。

5662 0

你真的了解深度学习生成对抗网络（GAN）吗？

生成器的损失将取决于它在用假图像“愚弄”判别器的能力，即判别器仅对假图像的分类错误，因为生成器希望该值越高越好。因此，GANs建立了一种反馈回路，其中生成器帮助训练判别器，而判别器又帮助训练生成器。...从这个向量，我们的生成器将输出一个长度为784的向量，稍后我们可以将其重塑为标准MNIST的28x28像素。 ? 为了建立训练过程，我们将需要做以下工作： 1 . 损失函数 2 ....这些预测的损失将通过生成器反向传播，这样生成器的权重将根据它欺骗判别器的程度进行具体更新（5a）生成一些假图像进行预测（5b）使用判别器对假图像进行分批次预测并保存输出。...（6）使用判别器的预测训练生成器。注意，我们使用全为1的 _real_labels_ 作为目标，因为我们的生成器的目标是创建看起来真实的图像并且预测为1！...因此，生成器的损失为0将意味着判别器预测全为1. 瞧，这就是我们训练GAN生成MNIST图像的全部代码！只需要安装PyTorch即可运行。下面的gif就是经过超过40个训练周期生成的图像。 ? ?

8212 0

基于CPPN与GAN＋VAE生成高分辨率图像

来源：otoro 编译：weakish 在之前的文章中，hardmaru讨论了一种生成算法，可以在诸如MNIST或CIFAR-10这样的低分辨率图像上训练，以任意高的分辨率生成数字图像。...但不像以前的模型，这次我们将利用MNIST数字的分类标签。一开始，一个batch的训练图像将通过一个分类网络，这个网络将学习识别每个MNIST图像的实际数字标签（这是使用神经网络进行分类的第一课）。...这就是为什么我在之前的模型中添加了一个VAE组件来迫使它通过VAE训练过程生成所有数字。但是，这不是迫使网络生成多样化图像的唯一方法。...由于tanh(0)为0，因此最初，残差网络的每个块将像恒等（identity）函数一样直接通过。...我们可以看到，它在试图生成所有10个数字时的困难和挣扎：我还进行了超过6 epoch的训练，我发现经过24 epoch训练之后，网络能产生更好的MNIST数字，但是这样做的代价是膨胀到高分辨率后图像看起来不那么有趣了

7728 0

你真的了解深度学习生成对抗网络（GAN）吗？

生成器的损失将取决于它在用假图像“愚弄”判别器的能力，即判别器仅对假图像的分类错误，因为生成器希望该值越高越好。因此，GANs建立了一种反馈回路，其中生成器帮助训练判别器，而判别器又帮助训练生成器。...从这个向量，我们的生成器将输出一个长度为784的向量，稍后我们可以将其重塑为标准MNIST的28x28像素。 ? 为了建立训练过程，我们将需要做以下工作： 1 . 损失函数 2 ....这些预测的损失将通过生成器反向传播，这样生成器的权重将根据它欺骗判别器的程度进行具体更新（5a）生成一些假图像进行预测（5b）使用判别器对假图像进行分批次预测并保存输出。...（6）使用判别器的预测训练生成器。注意，我们使用全为1的 _real_labels_ 作为目标，因为我们的生成器的目标是创建看起来真实的图像并且预测为1！...因此，生成器的损失为0将意味着判别器预测全为1. 瞧，这就是我们训练GAN生成MNIST图像的全部代码！只需要安装PyTorch即可运行。下面的gif就是经过超过40个训练周期生成的图像。 ? ?

1.1K3 0

keras教程：卷积神经网络（CNNs）终极入门指南

每个图像的大小都是28*28，这里列举几张灰度图：在本教程中，我们的训练样本，就来自于MNIST数据集，它是初学者入门图像识别时，最好用、最便捷的数据集。...第二步：从MNIST加载图像数据通过print，我们能够看到数据集的形态： X_train是一个含有60,000个训练样本的数据集，并且，每一个样本图像的尺寸都是28*28，例如，...接下来，我们再来看看y_train: y_train是60,000个训练样本的标签，例如，第1个训练样本的标签为“5”：好吧，原来上面那张歪歪扭扭的数字，不是3…… 使用同样的方法...对于彩色图片，图像的深度为3，即有“红R，绿G，蓝B”3个通道；对于像MNIST这样的灰度图片，其图像深度仅为1：（点击图片，查看大图）所以，我们数据集的形态，应该从 (样本数量...我们在这里使用了“2次 - 1次 - 2次”的结构。好啦，废话不多说，直接上代码。先搭一个“书架”：再往“model”中，添加各层。

1.3K6 1

【tensorflow】浅谈什么是张量tensor

你会问为什么不干脆叫它们一个数字呢？我不知道，也许数学家只是喜欢听起来酷？标量听起来确实比数字酷。实际上，你可以使用一个数字的张量，我们称为0维张量，也就是一个只有0维的张量。...我们为什么想把数据转换为Numpy数组？很简单。因为我们需要把所有的输入数据，如字符串文本，图像，股票价格，或者视频，转变为一个统一得标准，以便能够容易的处理。..., test_labels) = mnist.load_data() 这个数据集被分成两个部分：训练集和测试集。...于是我们可以认为，MNIST数据集的4D张量是这样的： (60000,28,28,1) 彩色图片彩色图片有不同的颜色深度，这取决于它们的色彩（注：跟分辨率没有关系）编码。...一张典型的JPG图片使用RGB编码，于是它的颜色深度为3，分别代表红、绿、蓝。

7341 0

人工智能是摄影的未来还是摄影技术的末日？

每当我们听到「人工智能」、「机器学习」或者「机器人」这样的词汇时，大多数人都会很容易联想到一个像科幻电影中那种能够行走、说话的机器人，然后不由自主地想象遥远的未来。 ?...因为蒙特卡洛方法在高维空间中不能很好地工作，这样的生成模型不能执行像使用 ImageNet 进行训练这样的现实任务。 GAN 不需要引入任何决定性偏置（deterministic bias）。...某些像变分自编码器这样的生成方法引入了决定性偏置，因为它们优化了对数似然的下界，而不是似然本身。这似乎导致变分自编码器生成的实例比 GAN 生成的实例更模糊。 ?...绘画和概念设计从未变得像现在这么简单。但是，虽然 GAN 可以根据下面这个手提包的草图完成像这样的简单绘画，但是画更复杂的东西（比如完美的人脸）目前还不是GAN 的强项。...CycleGAN 使用了两个生成器和两个判别器。我们将一个生成器称为 G，让它把图像从 X 域转换到 Y 域。将另一个生成器称为 F，它将图像从 Y 域转换到 x 域。

5113 0

TensorFlow 基础学习 - 2

数据导入首先通过tf.keras的API可以直接获得Fashion MNIST数据集。在mnist对象上调用load_data方法会得到两个元组，各自包含两个列表。...这些列表存储了服装用品的训练与测试图像数据及标签值。 为什么会有2组数据？我们可能在想为什么有2组数据-训练集和测试集。记得在介绍中说过的吗？...这个过程叫做 "归一化"......幸运的是，在Python中，很容易对这样的列表进行归一化，而不需要循环。可以这样做：其实就是把矩阵里面的每一个数都除以255即可。...一开始学习神经元网络总是使用序列模型。 Flatten : 还记得上面将图像打印出来的时候是一个正方形吗？扁平化只是把这个正方形变成了一个一维的集合。把二维数组变成一维数组。...这就是为什么我们需要测试图像的原因。我们可以调用model.evaluation，并将用于测试的图像和标签数据传入，它会报告测试数据的损失。让我们试一试。 AMA 数据没有做归一化处理？

4191 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭