mini-batch - 腾讯云开发者社区

、、、、

我正在测试Aurélienéron的书“用Scikit- Learning和TensorFlow进行机器学习”第15章中的预培训示例。代码出现在他的github页面上：这里 --参见“无监督预培训”一节中的示例。使用来自先前训练过的编码器的权重对网络进行预训练应该有助于训练网络。为了检查这一点，我稍微修改了Aurelien的代码，以便它在每次批处理后输出错误，并减少批处理的大小。我这样做是为了在训练开始时看到错误，而训练前的重量的影响应该是最明显的。我预计预培训网络将以较低的错误开始(与不使用预培训的网络相比)，因为它是从预先训练的权重开始的。然而，训练前的训练似乎会使训练变慢。有人知道为

浏览 0提问于2018-05-02得票数 1

回答已采纳

2回答

我得到了一个ValueError:所有边界框都应该有正的高度和宽度

、

嘿，我得到了错误 ValueError: All bounding boxes should have positive height and width. Found invaid box [264.0, 632.0, 264.0, 633.3333740234375] for target at index 2. Epoch 1/1 Mini-batch: 1/1220 Loss: 0.1509 Mini-batch: 101/1220 Loss: 0.1201 Mini-batch: 201/1220 Loss: 0.1103 Mini-batch: 301/1220 Loss: 0.

浏览 191提问于2020-08-25得票数 2

1回答

如何通过并行运行CPU和GPU来更快地训练神经网络

、、、、

我正在尝试使用GPU训练一个(相当大的)神经网络。网络是用pytorch编写的。我使用的是运行在ubuntu 16.04上的python 3.6.3。目前，代码正在运行，但它花费的时间大约是正常运行时间的两倍，因为我使用CPU的数据获取过程与使用GPU的训练过程是串联运行的。本质上，我使用mini-batch生成器从文件中获取一个mini-batch，将该mini-batch发送到GPU，然后在该mini-batch上训练网络。我对这两个过程进行了计时(抓取一个小批次并在那个小批次上进行训练)，它们在时间上是相似的(都需要大约200ms)。我想做一些类似于keras的fit_generator

浏览 12提问于2017-12-11得票数 0

1回答

球拍结构错误:给定值实例化同名的不同结构类型。

、、、

我对Racket相当熟悉，很多人都是Scheme和Lisp家族的成员，但我不知道这个错误是怎么回事，也不知道是什么原因造成的： network-biases: contract violation; given value instantiates a different structure type with the same name expected: network? given: (network ...) <-- I omitted this because its useless. 下面是错误所在的函数(我有一个其余的 )： (define (update-min

浏览 3提问于2015-09-25得票数 1

回答已采纳

1回答

当不使用dest时，argparse如何确定参数名称？

、

关于下面示例中使用的batch_size参数，我有一个问题。 https://github.com/pytorch/examples/blob/master/imagenet/main.py#L150 parser.add_argument('-b', '--batch-size', default=256, type=int, metavar='N', # dest='batch_size' why this is not needed?

浏览 1提问于2019-02-22得票数 2

1回答

在训练阶段我在tensorflow中使用batch =5，为什么我不能在tensorflowjs中只使用batch =1测试？

、

我使用batchsize=5在tensorflow中训练GAN模型，因此生成器的输入大小为5，图像大小，图像大小，3。训练后，我将tensorflow模型转换为tensorflowjs模型。因此，我使用loadFrozenModel.Then model.predict来加载模型来预测image.However，model.execute(dict)中提供的dict‘’concat‘的形状必须是5,512,512,12，而不是1,512,512,12。如何解决这个问题?我在tensorflow中的训练阶段使用mini-batch，在tensorflow中只预测一个输入的图像，而不是tens

浏览 17提问于2019-03-06得票数 0

回答已采纳

1回答

如何在pytorch中批量填充

、、

在训练过程中，我需要用其他图像补丁填充图像。既然我正在使用mini-batch进行训练，有什么有效的方法可以做到这一点吗？例如，我有一小批大小为[B, 3, 128, 128]的图像。我还有大小为[B, 4, 3, 32, 32]的补丁，其中4是补丁的数量。此外，我有一个边界框来指示[B, 4, 4]大小的补丁的位置。如何批量填写补丁？可以忽略面片之间的重叠。

浏览 23提问于2019-10-05得票数 0

1回答

计算负ELBO

、、、、

我正在学习关于深度马尔可夫模型的教程，在那里他们试图学习复调数据集。“链接到教程”是：该模型利用神经网络将跃迁和排放参数化，对于变分推理部分，利用RNN将可观测的x映射到潜在空间。为了确保他们的模型正在学习一些东西，他们试图使ELBO最大化或最小化负ELBO。他们称否定的ELBO为NLL。到目前为止，我知道他们在做什么。然而，下一步使我感到困惑。一旦他们得到他们的NLL，他们除以它的序列长度之和。 times = [time.time()] for epoch in range(args.num_epochs): # accumulator for our estimate of

浏览 7提问于2020-06-08得票数 0

回答已采纳

1回答

H2O起泡水. DNN mini_batch_size参数

、、、、

我目前正在使用Spark 2.3.0运行sparkling-water 2.3.1。我通过查看链接到H2O的找到底层库的文档。所以很明显它使用了H2O 3.18。通过查看DNN，我注意到缺少一个batch_size参数，但是它提供了一个实际上没有文档化的mini_batch_size参数。我找到的关于这个参数的唯一文档是，它引用了H2O 2.4，并且我假设它仍然适用于我正在使用的版本(我不知道这个假设是否正确)。小批量每次迭代要处理的训练数据行数。请注意，与此参数无关，每一行都会立即使用(在线)随机梯度下降更新模型。小批量大小控制分布式环境中节点之间的同步周期，以及评分和模型取消发生的

浏览 2提问于2018-09-27得票数 1

回答已采纳

1回答

用pytorch的Cnn模型

、、、、

我有照片和标签。我把它们分成测试组和训练组。(火车，测试)。X代表图像，y代表标签。如何在以下列车模型中使用这些集合 **# Train the model total_step = len(train_loader) for epoch in range(num_epochs): for i, (images, labels) in enumerate(train_loader): images = images.to(device) labels = labels.to(device) # Forward pass outputs =

浏览 3提问于2020-07-10得票数 0

回答已采纳

1回答

SGD迷你批次-大小相同？

、、

带有小批的随机梯度下降算法通常以小批的大小或计数作为参数。现在我想知道的是，所有的迷你批次都需要完全相同的大小吗？例如，来自MNIST的培训数据(60k培训图像)和一个小批量大小为70。如果我们是在一个简单的循环中，就会产生857 mini-batches of size 70 (as specified) and one mini-batch of size 10.。现在，(使用这种方法)一个迷你批将比其他小批更小(最坏的情况是这里的小批数为1)，这是否重要？这会不会强烈影响我们的网络在几乎所有的培训过程中学习到的权重和偏见？

浏览 3提问于2016-06-06得票数 1

回答已采纳

1回答

如何实现基于动量的随机梯度下降(SGD)

、

我使用python代码network3.py ()来开发卷积神经网络。现在我想稍微修改一下代码，添加一个动量学习规则，如下所示： velocity = momentum_constant * velocity - learning_rate * gradient params = params + velocity 有没有人知道怎么做？特别是，如何设置或初始化速度？我把SGD的代码贴在下面： def __init__(self, layers, mini_batch_size): """Takes a list of `layers`, describing t

浏览 7提问于2016-10-04得票数 4

1回答

如何计算选定子样本预测的训练损失

、、、、

我正在训练一个深入学习的视频序列多目标跟踪模型。视频帧在1fps上被提取和注释。为了利用平滑的时间一致性，我在每个2注释的帧之间提取了中间的24个帧。现在，我在25fps中提取了所有的框架，但是只有在最初注释的25帧的间隔内才能获得基本的真实标签。我想通过在前传期间提供所有光滑的25fps帧来训练一个深度学习模型，但是在后台，我只想计算和优化带注释的1fps帧的损失。对我该怎么做有什么建议吗？尤其是当我的mini-batch size小于25时。

浏览 0提问于2019-02-05得票数 0

回答已采纳

1回答

在pytorch https://www.d2l.ai/chapter_linear-networks/linear-regression-scratch.html中复制

、、

我正在尝试用pytorch复制代码。然而，我在自动评分功能上遇到了一些问题。我遇到了以下运行时错误。 RuntimeError:尝试第二次向后遍历图形代码如下： for epoch in range(num_epochs): # Assuming the number of examples can be divided by the batch size, all # the examples in the training data set are used once in one epoch # iteration. The features and tags

浏览 19提问于2019-10-02得票数 0

1回答

无法将TensorVariable类型的切片条目强制转换为整数

、

我遵循了其中一本关于深度学习的书上的代码，作者使用theano作为这种网络的库。当我尝试运行代码时： i = T.lscalar() # mini-batch index train_mb = theano.function( [i], cost, updates=updates, givens={ self.x: training_x[i*self.mini_batch_size: (i+1)*self.mini_batch_size], self.y: t

浏览 1提问于2016-08-15得票数 0

1回答

什么时候应该在LSTM代码中初始化状态？

、、、、

这是UDACITY中用于情感分类的LSTM代码。下面是整个句子的链接-rnn代码：我想知道为什么他们会在for循环的正下方初始化cell状态。我认为当输入语句改变时，单元状态必须是零初始化，所以它必须在mini-batch for loop语句下。 ## part of the sentence-rnn code # Getting an initial state of all zeros initial_state = cell.zero_state(batch_size, tf.float32) with tf.Session(graph=graph) as sess:

浏览 1提问于2017-08-04得票数 3

2回答

Matlab深度学习回归

、、、

我正在尝试用Matlab构建我自己的回归网络。虽然到目前为止我得到的东西看起来有点无意义，但我确实想稍后将其扩展到一个稍微不寻常的网络中，所以我正在自己做，而不是从货架上拿到一些东西。我写了以下代码： % splitinto dev, val and test sets [train_idxs,val_idxs,test_idxs] = dividerand(size(X,2)); training_X = X( : , train_idxs ); training_Y = Y( : , train_idxs ); val_X = X( : , val_idxs ); val_Y =

浏览 45提问于2019-03-22得票数 2

1回答

django:定期读取更新文件，并以表格形式显示数据

、、

我是python的新手，也是芹菜，我今天才开始使用，我正在尝试定期读取更新文件我已经使用了这些：，和，但他们甚至没有读取文件，更不用说定期读取文件了！我的观点是： def myView(request): title = 'Algorithms' if request.method == 'GET': template = 'algoInput.html' form = AlgoInputForm() context = {'title': title, 'form': form} if

浏览 1提问于2017-09-24得票数 0

1回答

用标量相乘的特征图

我有一个二值分类问题，在数据集中有图像和变量，我有一个比较图像和变量的想法。每次通过conv层时，我都希望将权重标量乘以所有特征映射，其中权重标量是从fc层计算出来的。例如，假设批处理大小为8，存在两个张量x1和x2，其中x1的大小为(8,3,224,224)，x2的大小为(8,16)。 import torch from torch.nn import Module, Sequential from torch.nn import Conv2d, BatchNorm2d, ReLU, MaxPool2d, Softmax, Linear import numpy batch_size

浏览 0提问于2020-01-22得票数 0

1回答

OOM在分配张量时如何获得更多的GPU内存

、、、、

运行在木星实验室环境下训练我的CNN在坦索弗洛： history = model.fit( train_generator, steps_per_epoch=3, epochs=5, verbose = 1, 当我运行我的算法时，我得到一个'OOM when allocating tensor with shape'。据我所知，这意味着我没有耗尽足够的GPU内存。如何与木星上的服务器连接以访问更多内存以运行我的训练NN？我使用以下包和代码加载映像： from tensorflow.keras.preproce

浏览 3提问于2020-10-25得票数 1

回答已采纳

1回答

如何获得MLPRegressor每一次迭代的训练和测试分数？

、、

这个答案似乎正是我所需要的，但对于一个回归者，而不是一个分类器。我对sascha从链接中提供的代码进行了非常小的修改，如下所示。我觉得用在我的MLPRegressior上会很简单.但是，我收到了一条错误消息，我不知道如何修复任何帮助，我们将非常感激： import numpy as np import matplotlib.pyplot as plt from sklearn.neural_network import MLPRegressor estimator_reg = MLPRegressor( solver='adam', activation=

浏览 1提问于2018-08-26得票数 0

回答已采纳

1回答

在tableau中获取prep_int()未定义的错误

、、

我在Python中使用Tableau，但是当我执行Python时，在输出流中会出现"prep_int()函数未定义“的错误。prep_int()在Python中用于get_output_schema函数。 Python代码： import pandas as pd import requests import json df = pd.read_csv("E:/dummy.csv") port = "8080" target_columns = ["id"] # target_columns = df['id'] so

浏览 3提问于2020-11-19得票数 2

1回答

Pytorch:如何为平均池掩盖灵活的输入大小？

、、、、

背景：我想将卷积和平均池应用到序列分类任务中。 Problem：没有掩码输入，小批量和逐个计算将是不同的.例如： # Two sequences. s1 = torch.range(start=1, end=6).view(-1, 1) s2 = torch.range(start=1, end=3).view(-1, 1) ########################################## # one-by-one # Convolutions. kernels = torch.ones(1, 1, 2) h1 = F.conv1d(s1.view(1, 1, -1),

浏览 3提问于2019-07-01得票数 2

1回答

ResNet-101 FeatureMap形状

、、、

我对CNN非常陌生，在学习上遇到了很多困难。我试着用ResNet-101提取CNN的特征图，我希望得到一个2048，14*14的形状。为了得到一个特征图，我删除了ResNet-101模型的最后一层，并调整了自适应平均池。所以我得到了输出的torch.Size([1, 2048, 1, 1])形状。但我想要的是torch.Size([1, 2048, 14, 14])而不是torch.Size([1, 2048, 1, 1])。有人能帮我得到结果吗？谢谢。 #load resnet101 model and remove the last layer model = torch.hub.l

浏览 3提问于2020-04-20得票数 2

回答已采纳

1回答

访问tensorflow中的占位符元素

、

我有一个带有MSE损失函数的神经网络，其实现方式如下： # input x_ph is of size Nx1 and output should also be of size Nx1 def train_neural_network_batch(x_ph, predict=False): prediction = neural_network_model(x_ph) # MSE loss function cost = tf.reduce_mean(tf.square(prediction - y_ph)) optimizer = tf.train.Ad

浏览 0提问于2019-02-16得票数 0

2回答

Flux.jl :自定义优化器

、、、、

我正在尝试实现一个无梯度优化器函数来使用Flux.jl训练卷积神经网络。参考文件是：。本文提出了一种无梯度优化算法RSO，在抽样基础上一次更新单权值。该算法的伪码如下图所示。我在使用MNIST数据集。 function train(; kws...) args = Args(; kws...) # collect options in a stuct for convinience if CUDA.functional() && args.use_cuda @info "Training on CUDA GPU" CUDA.allwosca

浏览 10提问于2022-01-09得票数 3

回答已采纳

1回答

用torch7模型测试单个图像

、、

我根据链接训练我的模型。当我训练它时，它几乎达到了90%的精度。我正在使用vgg_bn_drop.lua模型，您可以在链接中找到该模型。但问题是，我不知道如何测试它的单个图像。我知道怎么测试模型。通过前向通过网络传递图像。因此，测试该模型将需要modelname:forward(image)。其中，modelname是我训练过的模型的名称，forward用于转发模型，而' image‘是我想要转发的图像位置。现在，我无法从这个网络中计算出单个图像的维数。所以，我想做的是，拍一张照片。假设图像的维数为3x32x32。通过网络传递并得到结果。这个网络有可能吗？没有关于如何测试单个图

浏览 4提问于2016-03-30得票数 4

回答已采纳

1回答

如何禁用教师强制RNN模型

、

下面是强制RNN模型的教师，其中我隐式地将整个输入序列(input=id：，i:i+seq_length )同时传递给模型。我应该修改什么，以禁用教师强制培训，并得到原来的模式。 ids = corpus.get_data('data/train.txt', batch_size) model = RNNLM(vocab_size, embed_size, hidden_size, num_layers).to(device) # Loss and optimizer criterion = nn.CrossEntropyLoss() optimizer = torch.

浏览 17提问于2022-12-04得票数 0

1回答

用于创建小批量的切片

、、、、

我打算为我的深度学习神经网络程序创建迷你批次，从一个由'm‘个示例组成的训练集。我试过了： # First Shuffle (X, Y) permutation = list(np.random.permutation(m)) shuffled_X = X[:, permutation] shuffled_Y = Y[:, permutation].reshape((1,m)) # Partition (shuffled_X, shuffled_Y). Minus the end case where mini-batch will contain lesser number of

浏览 15提问于2020-07-02得票数 1

回答已采纳

1回答

参数#2 'mat1‘的张量在CPU上，但期望它在GPU上。

、、、、

按照我以前的，我编写了这个代码来训练一个自动编码器，然后提取这些特性。(变量名可能有一些更改) # Autoencoder class #https://medium.com/pytorch/implementing-an-autoencoder-in-pytorch-19baa22647d1 class AE_class(nn.Module): def __init__(self, **kwargs): super().__init__() self.encoder_hidden_layer = nn.Linear( in_fe

浏览 2提问于2021-03-05得票数 6

回答已采纳

1回答

基于数值的生物序列聚类

、、

我试图根据Atchley因子(5个数字，代表每个氨基酸)将几个固定长度的氨基酸序列(13)聚类到K个簇中。例如，我有一个字符串的输入向量，如下所示： key <- HDMD::AAMetric.Atchley sequences <- sapply(1:10000, function(x) paste(sapply(1:13, function (X) sample(rownames(key), 1)), collapse = "")) 但是，我的实际序列列表超过了10^5 (指定需要计算效率)。然后，我通过以下代码将这些序列转换为数值向量： key

浏览 23提问于2018-02-23得票数 1

回答已采纳

1回答

Python中的深度学习--随机梯度下降--分解代码

、、、

我试着用我的大学和提供的几本书来学习深度学习。这个过程很困难，而且由于我也不习惯编写代码，所以有些问题出现了。例如从下面的函数中，wich在提供的链接的第1章中(我将代码从2.7更新到3.6)。 def SGD(self, training_data, epochs, mini_batch_size, eta, test_data=None): """Train the neural network using mini-batch stochastic gradient descent. The ``training_data``

浏览 1提问于2018-03-28得票数 2

回答已采纳

1回答

Python错误:需要以下参数：

、、、

我不熟悉Python，试图构建一些DNN。所以，当我试图解析一些参数时，我在main中得到了这个错误。 usage: main.py [-h] [-j N] [--resume PATH] [--epochs N] [--start-epoch N] [-b N] [--lr LR] [--weight-decay W] [-e] [--print-freq N] DIR main.py: error: the following arguments are required: DIR 下面是代码的某些部分： # Parse argu

浏览 17提问于2022-11-28得票数 -1

1回答

如何在gnu图中只绘制条形图中的最大值？

我有一幅图，其中显示了平均值和标准差。问题是，在某些行上有一个很高的+/-误差，我只想显示标准差的最大值。这样情节就会更清楚了。现在我使用的是linespoints和yerrorbars，图如下所示：如你所见，橙色和绿色的线条变化很大。我只想显示他们的最大值，这样情节就变得更加清晰了。我正在使用的脚本如下： plot \ t=0 "throughput-vs-networkbuffer-500K-8reducers-all.csv" every 30 u (t==0?(t0=timecolumn(1,myTimeFmt),t=1):NaN, tim

浏览 1提问于2020-12-08得票数 1

回答已采纳

1回答

如何使用Torch7进行预测

、

我还在熟悉火炬，到目前为止还不错。但是，我遇到了一个死胡同，我不知道该如何解决:如何才能获得Torch7 (更具体地说，是dp库)来评估单个输入并返回预测的输出？下面是我的设置(基本上是dp演示)： require 'dp' --[[hyperparameters]]-- opt = { nHidden = 100, --number of hidden units learningRate = 0.1, --training learning rate momentum = 0.9, --momentum factor to use for tr

浏览 4提问于2015-04-01得票数 3

回答已采纳

2回答

tensorflow 1.0 mnist代码错误

、

我现在正在学习tensorflow 1.0和python 3.5.2。我尝试了在github上找到的以下代码，但我得到了名为'tensorflowvisu‘的错误No module。如果我删除导入tensorflowvisu，我得到错误i= tensorflowvisu.tf_format_mnist_images(X，Ypred，Y_) #汇编10x10图像默认NameError:名称'tensorflowvisu‘没有定义，我应该怎么做才能让这段代码工作？有没有人有可以使用tensorflow 1.0和python 3.5的mnist的工作代码，我可以跟着学习？感谢您的回复

浏览 5提问于2017-03-10得票数 5

回答已采纳

1回答

深井模型和深水模型给出了非常不同的对数损失(0.4比0.6)

在AWS中，我遵循了中的指令，并使用社区ami-97591381 (h2o版本: 3.13.0.356)启动了一个g2.2xlarge EC2。这是我的代码，当我将S3链接公开时，可以运行这些代码： library(h2o) library(jsonlite) library(curl) localH2O = h2o.init() df.truth <- h2o.importFile("https://s3.amazonaws.com/nw.data.test.us.east/df.truth.zeroed", header = T, sep=","

浏览 2提问于2018-01-16得票数 1

2回答

CNTK二进制分类器

、

浏览 4提问于2017-08-10得票数 1

1回答

如何在训练循环(以及优化器/调度器交互)中使用Pytorch OneCycleLR？

我正在训练一个NN，并使用RMSprop作为优化器，使用OneCycleLR作为调度器。我一直像这样运行它(在稍微简化的代码中)： optimizer = torch.optim.RMSprop(model.parameters(), lr=0.00001, alpha=0.99, eps=1e-08, weight_decay=0.0001, momentum=0.0001, centered=False) scheduler = torch.optim.lr_scheduler.OneCycleLR(optimizer, max

浏览 5提问于2020-01-31得票数 5

1回答

使用TensorFlow Keras训练DNN。为什么在使用Dropout时精度封口关闭

、、、

我正在使用TensorFlow Keras来构建和拟合深度神经网络。我读过的文献鼓励我使用Dropout layers。但是当我添加了值为0.5的dropout层时，我的梯度下降级数看起来很奇怪。具体地说，训练精度和验证精度似乎被限制在某个硬限制上。这是什么效果？为什么会发生这种情况？如有任何意见或反馈，将不胜感激。 _________________________________________________________________ Layer (type) Output Shape Param # ======

浏览 17提问于2019-01-07得票数 1

1回答

如何在MLPClassifier中使用sklean绘制训练和测试数据的准确性和损失曲线？

、

我正在使用这个非常简单的代码来训练MLPClassifier。 x_train, x_test, y_train, y_test = load_data(test_size=0.25) model = MLPClassifier(alpha=0.01, batch_size=128, epsilon=1e-08, hidden_layer_sizes=(300,), learning_rate='adaptive', max_iter=500,early_stopping=True) model.fit(x_train, y_trai

浏览 208提问于2021-05-31得票数 0

回答已采纳

1回答

ValueError:可变密度/内核/Adam/不存在？

、

我试图建立一个非常简单的神经网络模型来完成分类任务。我试着用客户化的方式来建立模型。我想使用tf.Data.Dataset加载我的数据集。然后用mini-batch方法对模型进行训练。同时，我希望在验证数据集上打印模型结果。所以我试着重用变量。我的模型如下： def get_loss(prediction, label): return tf.losses.softmax_cross_entropy(tf.expand_dims(label, -1), prediction) def make_train_op(optimizer, loss): apply_gradien

浏览 1提问于2019-05-15得票数 2

回答已采纳

1回答

操作数不能一起广播

、、、、

我正试着用小批量训练一个模型，但我有一个....错误。我使用的函数与我在其他模型中已经使用过的函数相同，但这一次崩溃了。 def random_mini_batches(X, Y, mini_batch_size = 64): """ Creates a list of random minibatches from (X, Y) Arguments: X -- input data, of shape (input size, number of examples) Y -- true "label" vector (1, number of ex

浏览 3提问于2018-11-17得票数 0

1回答

Logistic回归中小批量梯度下降的错误预测？

、、、

我正在尝试实现逻辑回归的小批量梯度下降。然而，当我尝试使用标签{-1，1}在我的数据集上测试它时，似乎我的预测几乎总是1或-1，这使得我的测试分数在50%左右(因为真正的标签大约是。-1和1之间的50/50 )当目标高于95%时。有人能帮我找出下面代码中的错误吗？ def logistic(z): """ Helper function Computes the logistic function 1/(1+e^{-x}) to each entry in input vector z. Args: z:

浏览 13提问于2020-10-08得票数 0

1回答

MNIST数据处理- PyTorch

、、

我试图为MNIST数据集编写一个变分自动编码器，数据预处理如下： # Create transformations to be applied to dataset- transforms = torchvision.transforms.Compose( [ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize( (0.1307,), (0.3081,) # (0.5,), (0.5,) ) ] ) # Crea

浏览 6提问于2022-01-31得票数 0

1回答

如何从网格搜索结果中确定历元超参数

、、、、

我已经运行了一个网格搜索，以历元作为超参数之一。现在，在选择了最好的模型之后，我如何确定为这个特定模型选择了哪个时代？下面是模型模型详细信息的总结：============== H2OBinomialModel: deeplearning Model ID: dl_grid_model_19 Status of Neuron Layers: predicting Churn, 2-class classification, bernoulli distribution, CrossEntropy loss, 4,226 weights/biases, 44.1 KB, 47,520 tr

浏览 0提问于2016-11-29得票数 1

回答已采纳

1回答

一个足以让自动编码器具有与输入相同的输出的隐藏层

、、

我正在做一些基于Theano的自动编码器的工作，输入来自高斯混合的样本，一个隐藏层。我希望输出与输入相同，但我没有实现它。我从教程中得到了实现的灵感。只有一个隐藏层的自动编码器是否也足以恢复输出的精确副本？我的代码如下所示： ` def train(self, n_epochs=100, mini_batch_size=1, learning_rate=0.01): index = T.lscalar() x=T.matrix('x') params = [self.W, self.b1, self.b2] hidden = self.acti

浏览 0提问于2016-11-22得票数 0

1回答

利用训练后的ConvNet参数预测图像类别

、、、、

我试图使用卷积神经网络对图像进行分类。我已经了解了这个关于深度学习的，并通过许多修改实现了给定的。我增加了更多的卷积和最大池层，并修改了接受166x166输入的输入。为了保存训练后的参数，我们在函数cPickle.dump()中使用了ConvPool()，该函数分别为每个层(ConvPool、FullyConnected和Softmax)定义。在完成所有层的sgd()方法的培训之后，将调用此函数。在另一个程序中，softmax、完全连接层和卷积层的参数是从另一个程序中的.p泡沫化文件中加载回来的，这是相同的，只是我们没有调用SGD方法。问题是，我要打印软最大层的y_out (y_out用于计算

浏览 5提问于2016-03-01得票数 3

回答已采纳

3回答

基于TensorFlow的端部语音识别神经网络

、、、、

我还没有成功地用TensorFlow训练语言到文本问题的神经网络。我决定使用纯快速傅立叶变换(即谱图)作为训练数据，再现描述的方法的结果，并对3层双向神经网络进行编码，每层有300个LSTM单元。我想描述一下从预处理音频信号到解码逻辑所遵循的步骤。预处理：利用的谱图函数将每个时域音频信号分割成20 fs的帧，FFT = (fs/1000 *20采样)长度，并进行加窗加FFT，重叠7ms。我最初尝试用ps |fft|^2计算功率谱，而dB通过10 * log10(ps)计算，但是TensorFlow CTC损失函数产生nan值，而且优化器显然会将所有params更新为nan，因此我

浏览 6提问于2016-07-14得票数 5

1回答

火炬MNIST:如何将错误的参数#2修正为'v‘(期望的3D或4D输入张量，但得到：[199 x 784]

、

我试图在这里修改基本教程模型( )，并在火炬上建立一个更深层次的模型。下面是我的代码(当我在上面的url中尝试相同的模型时，代码起作用了)：负载数据 require 'torch' require 'nn' require 'optim' mnist = require 'mnist' fullset = mnist.traindataset() testset = mnist.testdataset() trainset = { size = 50000, data = fullset.data[{{1,500

浏览 4提问于2016-12-11得票数 0

回答已采纳