为什么我们在编译组合GAN (SRGAN)网络时使用两个损失 - 腾讯云开发者社区

loss-function、loss、generative-adversarial-network

我正在做SRGAN (超分辨率GAN)。我发现了一段代码，其中作者在编译判别器时使用了MSE loss。在编译组合GAN模型时，会产生两种损失，即二进制交叉熵和均方误差。我不明白这些损失函数的用法。下面是代码。用于编译判别器的代码如下： discriminator = build_discriminator() discriminator.compile(loss='mse', optimizer=common_optimizer, metrics=['accuracy'] 编译组合GAN模型的代码为： adversarial_model = Model([i

浏览 32提问于2020-07-12得票数 0

回答已采纳

1回答

GAN损耗函数的理想值是多少？

neural-network、loss、generative-adversarial-network、objective-function

GAN最初由IJ古德费罗提出，使用以下损失函数， D_loss = - log[D(X)] - log[1 - D(G(Z))] G_loss = - log[D(G(Z))] 因此，鉴别器试图最小化D_loss，生成器尝试最小化G_loss，其中X和Z分别是训练输入和噪声输入。D(.)和G(.)分别给出了判别器和生成神经网络的映射图。如原论文所述，当对GAN进行多步训练时，它达到既不能提高发生器也不能提高鉴别器的程度，D(Y)在任何地方都是0.5，Y是对鉴别器的一些输入。在这种情况下，当GAN得到足够的训练， D_loss = - log(0.5) - log(1 - 0.5) = 0.

浏览 0提问于2018-03-22得票数 7

回答已采纳

1回答

在GAN中，有必要编译生成器吗

python-3.x、tensorflow、keras、deep-learning、generative-adversarial-network

我一直在研究GAN，让我抓狂的是，为什么我们要编译生成器模型，即使我们编译了组合的GAN模型，为什么还要单独编译生成器。 def create_generator(): generator = Sequential() generator.add(Dense(256, input_dim=noise_dim)) generator.add(LeakyReLU(0.2)) generator.add(Dense(512)) generator.add(LeakyReLU(0.2)) generator.add(Dense(1024))

浏览 1提问于2020-06-10得票数 1

1回答

如何解释生成对抗网中鉴别器的损失和生成器的损失？

neural-network、deep-learning、generative-adversarial-network

我正在阅读人们对DCGAN的实现，特别是tensorflow中的。在该实现中，作者绘制了鉴别器和生成器的损失，如下所示(图片来自)：鉴别器和生成器的损失似乎都不遵循任何模式。与一般神经网络不同，一般神经网络的损失随着训练迭代的增加而减少。如何解释GAN训练时的损失？

浏览 4提问于2017-03-09得票数 23

回答已采纳

1回答

用于数据增强的GAN

deep-learning、data-mining、cnn、gan、data-augmentation

我正在使用生成的对抗性网络来增加我的数据，我已经使用了深层卷积GAN来实现这个目的，但是他们并没有学习正确的数据分布，所以请建议我使用哪一个GAN来实现这个目的？

浏览 0提问于2018-07-14得票数 0

2回答

在GANEstimator中使用对抗损失

python、tensorflow、computer-vision、deep-learning、keras

我现在试图结合L1像素丢失和对抗性损失来学习自动编码图像。代码如下。 gan_model = tfgan.gan_model( generator_fn=nets.autoencoder, discriminator_fn=nets.discriminator, real_data=images, generator_inputs=images) gan_loss = tfgan.gan_loss( gan_model, generator_loss_fn=tfgan.losses.wasserstein_generator_loss,

浏览 0提问于2018-04-17得票数 0

1回答

Keras中的GAN优化器设置

machine-learning、keras、optimization、gan、learning-rate

我正在研究一个生成性的对抗性网络，在Keras中实现。我有我的生成器模型G和鉴别器D，它们都是由两个函数创建的，然后使用这两个模型创建GAN模型，就像代码中的这个简单示例： gopt=Adam(lr=0.0001, beta_1=0.9, beta_2=0.999, epsilon=1e-08) dopt=Adam(lr=0.00005, beta_1=0.9, beta_2=0.999, epsilon=1e-08) opt_gan = Adam(lr=0.00006, beta_1=0.9, beta_2=0.999, epsilon=1e-08) G= gmodel(......) G

浏览 0提问于2019-04-12得票数 1

1回答

test_on_batch和train_on_batch的不同损失值

python、tensorflow、machine-learning、neural-network、keras

当我试图训练一个GAN进行图像生成时，我遇到了一个我无法解释的问题。在训练生成器时，train_on_batch在2或3次迭代后返回的损失直接降到零。在调查之后，我发现了train_on_batch方法的一些奇怪的行为：当我检查以下内容时： noise = np.random.uniform(-1.0, 1.0, size=[batch_size, gen_noise_length]) predictions = GAN.stackedModel.predict(noise) 这将返回接近于零的值，正如我所预期的，因为生成器还没有经过训练。然而： y = np.ones([batch_s

浏览 1提问于2018-02-26得票数 1

回答已采纳

1回答

在Keras中训练GANs时，是否需要多次传递才能优化生成器和鉴别器？

python、tensorflow、keras

与Keras相比，我更熟悉tensorflow图形培训，但我正在这里试用Keras。在构建GAN时，需要针对与鉴别器不同的损耗(相反的损耗)对发电机进行优化。在base中，使用两个优化器或分别使用适当的权重组调用optimizer.compute_gradients(...)和optimizer.apply_gradients(...)，这非常容易实现。在Keras中，我看不出我能实现这两个目标。在像这样的实现中，生成器和鉴别器的训练似乎被分割成不同的模型，然后逐批独立地进行训练。这意味着每一次有效更新都需要更多的传递，而不是使用两个优化器一次操作的基本tensorflow实现。有没有一

浏览 0提问于2019-07-09得票数 10

回答已采纳

1回答

区域翻译的条件GAN

python、keras、generative-adversarial-network

我正在训练一个GAN从两个不同的图像域(源S和目标T)执行风格转换。由于我有可用的类信息，所以我有一个额外的Q网络(除了G和D)，它测量为目标域及其标签( LeNet网络)生成的图像的分类结果，并将错误传播到生成器以及使用D。从系统收敛的角度，我注意到D总是从8开始( D网络的损失函数误差)，并略有下降到4.5，G损失函数误差从1开始迅速下降到0.2。D和G的损失函数均为，而Q网络的损失函数为绝对交叉熵。迭代中的错误图如下： D和G的损失函数为： def discriminator_loss(y_true,y_pred): BATCH_SIZE=10 retu

浏览 0提问于2018-09-16得票数 5

1回答

在卡通的VGG在哪里？

gan

当我读到Cartoongan 卡通络:用于照片卡通化的生成对抗性网络的报纸时，我对vgg在整个网络中的位置感到非常困惑。根据关于GAN 生成对抗性网的文章，我看不到网络中存在vgg的任何地方。我觉得我看不清卡通根的整个建筑。我知道GAN是如何用发电机和识别器构造的，但卡通根不是。如果有人能帮忙，我很感激。

浏览 0提问于2022-09-20得票数 1

回答已采纳

1回答

PyTorch中的最小化与最大化

pytorch

我想知道如何在PyTorch中对以下数学运算采取梯度步骤(A、B和C是参数为而不是重叠的PyTorch模块) 这与生成性对抗性网络(GAN)的成本功能有些不同，所以我不能使用现成的GANs的例子，而且我在尝试将它们调整到上面的成本时被困住了。我想到的一种方法是构造两个优化器。优化器opt1具有模块A和B的参数，优化器opt2具有模块C的参数。采取步骤，使C的成本函数最小化再次使用相同的输入运行网络，以获得成本(和中间输出)。在A和B方面迈出一步。我确信，它们肯定是使用PyTorch (可能使用一些detach操作)更好的方法，可能不会再次运行网络。任何帮

浏览 1提问于2018-06-12得票数 3

1回答

在GAN中减少损失意味着什么？

python、neural-network、pytorch、loss-function、generative-adversarial-network

我已经建立了一个GAN，并且我正在根据一次优化多个功能的概念手动训练它。根据我所用的公式，在最大限度地减少了鉴别器和发生器的损失的同时，虽然我成功地在很大程度上减少了发生器和鉴别器的损失(比原来的GAN训练值更好)，但是所生成的图像并不像原来的GAN训练那样好。原因是什么，或者我应该如何证实，尽管损失降低了，但图像并不好？我需要记住的是GAN的任何内在属性吗？

浏览 5提问于2022-09-28得票数 -1

1回答

历元的恒定精度

python、tensorflow、machine-learning、deep-learning、artificial-intelligence

我正在训练一个gan，我是，准确率不会随着时代的推移而改变，同时损失也很大。是有什么问题，还是因为它是一个gan而正常呢？提前谢谢你。

浏览 7提问于2020-01-24得票数 0

3回答

如何利用GAN进行无监督的图像特征提取？

feature-extraction、unsupervised-learning、gan

我理解了GAN是如何工作的，而两个网络(生成网络和区分网络)是如何相互竞争的。我已经建立了一个DCGAN (具有卷积鉴别器和非卷积发生器的GAN)，它现在成功地生成了类似于MNIST数据集中的手写数字。我读过很多关于GAN从图像中提取特征的应用。如何使用我训练过的GAN模型(在MNIST数据集上)从MNIST手写的数码图像中提取特征？

浏览 0提问于2017-03-09得票数 13

1回答

有人能给我解释一下在GAN的发电机是怎么做的吗？

machine-learning、neural-network、backpropagation、gan

我对神经网络不是很熟悉，但是，我想我把反向传播的概念理解为从输出层的错误开始。例如，输出层中有3个神经元，它们各自的值最终是： [1 0.5 0.3] 我们希望获得价值 [0 1 0] 因此，我们可以计算出两者之间的误差向量： [-1, +0.5, -0.3] (Not necessarily with the - operation, but you get the point) 从那里向后传播。然而，在GAN的发生器中，在我看来，输出层似乎有一堆神经元(代表我们想要生成的实体的大小)，但是误差仅基于鉴别器错误分类的图像的百分比。那么我们该怎么做发电机的后置支撑呢？我发现GAN的唯一一个人

浏览 0提问于2018-05-23得票数 1

回答已采纳

1回答

GAN和自动编码器的主要区别是什么？

gan、generative-models

GAN与其他较老的生殖模型的主要区别是什么？GAN的哪些特性使它比其他的生成模型更成功？

浏览 0提问于2019-07-04得票数 15

回答已采纳

1回答

博弈论在生成对抗网络中的应用

python、tensorflow、deep-learning、generative-adversarial-network

我们知道生成性对抗网络的训练是基于博弈论的，并且在训练过程中达到了纳什均衡。但当使用tensorflow：查看GAN样本时，我在代码中没有发现博弈论在哪里被应用，纳什均衡在哪里被估计。谁能展示一下我们在这段代码中使用博弈论的地方？

浏览 32提问于2020-02-19得票数 0

回答已采纳

1回答

两个神经网络的骨干是如何训练的？

neural-network

假设，我有一个骨干网络(卷积神经网络)。网络结束后，输出输入到两个神经网络中。两者都建立在特征提取器(CNN)输出的基础上。现在，如果我想从零开始训练这个完整的网络，在两个不同的任务上，骨干网络之后的层权重可以很容易地更新，但是我应该如何更新骨干网络的权重。我的意思是，我可以计算两个损失的梯度，是主干网中梯度的平均值，还是一定要加权和？如果是加权和，那么如何更新加权和的参数？谢谢

浏览 0提问于2020-07-30得票数 0

回答已采纳

2回答

如何获得每个时期的损失而不是每个批次的损失？

python、machine-learning、keras、generative-adversarial-network

在我的理解中，一个时期是对整个数据集的任意重复运行，而这些数据集又被分成几个部分进行处理，即所谓的批处理。在每次train_on_batch计算损失后，更新权重，下一批将获得更好的结果。这些损失是my to NNs质量和学习状态的指标。在一些来源中，每个时期都会计算(并打印)损失。因此，我不确定我这样做是否正确。目前我的GAN看起来是这样的： for epoch: for batch: fakes = generator.predict_on_batch(batch) dlc = discriminator.train_on_batch(batch, ..)

浏览 1提问于2019-01-06得票数 7

2回答

生成的对抗性网络可以在任何嵌入式/边缘设备上运行吗？

machine-learning、deep-learning、generative-models

我使用DCGAN ( Deep Convolution GAN )生成图像。但是，我想在嵌入式设备上运行它，比如Intel Movidius或Jetson。但是，在浏览了几篇互联网文章时，我知道嵌入式设备只用于深入学习的情况下进行推理。我有几个问题： GAN基本上是一个生成网络。怎么能有推论呢？对于GAN来说，推理和训练是否是一回事？它(GAN)能在嵌入式设备上运行吗?内存是一个真正的问题吗？

浏览 0提问于2018-08-27得票数 2

1回答

GAN - Generator损耗减少，但鉴别器假损耗在初始下降后增加，为什么？

tensorflow、deep-learning、pytorch、generative-adversarial-network、stochastic-gradient

我正在学习GAN，并试图在自定义数据集上运行pix2pix GAN模型，我每个时期的平均生成器损失和平均鉴别器假损失和真实损失如下所示- 和我只是不明白，为什么我的生成器损失减少了，而鉴别器假图像损失增加了？据我所知，它应该像发电机一样停下来。有没有人能帮我理解一下我犯的错误或者我所面临的训练问题？批量: 16 纪元: 100 学习率: 0.0008 L1 Lambda: 100 优化器: Gen - Adam；Disc - SGD 生成器中使用的BatchNORM。

浏览 4提问于2021-09-26得票数 0

2回答

自负鉴频器输出后的电流型GAN鉴频器损耗NaN

python、tensorflow

在GAN网络的中，鉴频器的输出类似于2.05145e+07，这导致了1 - disc_output -> 1-2.05145e+07=-2.05145e+07 (一个负数)，因此log(1-2.05145e+07)导致NaN。我不是第一个有这种问题的人。一种解决方案是只允许log中的正值，就像done 一样。有没有人知道更好的解决办法？也许是不同的损失函数？

浏览 1提问于2017-08-04得票数 1

回答已采纳

1回答

无法理解tensorflow文档中使用的GAN模型的损失函数

machine-learning、deep-learning、tensorflow2.0、generative-adversarial-network

我无法理解tensorflow文档中GAN模型中的损失函数。为什么tf.ones_like()用于real_loss，tf.zeros_like()用于伪输出？？ def discriminator_loss(real_output,fake_output): real_loss = cross_entropy(tf.ones_like(real_output),real_output) fake_loss = cross_entropy(tf.zeros_like(fake_output),fake_output) total_loss = real_loss + fake_lo

浏览 2提问于2020-04-28得票数 1

回答已采纳

1回答

在keras中处理多个损失及其权重

tensorflow、keras、deep-learning、loss-function、generative-adversarial-network

使用具有多个损失的train_on_batch训练GAN模型，我可以在编译模型时使用随机loss_weights吗，或者是否有一些特定的策略来使用Here提到的这些损失权重。在我的问题中，mean_sqaured_error是generated_image和original_image的损失函数，binary_crossentropy是0和1类的分类损失函数。 model.compile(optimizer=optimizer, loss=['mean_squared_error', 'binary_crossentropy'], loss_weights=[

浏览 45提问于2019-01-07得票数 0

1回答

使用外部库保持PyTorch梯度

scipy、pytorch、generative-adversarial-network

我有一个GAN返回一个预测的torch.tensor。为了引导这个网络，我有一个损失函数，它是二进制交叉熵损失(BCELoss)和沃瑟斯坦距离之和。然而，为了计算沃瑟斯坦距离，我从scipy.stats.wasserstein_distance库中使用了SciPy函数。您可能知道，这个函数需要两个NumPy数组作为输入。因此，为了使用这个函数，我将预测的张量和地面真相张量转换为NumPy数组，如下所示 pred_np = pred_tensor.detach().cpu().clone().numpy().ravel() target_np = target_tensor.detach().c

浏览 3提问于2021-06-03得票数 0

回答已采纳

2回答

生成对抗网络tanh？

tensorflow、neural-network、deep-learning

我想知道，为什么在我看到的大多数GAN模型(至少在MNIST中)，激活函数(用于鉴别器和生成器)是tanh？ReLu不是更高效吗？(我总是为预测网络阅读这篇文章) 谢谢!

浏览 3提问于2017-01-06得票数 9

2回答

神经网络可以作为优化器吗？

machine-learning、optimization

我想知道神经网络是否可以用作优化器。换句话说，作为优化器的network2采用network1的损失值，并在此基础上预测网络的最佳权重。1.作为架构中的判别器，gan模拟了一个损失函数。

浏览 0提问于2020-11-04得票数 2

1回答

一个GAN的鉴定人应该做什么？

machine-learning、neural-network、gan、generative-models

生成对抗性网络(GAN)由两个子网络组成：(1)发生器和(2)鉴别器. 鉴别者应该做些什么呢？或者更具体地说，它应该能够区分(分类)一个真实的对象(例如一个向量)和一个生成的对象，还是它应该能够区分一组生成的向量和一组真实的向量？我倾向于认为第二种选择是正确的。然而，如果是这样的话，我们如何建立一个神经网络来分类一组向量，而不是一个向量？

浏览 0提问于2017-10-11得票数 2

回答已采纳

1回答

我的GAN实现无法获得完整的GPU利用率

python、python-3.x、keras、tensorflow2.0

我构建了一个GAN网络，它从shape (40,40,6)的两个输入中预测shape [(40,40,4),(20,20,6)]的输出。该模型实际上正在工作，并且已经交付了结果，但我“只”获得了60%到70%的GPU利用率(由nvidia-smi显示)。我的问题是，对于这样的模型，这是否是固有的，因为它必须在train_on_batch调用之间做一些事情，或者是否有方法加快这一过程？一个关于随机数据的极简主义工作示例如下所示： import numpy as np import os import tensorflow as tf from tensorflow.keras.lay

浏览 9提问于2019-10-22得票数 1

回答已采纳

1回答

A2C强化学习中的参与者网络目标值

machine-learning、reinforcement-learning、actor-critic

在DQN中，我们使用； Target = r+\gamma v(s')方程训练(适合)我们的网络。它很容易理解，因为我们使用Target值作为因变量，就像我们在监督学习中所做的那样。也就是说，我们可以在python中使用代码来训练模型， model.fit(state,target, verbose = 0) 通过模型预测可以找到r和v(s')。当涉及到A2C网络时，事情变得更加复杂。现在我们有了两个网络。男演员和女演员。可以说，评论家网络和DQN中的网络并没有什么不同。唯一的区别是现在网络中只有一个输出神经元。因此，类似地，我们计算Target = r+\gamma v(s

浏览 0提问于2021-04-15得票数 0

回答已采纳

1回答

GAN在一开始是如何训练的？

neural-network、deep-learning

我理解一般的概述，但我想更深入地了解培训。在训练的前两次迭代中到底发生了什么？首先训练的是生成器还是鉴别器？验证集是否曾用于训练GAN？如果是这样，是生成器还是鉴别器？

浏览 0提问于2017-06-12得票数 0

3回答

如何将音频数据输入深度学习算法？

deep-learning、classification、speech、audio-processing、generative-adversarial-network

我是深度学习的新手，我的目标是使用GAN (生成对抗网络)来识别情感语音。我只知道图像是大多数深度学习算法的输入，比如GAN。但我很好奇，除了使用光谱图的图像作为输入之外，音频数据如何成为它的输入。另外，如果你能用外行的话解释一下，我将不胜感激。

浏览 98提问于2019-10-10得票数 2

1回答

GANs固有的类不平衡？

machine-learning、classification

类不平衡问题是GAN固有的吗？在GAN中，有两个相互对抗的网络，一个是分类器，对手试图通过生成虚假图像来欺骗分类器。所有从GAN生成的图像都将是假的，所以如果算法运行足够长的时间，就会出现类不平衡，对吧？

浏览 8提问于2017-08-05得票数 1

1回答

在MATLAB中使用GAN描述器进行单类分类

matlab、deep-learning、conv-neural-network、generative-adversarial-network

我尝试实现一个神经网络来对不同的缺陷进行分类，以便进行质量检查。我想使用单类分类。为了实现这一点，我想训练一个生成性对抗网络，并使用鉴别器进行分类。我使用了向日葵示例来实现我的第一个GAN。() 在此示例中，有一行代码在鉴别器网络的帮助下对生成的输出进行“分类”： dlYPredGenerated = forward(dlnetDiscriminator, dlXGenerated); 现在，我期望输出包含两个标签："Original“或"Fake”。取而代之的是，我得到了一长串数字： (:,:,1,1) = 5.9427 (:,:,1,2) = 7.593

浏览 1提问于2020-02-04得票数 2

1回答

在组合网络的子网上使用这两种损失

python、keras、neural-network、deep-learning、lstm

我想把两个网络叠加在一起。我想分别计算每个网络的损失。例如，在下面的图像中，LSTM1的丢失应该是(Loss1 + Loss2)，系统的丢失应该是公正的(Loss2) 我用上面的想法实现了像下面这样的网络，但是不知道如何编译和运行它。 def build_lstm1(): x = Input(shape=(self.timesteps, self.input_dim,), name = 'input') h = LSTM(1024, return_sequences=True))(x) scores = TimeDistributed(Dens

浏览 1提问于2018-11-14得票数 3

1回答

具有共享网络的Tensorflow估计器

python、tensorflow

我正在使用新的高级api构建tensorflow模型。我的模型看起来像下面的截图。实际上，由于模型是用来模拟游戏操作的，所以模型比模型更复杂。分类负责决定是否是行动的好时机。然后，回归将提供有关该操作的详细信息。它包含CNN和RNN的组合。然而，由于复杂性和内存消耗，不可能将分类和回归作为两个网络同时训练和运行。另外，当我创建我的估计器时： # Create the Estimator mnist_classifier = tf.estimator.Estimator( model_fn=cnn_model_fn, model_dir="/tmp/mnist_con

浏览 15提问于2017-08-25得票数 0

回答已采纳

2回答

生成性对抗网络是否需要类别标签？

machine-learning、neural-network、classification、multiclass-classification

我正在尝试理解GAN是如何训练的。我相信我理解对抗训练的过程。我似乎找不到的信息是: GANs在训练过程中是否使用类标签？我目前的理解是否定的--因为鉴别器只是试图区分真实或虚假的图像，而生成器试图创建真实的图像(但不是任何特定类别的图像)。如果是这样，那么研究人员建议如何使用鉴别器网络进行分类任务？该网络将只能在真实或虚假图像之间执行双向分类。生成器网络也很难使用，因为我们不知道输入向量'Z‘的什么设置会产生所需的生成图像。

浏览 4提问于2017-07-05得票数 0

1回答

鉴频器损耗是增加还是减少？

training、loss-function、gan、loss

这个问题纯粹是基于甘斯的理论方面。那么，在训练一个GAN的时候，判别器的损失应该是什么样子的呢？是否应该增加鉴别器的损失(因为生成器被成功地愚弄了鉴别器) 还是应该减少鉴别器的损失？有人能帮我理解一下这一点吗？

浏览 0提问于2020-10-11得票数 1

1回答

Colab错误:无法从“pix2pixHD_model”(未知位置)导入名称“pix2pixHD”

python、tensorflow、google-colaboratory

我正在使用Colab，我正在尝试编码一个Pix2Pix gan。这是我的代码： ! git clone https://github.com/NVIDIA/pix2pixHD ! pip install dominate 在这个代码块之后，它会这样说： fatal: destination path 'pix2pixHD' already exists and is not an empty directory. Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-whe

浏览 8提问于2022-07-19得票数 0

2回答

并将图像数据输出到TensorBoard

tensorboard、cntk

当使用CNTK训练时，有没有办法将GAN生成器的进度以图像的形式输出到Tensorboard？我想看看Geneartor在训练过程中创建了什么图像。我使用这个例子作为训练的起点：

浏览 3提问于2017-05-15得票数 1

1回答

在我的GAN模型中，鉴别器损耗迅速下降到$10^{-4}$，而发电机损耗在5+的水平上？

deep-learning、tensorflow、convolutional-neural-network、gan、generative-models

我正在创建一个生成性对抗性网络(GAN)，用于生成人工交易卡，但我是这一领域的完全新手。我一直存在的问题是，我的鉴别器虽然较弱(基于可学习的参数)，但它的损失降到了10^{-4}的大小(10到负4的幂)。相比之下，发电机损耗在前几个时期从5+加速到10+。此外，甄别器对真实和假图像的准确率立即达到100%，最多在两端相差2%。我现在的生成模型： def generator_model(): model = tf.keras.Sequential() # First Dense Layer model.add(Dense(8*8*64, input_dim=100)

浏览 0提问于2021-12-09得票数 1

1回答

增加一个恒定的正负损失和恒定的负损失会导致梯度消失吗？

machine-learning、deep-learning、pytorch

我想问一个关于用两个损失来训练一个模型的问题。我将生成一些特定类型的问句。为了达到这个目的，我用 (1)正常GAN生成正常问题空间。然后 (2)辅助分类器，使生成器集中于生成此类问题。通过预实验，当我使用BCELoss()对发电机鉴别器损耗(loss_G_D)时，损失值约为3. 当我在发电机分类器损耗(loss_G_C)上使用loss_G_C时，损失值总是为负值，而且非常大，例如-300。为了不让他们影响对方的训练过程，我采用了这种训练方法。 optimizer.zero_grad() loss_G_D = BCELoss(discriminator(generated_data))

浏览 5提问于2020-11-26得票数 1

回答已采纳

1回答

keras/theano损失或使用全网络的op

theano、keras

我正在寻找一种方法来实现以下网络结构(目前使用的是Keras，但可能是theano )：假设我们给定了一些简单的网络，但不可能直接基于此输出计算期望的损耗，而是需要另一个操作，并且将根据此操作的输出定义损耗。然而，这个操作不仅需要网络的输出，还需要完整的网络对象(例如它的梯度)。如何做到这一点？我认为操作既可以在网络顶部的自定义层中执行，也可以在自定义损失函数中执行-但对于这两个版本，我都看不到访问整个网络的方法。有什么建议吗？

浏览 2提问于2017-03-02得票数 1

1回答

当将来自多个网络的激活合并到一个目标中时，tensorflow中的自动区分是否有效？

machine-learning、tensorflow、neural-network、deep-learning、autodiff

我是tensorflow的新手，正在尝试弄清楚tensorflow中的自动区分功能是否可以解决我的问题。所以我有两个网络，每个网络输出一个潜在的向量。因此，假设我的网络A输出潜在向量-La(Hxr) -其中(H，r)表示输出潜在向量La的维度。类似地，net B输出Lb(Wxr)。因此，我的目标函数将这两个延迟都作为输入，并将它们组合在一起，如(La.Lb') where (.)是点积，(')表示转置。我将使用交叉熵来优化这个目标函数。现在我的问题是，张量流自动差分是否能够正确地计算梯度并反向传播？在这里，这不是一个简单的例子。仅应从梯度w.r.t更新净A。La和net B应

浏览 7提问于2017-07-22得票数 0

回答已采纳

1回答

关于使用冻结层进行训练的Keras问题

python、tensorflow、keras

所以我正在学习 GAN教程，作者设置了一个这样的discriminator： model_discriminator = Sequential() model_discriminator.add(net_discriminator) 其中net_discriminator是另一种Sequential模型。然后，他像这样设置adversarial模型： model_adversarial = Sequential() model_adversarial.add(net_generator) # Disable layers in discriminator for layer in net_

浏览 1提问于2019-06-27得票数 0

1回答

开始评分( is )和Fréchet初始距离(FID)，哪一个更适合GAN评估？

machine-learning、gan、metric、generative-models

在测量GAN的性能时，采用了两个标准:生成图像的质量和基于合成数据分布熵的图像多样性。另一方面，FID使用Inception网络从中间层提取特性。但是我怎么知道在给定的情况下应该使用什么。它们之间有什么比较或建议使用吗？

浏览 0提问于2020-03-11得票数 5

1回答

如何确保TensorFlow在从头编写的培训循环中保存整个数据集的平均损失

python、tensorflow、machine-learning、keras、tensorboard

我正在使用来自TensorFlow 的代码来训练我的有条件的GAN网络，该代码使用了一个编写的从头开始的训练循环。 def fit(train_ds, epochs, test_ds): for epoch in range(epochs): start = time.time() display.clear_output(wait=True) for example_input, example_target in test_ds.take(1): generate_images(generator, example_input, example_

浏览 6提问于2020-12-17得票数 0

回答已采纳

2回答

沃瑟斯坦损失可以是负的吗？

python、machine-learning、keras、neural-network、generative-adversarial-network

我目前正在使用(大约) Wasserstein损失在keras中训练WGAN，如下所示： def wasserstein_loss(y_true, y_pred): return K.mean(y_true * y_pred) 然而，这种损失显然是负面的，这对我来说很奇怪。我对WGAN进行了200个时期的训练，得到了下面的Wasserstein损失训练曲线。上述损失按下式计算 d_loss_valid = critic.train_on_batch(real, np.ones((batch_size, 1))) d_loss_fake = critic.train_on_ba

浏览 148提问于2019-07-19得票数 8

回答已采纳

1回答

如何在Tensorflow GAN中禁用鉴别器训练？

python、tensorflow、machine-learning、generative-adversarial-network

我有一个这样的发电机： def make_generator_model(): model = tf.keras.Sequential() model.add(layers.Dense(7*7*256, use_bias=False, input_shape=(100,))) model.add(layers.BatchNormalization()) model.add(layers.LeakyReLU()) model.add(layers.Reshape((7, 7, 256))) assert model.output_shape ==

浏览 8提问于2021-12-17得票数 3