神经网络中的多变量输出|为什么凯拉斯会产生负binary_cross_entropy？

文章/答案/技术大牛

发布

1回答

python、tensorflow、keras、loss-function

我必须根据文本数据在测试集上预测一个人的年龄和性别。我的训练数据集有4个特征(ID、关键字、年龄、性别)。我创建了一个神经网络(请参阅下面的代码)，但是当拟合后者时，我的损失值是非常负的。batch_size=batch_size, validation_data=(X_test, y_test), verbose=1) 您可以在下面找到我的训练数据集的结构截图

浏览 13提问于2021-04-10得票数 0

1回答

Keras & TensorFlow:求f( x ) wrt x的二阶导数，其中dim(x) = (1，n)

python、tensorflow、keras、derivative、hessian-matrix

我在凯拉斯和TensorFlow一起工作。我有一个深度神经模型(预测自动编码器)。我正在做一些与此类似的事情： --我试图了解给定层中的变量对输出的影响。为此，我需要找到损失(L)相对于特定层(S)输出的二阶导数(Hessian)：对角线输入就足够了。L是标量，s是1乘以n。我首先尝试的是： dLds = tf.gradients(L, s) # works fine to get fir

浏览 3提问于2017-07-18得票数 5

1回答

ReLU，ELU和Leaky的区别。他们的利弊主要是

machine-learning、python、deep-learning、neural-network、activation-function

它们如何与其他激活函数(如sigmoid和tanh)以及它们的优缺点进行比较。

浏览 0提问于2021-09-25得票数 6

3回答

什么时候(如果有的话)你会用PHP做这件事？

php

我一直在浏览一个Wordpress插件的代码，发现了以下内容：我很好奇，如果有一些我不知道的特定情况，这将是输出$foo变量的正确方式。这只是插件作者古怪的一个例子，还是有什么我应该知道的？我会直接用echo..。谢谢你所有的反馈。具体来说，这发生在WP超级缓存插件中。我想我得仔细看看，看看是否有必要。我以为超级缓存缓存了Wo

浏览 1提问于2011-04-01得票数 5

回答已采纳

1回答

MXNET软件最大输出:标签形状混淆

r、mxnet、softmax

我可以从实验中了解的是，一个标量laber表示类概率输出的索引是一个选项，而另一个选项是一个2D标签，其中行是类概率，或者是一个热编码变量，如c(1，0，0)。但令我困惑的是：我可以使用sclalar标签值，这些值超出索引，就像下面的例子中的4 --没有警告或错误。为什么会这样呢？当我的标签是负标量或具有负值的数组时，模型收敛到类上的一致概率分布。例如，这是

浏览 1提问于2018-10-02得票数 1

2回答

平板使用88 of的128 of可用。是什么导致的？

debian、memory

我们在128 Gb的服务器上运行Debian2.6.26-2-AMD 64 x86_64 GNU/Linux。最近，我们的可用内存变得相当少。查看/proc/meminfo显示，Slab使用的是88 in，它被计算在已使用的内存中。为什么斯拉布需要那么多记忆？有明确的

浏览 0提问于2011-02-25得票数 8

回答已采纳

2回答

多层for神经网络分类

neural-network

有人能解释一下，如何用MLBP神经网络对像MNIST这样的数据进行分类，如果我做了多个输出(例如8)，我的意思是，如果我只使用一个输出，我可以很容易地对数据进行分类，但是如果我使用多个输出，我应该选择哪个输出

浏览 0提问于2014-05-22得票数 8

回答已采纳

5回答

神经网络的非数学化描述

neural-network

我喜欢一个很好的数学难题，但我全心全意承认我的缺点。也就是说，我一直对神经网络很感兴趣，虽然我对它们有足够的了解，可以从头开始实现它们，但当我需要理解任何我只能找到数学证据的概念时，我会遇到困难。使用代码而不是公式来解释实际推理的神经网络程序员指南在哪里？

浏览 1提问于2008-11-23得票数 14

回答已采纳

5回答

神经网络是否具有多参数的复杂“线性函数”？

machine-learning、neural-network、deep-learning、artificial-intelligence

神经网络是一种复杂的多参数______________。( a)线性函数；( c)离散函数；来自：我不确定NNs是否只是“线性”函数？我们被要求在我校的一次测验中回答这个问题。然而，我认为具有非线性激活函数的NNs不是线性的.

浏览 1提问于2018-05-19得票数 2

2回答

为什么平均字嵌入向量(从神经网络嵌入层中提取)可以表示句子？

neural-network、nlp、rnn、word-embeddings、embeddings

我很难理解为什么平均字嵌入的方法可以获得句子嵌入，特别是考虑到这篇文章如何利用嵌入层获取短语的向量表示并进行主成分分析的运用。我现在的问题实际上是理解这个更实际的职位背后的理论。问题链接的答案使用了一种句子嵌入方法，即平均单词嵌入(在最简单和最简单的情况下，我们通过从神经网络模型的嵌入层提取向量来获得单词嵌入，因此无需使用预先训练的神经网络模型)。这种方法看起来很

浏览 0提问于2022-01-25得票数 1

回答已采纳

1回答

如何在只使用Int的比较中将“Int”不可转换为“String”？

swift、compiler-errors、type-conversion

想象一下，这个Swift代码在Xcode 6.1.1中产生了一个错误，这让我感到惊讶：{return highest < highestUnlockedLevel 好吧，我明白了，斯威夫特，我是斯多普。

浏览 2提问于2015-01-22得票数 0

回答已采纳

4回答

这个神经网络模型存在吗？

nlp、artificial-intelligence、neural-network

我在寻找一个具有特定特征的神经网络模型。这种模式可能不存在..。正如你所看到的，我也把网络分成了几个部分(圆圈)。每个圆圈代表一个语义域(一个语言学概念)，它是围绕一个概念的核心信息；语义域本质上是一个概念。节内节点之间的连接

浏览 14提问于2012-11-14得票数 5

3回答

MSE损失与交叉熵损失的收敛性比较

machine-learning、logistic-regression、loss、cross-entropy、mean-square-error

对于一个目标向量0,0,0，....0和预测向量0,0.1,0.2的简单分类问题，....1的交叉熵损失会更好/更快地收敛，还是MSE损失？当我绘制它们时，在我看来，MSE损失有一个较低的误差范围。为什么会这样？例如，当我的目标为1，1，1，1.1时，我得到以下信息：

浏览 0提问于2018-03-16得票数 3

回答已采纳

3回答

在机器学习中多次输入相同的输入(有不同的输出)是否可以接受？

machine-learning、data-partitioning、machine-translation

我想知道在机器学习中，是否可以接受一个数据集，该数据集可能包含相同的输入多次，但每次都包含另一次输入(有效！)以为例，在机器翻译的情况下，一个输入语句，但每次都给出不同的翻译。一方面，我认为这是绝对可以接受的，因为输出上的差异可能会更好地建模小的潜在特性，从而使模型具有更好的泛化能力。另一方面，我担心多次输入相同的输入会使给定输入的模型产生偏差--这意味着第一层(

浏览 3提问于2019-11-16得票数 5

回答已采纳

1回答

SVM与MLP (神经网络)的性能和预测精度比较

machine-learning、neural-network、deep-learning、svm

在某些图像处理应用中，需要选择支持向量机和神经网络。分类器的速度必须足够快，以满足近实时的应用需要，而且精度也很重要。由于这是一种医学应用，所以分类器的故障率很低是很重要的。哪个是更好的选择？

浏览 4提问于2012-05-20得票数 11

2回答

EarlyStopping在tf.keras中的故障

tensorflow、keras、early-stopping

我正在训练我的第一个转移学习模式(耶！)当验证损失在超过3个时期内没有超过0.1的变化时，我很难让模型停止训练。下面是相关的代码块问题：当我设置了EarlyStopping回调以监视val_loss时，为什

浏览 4提问于2020-03-11得票数 3

回答已采纳

3回答

文字为零，而不是米斯拉的空指针常量警告。

c++、reference、null-pointer、misra

我的职能是： // this function returns a container for unsigned int米斯拉想要什么?为什么？

浏览 1提问于2013-03-05得票数 4

1回答

为什么我们可以有未使用的函数，但不能有未使用的变量？

performance、go、compilation

未使用的变量会阻止编译(这是件好事)，但是编译器并不真正关心未使用的函数，有解释吗？

浏览 2提问于2015-11-17得票数 2

回答已采纳

2回答

代码的解释

c、strlen、unsigned-integer、size-t

代码的输出是3？请explain.According给我，它应该是5，删除“未签名”，但我得到的输出为3。

浏览 3提问于2017-12-12得票数 0

回答已采纳

点击加载更多