腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(926)
视频
沙龙
1
回答
神经网络
中
的
多
变量
输出
|
为什么
凯
拉
斯
会
产生
负
binary_cross_entropy
?
python
、
tensorflow
、
keras
、
loss-function
我必须根据文本数据在测试集上预测一个人
的
年龄和性别。我
的
训练数据集有4个特征(ID、关键字、年龄、性别)。 我创建了一个
神经网络
(请参阅下面的代码),但是当拟合后者时,我
的
损失值是非常
负
的
。batch_size=batch_size, validation_data=(X_test, y_test), verbose=1) 您可以在下面找到我
的
训练数据集
的
结构截图
浏览 13
提问于2021-04-10
得票数 0
1
回答
Keras & TensorFlow:求f( x ) wrt x
的
二阶导数,其中dim(x) = (1,n)
python
、
tensorflow
、
keras
、
derivative
、
hessian-matrix
我在
凯
拉
斯
和TensorFlow一起工作。我有一个深度神经模型(预测自动编码器)。我正在做一些与此类似的事情: --我试图了解给定层
中
的
变量
对
输出
的
影响。为此,我需要找到损失(L)相对于特定层(S)
输出
的
二阶导数(Hessian): 对角线输入就足够了。L是标量,s是1乘以n。我首先尝试
的
是: dLds = tf.gradients(L, s) # works fine to get fir
浏览 3
提问于2017-07-18
得票数 5
1
回答
ReLU,ELU和Leaky
的
区别。他们
的
利弊主要是
machine-learning
、
python
、
deep-learning
、
neural-network
、
activation-function
它们如何与其他激活函数(如sigmoid和tanh)以及它们
的
优缺点进行比较。
浏览 0
提问于2021-09-25
得票数 6
3
回答
什么时候(如果有的话)你会用PHP做这件事?
php
我一直在浏览一个Wordpress插件
的
代码,发现了以下内容:我很好奇,如果有一些我不知道
的
特定情况,这将是
输出
$foo
变量
的
正确方式。这只是插件作者古怪
的
一个例子,还是有什么我应该知道
的
?我会直接用echo..。谢谢你所有的反馈。具体来说,这发生在WP超级缓存插件
中
。我想我得仔细看看,看看是否有必要。我以为超级缓存缓存了Wo
浏览 1
提问于2011-04-01
得票数 5
回答已采纳
1
回答
MXNET软件最大
输出
:标签形状混淆
r
、
mxnet
、
softmax
我可以从实验中了解
的
是,一个标量laber表示类概率
输出
的
索引是一个选项,而另一个选项是一个2D标签,其中行是类概率,或者是一个热编码
变量
,如c(1,0,0)。但令我困惑
的
是: 我可以使用sclalar标签值,这些值超出索引,就像下面的例子
中
的
4 --没有警告或错误。
为什么
会
这样呢?当我
的
标签是
负
标量或具有负值
的
数组时,模型收敛到类上
的
一致概率分布。例如,这是
浏览 1
提问于2018-10-02
得票数 1
2
回答
平板使用88 of
的
128 of可用。是什么导致
的
?
debian
、
memory
我们在128 Gb
的
服务器上运行Debian2.6.26-2-AMD 64 x86_64 GNU/Linux。最近,我们
的
可用内存变得相当少。查看/proc/meminfo显示,Slab使用
的
是88 in,它被计算在已使用
的
内存
中
。
为什么
斯
拉
布需要那么
多
记忆?有明确
的
浏览 0
提问于2011-02-25
得票数 8
回答已采纳
2
回答
多层for
神经网络
分类
neural-network
有人能解释一下,如何用MLBP
神经网络
对像MNIST这样
的
数据进行分类,如果我做了多个
输出
(例如8),我
的
意思是,如果我只使用一个
输出
,我可以很容易地对数据进行分类,但是如果我使用多个
输出
,我应该选择哪个
输出
浏览 0
提问于2014-05-22
得票数 8
回答已采纳
5
回答
神经网络
的
非数学化描述
neural-network
我喜欢一个很好
的
数学难题,但我全心全意承认我
的
缺点。也就是说,我一直对
神经网络
很感兴趣,虽然我对它们有足够
的
了解,可以从头开始实现它们,但当我需要理解任何我只能找到数学证据
的
概念时,我会遇到困难。使用代码而不是公式来解释实际推理
的
神经网络
程序员指南在哪里?
浏览 1
提问于2008-11-23
得票数 14
回答已采纳
5
回答
神经网络
是否具有
多
参数
的
复杂“线性函数”?
machine-learning
、
neural-network
、
deep-learning
、
artificial-intelligence
神经网络
是一种复杂
的
多
参数______________。( a)线性函数;( c)离散函数; 来自: 我不确定NNs是否只是“线性”函数?我们被要求在我校
的
一次测验
中
回答这个问题。然而,我认为具有非线性激活函数
的
NNs不是线性
的
.
浏览 1
提问于2018-05-19
得票数 2
2
回答
为什么
平均字嵌入向量(从
神经网络
嵌入层中提取)可以表示句子?
neural-network
、
nlp
、
rnn
、
word-embeddings
、
embeddings
我很难理解
为什么
平均字嵌入
的
方法可以获得句子嵌入,特别是考虑到这篇文章如何利用嵌入层获取短语
的
向量表示并进行主成分分析
的
运用。我现在
的
问题实际上是理解这个更实际
的
职位背后
的
理论。问题链接
的
答案使用了一种句子嵌入方法,即平均单词嵌入(在最简单和最简单
的
情况下,我们通过从
神经网络
模型
的
嵌入层提取向量来获得单词嵌入,因此无需使用预先训练
的
神经网络
模型)。这种方法看起来很
浏览 0
提问于2022-01-25
得票数 1
回答已采纳
1
回答
如何在只使用Int
的
比较中将“Int”不可转换为“String”?
swift
、
compiler-errors
、
type-conversion
想象一下,这个Swift代码在Xcode 6.1.1
中
产生
了一个错误,这让我感到惊讶:{return highest < highestUnlockedLevel 好吧,我明白了,斯威夫特,我是
斯
多
普。
浏览 2
提问于2015-01-22
得票数 0
回答已采纳
4
回答
这个
神经网络
模型存在吗?
nlp
、
artificial-intelligence
、
neural-network
我在寻找一个具有特定特征
的
神经网络
模型。这种模式可能不存在..。正如你所看到
的
,我也把网络分成了几个部分(圆圈)。每个圆圈代表一个语义域(一个语言学概念),它是围绕一个概念
的
核心信息;语义域本质上是一个概念。 节内节点之间
的
连接
浏览 14
提问于2012-11-14
得票数 5
3
回答
MSE损失与交叉熵损失
的
收敛性比较
machine-learning
、
logistic-regression
、
loss
、
cross-entropy
、
mean-square-error
对于一个目标向量0,0,0,....0和预测向量0,0.1,0.2
的
简单分类问题,....1
的
交叉熵损失
会
更好/更快地收敛,还是MSE损失?当我绘制它们时,在我看来,MSE损失有一个较低
的
误差范围。
为什么
会
这样? 例如,当我
的
目标为1,1,1,1.1时,我得到以下信息:
浏览 0
提问于2018-03-16
得票数 3
回答已采纳
3
回答
在机器学习
中
多次输入相同
的
输入(有不同
的
输出
)是否可以接受?
machine-learning
、
data-partitioning
、
machine-translation
我想知道在机器学习
中
,是否可以接受一个数据集,该数据集可能包含相同
的
输入多次,但每次都包含另一次输入(有效!)以为例,在机器翻译
的
情况下,一个输入语句,但每次都给出不同
的
翻译。一方面,我认为这是绝对可以接受
的
,因为
输出
上
的
差异可能
会
更好地建模小
的
潜在特性,从而使模型具有更好
的
泛化能力。另一方面,我担心多次输入相同
的
输入会使给定输入
的
模型
产生
偏差--这意味着第一层(
浏览 3
提问于2019-11-16
得票数 5
回答已采纳
1
回答
SVM与MLP (
神经网络
)
的
性能和预测精度比较
machine-learning
、
neural-network
、
deep-learning
、
svm
在某些图像处理应用
中
,需要选择支持向量机和
神经网络
。分类器
的
速度必须足够快,以满足近实时
的
应用需要,而且精度也很重要。由于这是一种医学应用,所以分类器
的
故障率很低是很重要
的
。 哪个是更好
的
选择?
浏览 4
提问于2012-05-20
得票数 11
2
回答
EarlyStopping在tf.keras
中
的
故障
tensorflow
、
keras
、
early-stopping
我正在训练我
的
第一个转移学习模式(耶!)当验证损失在超过3个时期内没有超过0.1
的
变化时,我很难让模型停止训练。下面是相关
的
代码块问题: 当我设置了EarlyStopping回调以监视val_loss时,
为什
浏览 4
提问于2020-03-11
得票数 3
回答已采纳
3
回答
文字为零,而不是米
斯
拉
的
空指针常量警告。
c++
、
reference
、
null-pointer
、
misra
我
的
职能是: // this function returns a container for unsigned int米
斯
拉
想要什么?
为什么
?
浏览 1
提问于2013-03-05
得票数 4
1
回答
为什么
我们可以有未使用
的
函数,但不能有未使用
的
变量
?
performance
、
go
、
compilation
未使用
的
变量
会
阻止编译(这是件好事),但是编译器并不真正关心未使用
的
函数,有解释吗?
浏览 2
提问于2015-11-17
得票数 2
回答已采纳
2
回答
代码
的
解释
c
、
strlen
、
unsigned-integer
、
size-t
代码
的
输出
是3?请explain.According给我,它应该是5,删除“未签名”,但我得到
的
输出
为3。
浏览 3
提问于2017-12-12
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券