腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(85)
视频
沙龙
1
回答
在
Keras
中
,
使用
SGD
,
为什么
model.fit
()
训练
得很
顺利
,
但
分步
训练方法
给
出了
爆炸性
的
梯度
和
损失
python
、
tensorflow
、
keras
、
deep-learning
、
gradient-exploding
因为这种
爆炸性
的
梯度
和
爆炸性
的
损失
发生在网络巨大
的
时候,所以我不在这里张贴整个网络。问题是,
使用
Keras
API有两种
训练方法
,一种是
model.fit
(),第二种是更多
的
定制方法,用于更复杂
的
训练
和
网络,但是虽然我几乎所有的东西都保持不变,
model.fit
()没有
爆炸性
浏览 36
提问于2021-08-06
得票数 0
回答已采纳
2
回答
Tensorflow for XOR
在
500个时期后无法正确预测
python
、
tensorflow
、
machine-learning
、
keras
、
neural-network
我正在尝试
使用
TensorFlow实现一个神经网络来解决异或问题。我选择sigmoid作为激活函数,shape (2, 2, 1)
和
optimizer=
SGD
()。我选择batch_size=1是因为问题
的
全局性是4,所以真的很小。问题是,预测结果甚至与正确答案相去甚远。我做错了什么?我
在
Google Colab上这样做,Tensorflow
的
版本是2.3.0。(1, activation=tf.
keras
.activations.sigmoid)) model.co
浏览 46
提问于2020-11-04
得票数 3
回答已采纳
1
回答
学习率没有影响
keras
、
deep-learning
、
classification
、
learning-rate
我
使用
的
是带有
Keras
的
MLP,用
sgd
优化
的
。我想调整学习速度,但它似乎对
训练
没有任何影响。我尝试了小学习率(.01)以及非常大
的
学习率(高达1e28),而且效果几乎不明显。我
的
损失
不应该在
使用
一个很大
的
学习率
的
时候爆炸吗? 我
使用
的
是一个完全连接
的
神经网络,它有三个隐藏层
和
乙状结肠激活函
浏览 2
提问于2020-03-28
得票数 0
1
回答
不能用
model.fit
复制GradientTape
tensorflow
、
adam
我一直
在
试图调查
为什么
SGD
在
训练
中有0.001
的
学习率,而Adam却没有这样做。(请看我以前
的
帖子)model.compile(optimizer=
SGD
(learning_rate=0.001),
浏览 5
提问于2020-03-07
得票数 2
27
回答
训练
回归网络时
的
NaN
损失
python
、
keras
、
neural-network
、
theano
、
loss-function
我有一个“一热编码”(全部为1
和
0)
的
数据矩阵,包含26万行
和
35列。我用
Keras
训练
一个简单
的
神经网络来预测一个连续变量。=1, validation_data=(X_test,Y_test), callbacks=[EarlyStopping(monitor='val_loss', patience=4)] ) 然而,
在
训练
过程
中
RMSProp而不是
SGD
,我尝试了tanh而不是relu,我
浏览 24
提问于2016-05-14
得票数 122
回答已采纳
2
回答
Keras
中
的
策略
梯度
python
、
deep-learning
、
theano
、
keras
、
q-learning
我一直试图建立一个
使用
‘深度Q-学习’
的
模型,其中我有大量
的
行动(2908)。
在
使用
标准DQN:()取得有限
的
成功之后,我决定做更多
的
研究,因为我认为动作空间太大,无法进行有效
的
探索。然后我发现了这篇论文:,在这里他们
使用
了一个参与者-评论家模型
和
策略
梯度
,这导致了我:,在那里,他们
使用
策略
梯度
来获得比DQN更好
的
结果。我已经找到了几个
在
浏览 6
提问于2016-11-05
得票数 23
3
回答
为什么
不同
的
批次大小
在
Keras
中提供不同
的
精度?
machine-learning
、
keras
、
deep-learning
、
conv-neural-network
我用
Keras
的
CNN来分类MNIST数据集。我发现
使用
不同
的
批次大小会带来不同
的
准确性。
为什么
会这样呢?(Acc = 0.97600)虽然差异很小,
但
为什么
会有差异呢?编辑--我发现这种差异仅仅是因为精度问题,而且它们实际上是相等
的
。
浏览 0
提问于2019-04-03
得票数 3
回答已采纳
6
回答
梯度
下降
和
随机
梯度
下降有什么区别?
machine-learning
、
neural-network
、
deep-learning
、
gradient-descent
梯度
下降
和
随机
梯度
下降有什么区别? 我对这些不太熟悉,你能用一个简短
的
例子来描述这种差异吗?
浏览 0
提问于2018-08-04
得票数 75
3
回答
具有相同标签
的
批处理
的
每个成员有多大
的
问题?
classification
、
class-imbalance
、
mini-batch-gradient-descent
我有128个批次大小
和
大约1000万个数据大小,我将在4个不同
的
标签值之间进行分类。例如,批处理0都有第三个标签。第一批都有第一批。第二批。等。
浏览 0
提问于2020-07-01
得票数 2
回答已采纳
3
回答
在
keras
中
使用
批处理标准化进行微调
python
、
tensorflow
、
keras
、
deep-learning
、
batch-normalization
我已经成功地
训练
了一个超过100000个样本
的
模型,它在
训练
集
和
测试集上都表现
得很
好。然后,我尝试对一个特定
的
样本( 100000个样本
中
的
一个)进行微调,并
使用
训练
好
的
权重作为初始化。x,y是一个特定样本
的
输入
和
标签。我想进一步优化样本
的
损失
。但是
在
训练
集(实际上与
model.fit
浏览 1
提问于2018-12-24
得票数 2
1
回答
使用
GradientTape而
使用
model.fit
()改进模型
python
、
tensorflow
、
machine-learning
、
keras
、
gradienttape
我目前正在尝试
使用
tf.GradientTape来
训练
一个模型,因为来自
keras
的
model.fit
(...)将来将无法处理我
的
数据输入。然而,虽然
使用
model.fit
(...)和我
的
模型运行
的
测试工作
得很
好,
但
tf.GradientTape却没有。另外,我注意到了一些事情: 与
model.fit
(...)相比,定制培训大约需要2倍
的
时间
浏览 4
提问于2022-08-22
得票数 0
1
回答
Keras
模型evaluate()
和
predict_classes()给
出了
相互矛盾
的
结果
python
、
tensorflow
、
keras
、
computer-vision
我已经
使用
Keras
的
VGG16进行了一段时间
的
工作,在对我自己
的
4类数据集进行了微调之后,
训练
似乎进行
得很
顺利
,
训练
和
验证集
的
准确性提高了,最后,即使是
使用
model.evaluate()
的
评估
在
测试数据上也有很好
的
准确性为了证实这一点,我尝试
使用
以下方法对我
的
数据集中
的
图
浏览 3
提问于2018-11-05
得票数 0
1
回答
在运行“构建您自己
的
联邦学习算法”教程时,Tensorflow federated ( TFF ) 0.19
的
性能明显低于TFF 0.17
tensorflow-federated
在
最后
的
“构建您自己
的
联邦学习算法”教程中指出,
在
训练
我们
的
模型15轮之后,我们将期望
在
0.25左右运行一个sparse_categorical_accuracy,但是
在
colab
中
运行该教程将给出一个基于我运行
的
结果在然而,只需将tf
和
tff版本分别更改为2.3.x
和
0.17,就会得到0.25左右
的
结果,就像我们预期
的
那样! 要按原样运行上述教
浏览 0
提问于2021-07-12
得票数 2
回答已采纳
6
回答
Keras
中
的
自定义
损失
函数应该返回该批
的
单个
损失
值,还是返回培训批
中
每个样本
的
损失
数组?
tensorflow
、
machine-learning
、
keras
、
tensorflow2.0
、
loss-function
我正在学习tensorflow(2.3)
中
的
keras
。但是上面的函数给
出了
整个批次
的
一个值。我读了类
的
源代码。当您向方法提供一个丢失函数(请注意它是一个函数,而不是一个丢失类)时,将
使用
该丢失函数来构造一个LossesContainer对象,该对象存储
在
Model.compiled_loss
中</em
浏览 8
提问于2020-08-13
得票数 24
回答已采纳
1
回答
如何用pytorch评估
和
获得前馈神经网络
的
精度
python
、
neural-network
、
deep-learning
、
pytorch
、
linear-regression
我开始
使用
Pytorch,目前正在做一个项目,我正在
使用
一个简单
的
前馈神经网络进行线性回归。问题是,我
在
Pytorch
中
找不到任何可以让我获得
Keras
或SKlearn中线性回归模型
的
准确性
的
东西。
在
keras
中
,只需在编译函数
中
设置metrics=["accuracy"]即可。我
在
Pytorch
的
文档
和
官方
浏览 16
提问于2019-10-06
得票数 1
4
回答
XOR未
使用
Kerasv2.0学习
python
、
numpy
、
neural-network
、
keras
一段时间以来,我
在
使用
工具角时得到了相当糟糕
的
结果,而且对这个工具没有那么多
的
疑虑。但我现在开始有点担心了。import numpy as np model.add(Dense(2, input_dimnp.array([[0],[1],[1],[0]], "float32") mo
浏览 6
提问于2017-05-03
得票数 10
回答已采纳
4
回答
L1正则化
在
Keras
/Tensorflow *真的*L1-正则化吗?
tensorflow
、
machine-learning
、
neural-network
、
deep-learning
、
keras
利用L1正则化方法对
Keras
中
的
神经网络参数进行
keras
.regularizers.l1(0.01)正则化,得到稀疏模型。我发现,虽然我
的
许多系数接近于零,但它们
中
的
一些实际上是零。通过查看,它建议
Keras
简单地将参数
的
L1范数添加到
损失
函数
中
。 这将是不正确
的
,因为参数几乎肯定永远不会像L1正则化时所期望
的
那样(
在
浮点错误范围内)变为零。
浏览 8
提问于2017-03-31
得票数 13
2
回答
Keras
不起作用时
的
基本二进制分类
python
、
tensorflow
、
machine-learning
、
keras
、
classification
我是ML
的
新手,我想用
Keras
执行最简单
的
分类:如果y> 0.5,那么label =1 (x无关紧要),y< 0.5那么label =0 (x无关紧要)import math import matplotlib as mpl train_datamodel.compile(optimizer='a
浏览 0
提问于2018-12-18
得票数 1
3
回答
tf.
keras
中线性回归模型调优
的
几个问题
regression
、
python
、
tensorflow
、
keras
、
matplotlib
我正在开发,它
使用
一个玩具数据集探索线性回归。建立并
训练
了一个线性回归模型,它与学习速度、时间
和
批次大小有关。我很难理解迭代是如何完成
的
,它是如何连接到“时代”
和
“批处理大小”
的
。这样我就可以看到“计算机”
使用
什么样
的
数据,把什么样
的
数据放入模型
中
,
在
每一次特定
的
迭代
中
得到什么样
的
模型结果,以及迭代是如何完成
的
。这给
出了
浏览 7
提问于2020-06-19
得票数 7
3
回答
迁移学习-- Val_loss奇怪
的
行为
machine-learning
、
deep-learning
、
conv-neural-network
、
image-recognition
、
transfer-learning
我正在尝试
使用
来自菲顿
keras
.application
的
MobileNetV2上
的
迁移学习。此外,我还
使用
了以下内容 model.compile(optimizer=opt, loss总而言之,
训练
的
损失
不再减少,而且仍然很高。这个模型也过拟合了。你可能会问,
为什么
我只添加了2个致密层,每个层有4个神
浏览 0
提问于2019-06-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
TensorFlow快餐教程:程序员快速入门深度学习五步法
一篇文章读懂什么是卷积神经网络
周末AI课堂:神经网络综观 代码篇
深度神经网络的分布式训练概述:常用方法和技巧全面总结
学界 深度神经网络的分布式训练概述常用方法和技巧全面总结
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券