在玩CartPole时，Keras Q学习模型的性能没有提高

、、

我正在使用OpenAI健身房的cartpole环境训练强化学习模型。尽管我的体重和模型的.h5文件出现在目标目录中，但在运行以下代码后，我没有得到任何内容- tf.train.get_checkpoint_state("C:/Users/dgt/Documents"). 这是我的全部代码- ## Slightly modified from the following repository - https://github.com/gsurma/cartpole from __future__ import absolute_import, division, print_

浏览 21提问于2020-08-25得票数 1

回答已采纳

1回答

TensorFlow模型拟合与train_on_batch的区别

、、、、

我正在构建一个香草DQN模型来玩OpenAI健身房Cartpole游戏。然而，在训练步骤中，我输入状态作为输入，目标Q值作为标签，如果我使用model.fit(x=states, y=target_q)，它工作得很好，代理最终可以很好地玩游戏，但是如果我使用model.train_on_batch(x=states, y=target_q)，损失不会减少，模型不会在任何地方比随机策略玩得更好。我想知道fit和train_on_batch有什么不同？据我所知，fit在幕后调用批处理大小为32的train_on_batch，这应该没有区别，因为指定批处理大小等于我输入的实际数据大小没有任何区

浏览 56提问于2020-06-29得票数 2

回答已采纳

1回答

RLLIB使用脱机样本批处理训练DQN失败- episode_len_mean：.nan值

、、

RLLIB库-使用脱机批处理数据估计DQN模型.模型无法学习。episode_len_mean：.nan用于CartPole示例以及特定于个人域的数据集 Ubuntu库- RLIB DQN离线环境：-尝试与Cartpole-v0以及自定义环境示例。 episode_len_mean：.nan episode_reward_max：.nan episode_reward_mean：.nan episode_reward_min：.nan episodes_this_iter: 0 episodes_total: 0 使用PG生成数据 rllib train --run=PG --env=Cart

浏览 3提问于2019-04-16得票数 2

1回答

Matplotlib -如何绘制训练中每个时代的进展？

、、、、

我正在尝试构建一个可以玩stick cart的深度Q学习代理。通过强化学习，它学会了通过移动手推车来平衡操纵杆。我的模型可以工作，但我不知道如何绘制训练进度图。我不知道如何绘制类似于这张图的游戏和分数：我一直在玩matplotlib，但似乎想不通。我已经能够让绘图显示出来，但它只显示为空白。不太确定现在该做什么。下面是我的代码： import random import gym import numpy as np from collections import deque from keras.models import Sequential from keras.layers i

浏览 17提问于2019-10-27得票数 0

1回答

带有Keras的Python神经网络在CPU上运行，但在GPU上崩溃

、、、

我实现了一个神经网络，它使用gym，box2d和gymatari学习玩PacMan，使用Keras模型。训练非常慢，所以我试着在我的GTX 1060 Max-Q上跑步。我安装了最新版本的Tensorflow，安装了CUDA11.0和cuDNN 8.0.4.30。程序成功打开所有库，正确检测图形处理器，创建张量设备，启动渲染的第一帧，冻结约9秒，然后退出，代码为-1073740791 (0xC0000409)。为什么会发生这种情况?我可以做些什么来修复它？

浏览 30提问于2021-01-03得票数 0

1回答

电极.层数和神经元数.模型参数

、、

有谁能建议我如何在DDQN算法中求出最优的图层数、神经元数、深度学习模型参数。当输入和输出神经元分别为4和2时，在选择隐层数和隐层数时，是否有科学原因或数学依据。我按照这个链接建立了强化学习算法https://pylessons.com/CartPole-reinforcement-learning/。

浏览 0提问于2021-06-21得票数 1

1回答

验证准确率在达到90%后没有提高

、、、

我有大约14,000张图像用于人脸检测二进制分类任务。大约12,000张图像用于训练，2,200张用于验证。我的CNN架构如下- regularizer = tf.keras.regularizers.l2(l=0.001) init = tf.initializers.he_uniform() model = tf.keras.models.Sequential([ tf.keras.layers.Conv2D(filters = 32, kernel_size = (3, 3), strides = (1, 1), padding='same', activati

浏览 1提问于2019-10-19得票数 1

2回答

密集层给我二维阵列

、、、

我正在为CartPole做强化学习，我遇到了这个问题 model = keras.models.Sequential() model.add(Dense(8,activation = 'relu')) model.add(Dense(2,activation = 'linear') 这是我的模型 state = env.reset() print(state) output: [-0.00315391 -0.0150189 0.01804181 0.02032083] 这就是我对我的模型的预测 model.predict(state) output:

浏览 1提问于2021-08-30得票数 0

回答已采纳

1回答

、、、、

我正在尝试训练一个深度Q学习Keras模型来玩CartPole-v1。然而，它似乎并没有变得更好。我不认为这是一个错误，而是我缺乏如何正确使用Keras和OpenAI健身房的知识。我正在学习这个教程(https://adventuresinmachinelearning.com/reinforcement-learning-tutorial-python-keras/)，它展示了如何训练机器人玩NChain-v0 (我能够遵循它)，但现在我试图将我学到的东西应用到一个更复杂的环境中: CartPole-v1。代码如下： ###import libraries import gym impor

浏览 19提问于2019-06-29得票数 0

回答已采纳

1回答

使用tensorflow实现SARSA

、、

目前，我正在尝试学习强化学习的概念。因此，我尝试使用tensorflow为cart pole示例实现SARSA算法。我将我的算法与对Q值函数使用线性逼近函数的算法进行了比较，发现我的算法非常相似。不幸的是，我的实现似乎是错误的或低效的，因为学习成功相当有限。有没有人能告诉我我是不是做错了什么？我的实现代码是： import numpy as np import matplotlib.pylab as plt import random import gym #define a neural network which returns two action dependent q-valu

浏览 15提问于2020-12-09得票数 0

1回答

计算机视觉的深度学习: MNIST阶段之后会发生什么？

、、、、

我正在尝试使用深度学习技术来探索计算机视觉。我已经阅读了基本文献，使用MNIST数据创建了自己的神经网络来对数字进行分类(不使用TF、Keras等任何库，在此过程中理解了损失函数、优化、反向传播等概念)，然后还使用TF Keras探索了时尚MNIST。我应用到目前为止获得的知识来解决Kaggle问题(识别植物类型)，但结果并不是很令人振奋。那么，我的下一步应该是什么呢？我应该做什么来提高我的知识和模型来解决更复杂的问题？在初学者阶段之前，我还应该读些什么书、文学作品等呢？

浏览 24提问于2019-10-03得票数 0

回答已采纳

1回答

总是应用“ReduceLROn高原()”是否是一个好做法，因为一旦学习停滞，模型就会受益于降低学习速度？

、、、

keras函数ReduceLROnPlateau()的基本原理是，一旦学习停滞，模型就会受益于降低学习速度。总是应用ReduceLROnPlateau()是一个很好的实践吗？有什么情况，如果有的话，不应用ReduceLROnPlateau()？

浏览 0提问于2018-08-20得票数 7

回答已采纳

2回答

即使没有达到min_delta条件，Keras也会提前停止

、

我正在训练Keras序列模型，如下所示。它适用于5个数字的mnist数据集。在28x28图像中，扁平和输出是它们所属类的一个热门符号。 model = keras.Sequential([ keras.layers.InputLayer(input_shape = (784, )), keras.layers.Dense(32, activation='relu'), keras.layers.Dense(15, activation='relu'), keras.layers.Dense(3, activation='relu'), keras

浏览 4提问于2022-04-10得票数 1

回答已采纳

1回答

matplotlib图不显示在jupyter笔记本中

、、

我想重现下面的学习曲线(在jupyter笔记本中)，它对应于Geron书的第637页的示例。具体来说，下面是我使用的代码： %pylab inline %matplotlib inline import tensorflow as tf from tf import keras import matplotlib import numpy as np import matplotlib.pyplot as plt from collections import deque import gym env = gym.make("CartPole-v1") inpu

浏览 0提问于2020-07-29得票数 0

1回答

如何使用稳定的baselines3让模型在循环中学习？

、、

在来自稳定baselines3网站()的示例代码中，模型将首先通过model.learn(total_timesteps=25000)线路学习，然后可以在播放循环中使用。现在，由于我希望能够在代理学习过程中监视不同的参数(从自定义环境)，我的问题是:如何在播放循环中使用model.learn？ import gym from stable_baselines3 import PPO from stable_baselines3.common.env_util import make_vec_env # Parallel environments env = make_vec_env(

浏览 3提问于2021-03-31得票数 0

2回答

调整模型以获得更好的性能

、、、、

我为回归问题建立了一个模型，即从9个输入变量中预测一个值。模型的开发是基于Keras库的人工神经网络在这个使用编译和拟合方法的模型中，我已经预测了输出值。然而，我得到了不好的评价分数。我使用RMSE和R2对模型进行了评估 (已归一化)预测值与标记值之间的RMSE值为0.207，(原始形式)预测值与标记值之间的RMSE值为215，R2为0.40 如何修改我的模型以获得更好的结果(低RMSE和高R2)？或者这个模型可以接受吗？ import keras model = keras.models.Sequential() model.add(keras.layers.Dense(36, in

浏览 2提问于2020-05-20得票数 0

1回答

加速Keras模型预测

、、

尝试使用Keras检测情绪，用mss抓取桌面，然后将它们显示到OpenCV窗口。角膜模型尺寸为360毫巴。 import time import cv2 import mss import numpy as np face_cascade = cv2.CascadeClassifier('face.xml') label = ["angry", "happy", "sad", "stress"] monitor = {"top": 0, "left": 0, "width&

浏览 5提问于2022-12-04得票数 -2

1回答

忽略Keras model.fit中的未知值

、、

我正试着用Keras中的深度学习来学习我的计算机来玩Snake。我的模型试图预测这四个动作中的每一个将给出的总奖励。因为智能体只采取一个动作，所以只知道四个预测奖励中的一个的真实值。这会在调用model.fit时产生问题，因为它需要每个输出的真值。我试图实现一个忽略其他值的损失函数，但没有成功。有谁知道怎么做对吗？

浏览 12提问于2019-06-30得票数 0

1回答

奇异神经网络过拟合

、、、

在训练以下多类分类的NN模型时，我遇到了一个非常奇怪的行为： METRICS = [ keras.metrics.AUC(name='auc') ] model = keras.Sequential() model.add(layers.Dense(hidden_units, activation='relu', kernel_regularizer=l2(0.1), input_shape=(input_len,))) model.add(keras.layers.BatchNormalization()) model.add(keras.layer

浏览 0提问于2020-06-09得票数 1

1回答

利用函数API进行量化感知训练的迁移学习

、、、、

我有一个模型，我使用转移学习的MobileNetV2，我想量化它，并比较精度的差异，与一个非量化的模型和转移学习。然而，它们并不完全支持递归量化，但是根据这一点，这个方法应该量化我的模型：。我试着做的是： import tensorflow as tf import tensorflow_model_optimization as tfmot pretrained_model = tf.keras.applications.MobileNetV2(include_top=False) pretrained_model.trainable = True for layer in pr

浏览 9提问于2022-07-11得票数 1

回答已采纳

1回答

将tf.keras模型转换为TFLite:模型很慢，不适用于XNN

、

直到最近，我一直在训练一个基于MobileNetV2的TF-1.15模型。经过培训，我一直能够运行这些命令来生成TFLite版本： tf.keras.backend.set_learning_phase(0) converter = tf.lite.TFLiteConverter.from_keras_model_file( tf_keras_path) converter.optimizations = [tf.lite.Optimize.DEFAULT] converter.target_spec.supported_types =

浏览 2提问于2021-03-24得票数 1

1回答

急切执行，则tf.GradientTape仅返回None

、、、、

我试着用tf.GradientTape来计算梯度。当我尝试这样做时，使用loss和Model.trainable_weights (tf.keras.Model)作为输入，这是一个返回None数组的结果。我做错了什么？我使用的tensorflow版本是1.13.0。实现的算法是一个OnPolicy DQN (不是通常的DQN)，所以我不使用目标网络(在传统的DQN代码中，它被用作行为网络)。因此，我想区分误差，在下面的代码中，误差被定义为Y(它是R+γ* max_a Q(s'，a'))和Q(s，a)的小批量均方误差。 import gym import numpy as n

浏览 36提问于2019-04-10得票数 3

回答已采纳

1回答

使用无外部库的Q学习模型

、、、、

我正在尝试在一个基于吃豆人的游戏中使用强化学习。我想使用Q学习技术来生成我的代理的操作。我计划使用openai-gym和keras库来训练我的模型，但我希望有一种方法可以保存我的模型并使用它，而不使用open-gym和keras库(在它被训练之后)。据我所知，Q学习可以用来生成状态-动作对，我想知道是否可以将这些组合的所有可能组合保存到Pacman这样的可解系统中。这似乎有点不切实际，所以如果你有任何其他想法，我很想听听。

浏览 2提问于2019-04-08得票数 0

1回答

使用Tune时，工作进程会提前结束

我正在努力学习调子的基础知识。在下面的脚本中，我期望每个worker运行100次迭代，然后结束，然而，worker在达到100次迭代之前结束，状态为3( TypeError？)。我没有看到任何错误消息，所以我可能会对实际应该发生的事情感到困惑。在10个样本中，只有2个达到了100次迭代。其余的样本在5到16次迭代之间。 """Testing Tune with CartPole.""" import ray from ray import tune from ray.tune.schedulers import AsyncHyperBandSch

浏览 22提问于2020-05-14得票数 2

回答已采纳

1回答

Q学习的神经网络体系结构

、、、

问题：，获得正确的体系结构和超参数的正确方法是为简单的网格游戏获得合适的神经网络吗？它如何被缩放，使它在一个更大的网格游戏版本中工作呢？上下文：大多数关于在Q学习中使用神经网络的教程和论文都使用卷积神经网络来处理来自不同游戏的屏幕输入。但我正在尝试一种简单得多的原始数据游戏：，其中代理的可能移动是:上、下、右、左。有完整代码的笔记本可以在这里找到：所有测试的神经网络都没有比随机移动取得更好的效果。在大约1000集之后，奖励上升到平均8.5分(满分30分)，然后开始下降。大多数情况下，每一次行动都是垃圾邮件。我知道对于这样的小游戏，Q表会取得更好的效果，但这是为了学习实现深度Q学习，然

浏览 1提问于2017-08-09得票数 1

1回答

从集群服务多种深度学习模式

、、、

我在考虑如何部署多个模型以供使用。我现在处理的是tensorflow。我指的是和的文章。但是我找不到任何目标需要服务于几种模型的文章。Q.1.是否为单机提供服务模式？有没有办法设置一组运行tensorflow服务的机器？这样，多台机器就可以在某种程度上充当主从工作的同一模型，或者说，在为不同的模型服务时，它们之间的负载平衡。 Q.2.对于其他深度学习框架是否存在类似的功能，比如keras、mxnet等等(不仅仅局限于来自不同框架的tensorflow和服务模型)？

浏览 1提问于2018-12-12得票数 0

1回答

Tensorflow Keras中的水印二值分类器

、、、、

我的目标是创建一个模型，该模型可以根据是否存在一个特定的水印来对图片进行分类。如果我想检查一个不同的水印，理想情况下，它将创建另一个数据集与新的水印，并重新训练模型。据我所知，这是一个二进制分类器。这样做对吗？我被困在我的模型，以确定一个图片上是否有水印。我的指标不会从。示例： loss: 0.6931 - accuracy: 0.5000 - val_loss: 0.6931 - val_accuracy: 0.5000 我已经准备了一个数据文件夹结构，类似于：培训 WatermarkNo_watermark 验证 WatermarkNo_watermark 我使用了一个数据集，每个类

浏览 2提问于2021-05-12得票数 0

回答已采纳

1回答

在Python Keras中正确实现迁移学习的问题

、、、

我有一个作业，我必须在虹膜图像上使用迁移学习(数据集非常小。这是一个简单的赋值)。任务是建立一个正则化的NN来将图像分类到它们各自的类中。我的完整代码如下： import keras from keras.preprocessing.image import ImageDataGenerator #importing images trhrough ImageDataGenerator train_gen = ImageDataGenerator(rescale = 1./255, shear_range = 0.2, zoom_range = 0.2, horizontal_flip

浏览 0提问于2020-06-25得票数 0

2回答

深Q网络中的Q-学习方程

、、、、

我对强化学习一点也不熟悉，所以我可能错了。我的问题是： Q-学习方程( Q(s, a) = r + y * max(Q(s', a')) )是否仅用于计算损失函数？这个方程是反复出现的吗？假设我使用DQN来玩Atari突破，可能的状态数很大(假设状态是单个游戏的框架)，所以创建所有q值的矩阵是不有效的。方程应该更新给定状态的q值，动作对，那么在DQN的情况下它会做什么呢？它会递归地称自己吗？如果需要，则不能计算该表达式，因为递归永远不会停止。我已经试图找到我想要的东西，我看过很多教程，但是几乎每个人都没有显示背景，只是使用Python库(比如Keras )

浏览 1提问于2018-05-29得票数 2

回答已采纳

1回答

TensorFlow联邦:带有自定义学习算法的Keras模型

、、、

教程描述了如何从keras模型构建TFF计算。教程描述了如何从头构建自定义TFF计算，可能使用自定义联邦学习算法。我需要的是其中的一个组合:我想要构建一个定制的联邦学习算法，并且我想使用一个现有的keras模型。Q.，怎么做呢？第二个教程需要基于MODEL_TYPE的MODEL_SPEC，但我不知道如何获得它。我可以在model.trainable_variables中看到一些变量(其中有model = tff.learning.from_keras_model(keras_model, ...)，但我怀疑这是我所需要的。当然，我可以手动实现这个模型(如第二个教程中的那样)，但是我想避免

浏览 1提问于2020-09-24得票数 0

1回答

使用不同的损失函数训练预训练的自定义模型

、、、、

在TF2 keras中，我使用tensorflow.keras.losses.MeanSquaredError作为损失函数训练了一个自动编码器。现在，我想通过使用另一个损失函数来进一步训练这个模型，特别是tensorflow.keras.losses.KLDivergence。这样做的原因是，最初的无监督学习是针对表征学习进行的。然后，有了生成的嵌入，我可以对它们进行聚类，并将这些聚类用于自我监督，即标签，从而实现第二个监督损失，并进一步改进模型。这本身并不是转移学习，因为没有新的层添加到模型中，只是损失函数改变了，模型继续训练。我尝试使用带有MSE损失的预训练模型作为新模型的属性： c

浏览 28提问于2021-02-01得票数 0

2回答

解释nvidia-smi的结果

、

Every 1.0s: nvidia-smi Tue Feb 20 12:49:34 2018 Tue Feb 20 12:49:34 2018 +------------------------------------------------------------------

浏览 0提问于2018-02-20得票数 10

回答已采纳

1回答

在转移学习之后进行微调

、、、、

我读过关于CNN的微调和转移学习的文章，并且想知道我们是否可以在相同的CNN上使用转移学习之后进行微调？如果是这样的话，这会提高模型的性能还是降低模型的性能？

浏览 0提问于2018-01-10得票数 2

1回答

a3c中的收敛问题

、、、

我在keras中构建了一个A3C实现，它使用以下引用：，我使用的是自定义环境，其中代理可以选择购买某些项目，根据其价格作为状态出售或交换。好的交易会得到积极的回报，坏的交易会得到负面的回报。我过去曾在DQN上测试过它，它成功地收敛，取得了很好的效果。但是当我在A3C中使用相同的环境时，它会导致模型一次又一次地选择相同的操作。我试着换了一些超级护理人员，但没有结果。我还尝试使用目标模型并每n集更新一次，这使我与健身房CartPole环境更好地趋同，但在我的自定义环境中仍然对我的模型的性能没有影响。我在reddit上发现了一些关于同一个问题的讨论，但没有人回答。

浏览 0提问于2018-06-21得票数 0

回答已采纳

1回答

FailedPreconditionError:从容器: localhost读取资源变量时出错。在自定义丢失函数上运行sess.run()时

、、、、

我有一个使用TensorFlow 1运行Keras的代码。代码修改损失函数以进行深入强化学习： import os import gym import numpy as np import pandas as pd import matplotlib.pyplot as plt env = gym.make("CartPole-v0").env env.reset() n_actions = env.action_space.n state_dim = env.observation_space.shape from tensorflow import keras impo

浏览 0提问于2020-04-13得票数 1

回答已采纳

2回答

Q-学习价值过高

、、、

我最近尝试在Golang实现一个基本的Q-学习算法。请注意，我是新的强化学习和人工智能在一般，所以错误很可能是我的。下面是我如何实现m，n，k-游戏环境的解决方案:在每个给定的时间( t )，代理保存最后一个状态动作(s, a)和获得的奖励；该代理根据Epsilon贪婪策略选择一个move a'，并计算奖励r，然后继续更新时间t-1的Q(s, a)值。 func (agent *RLAgent) learn(reward float64) { var mState = marshallState(agent.prevState, agent.id) var oldVa

浏览 1提问于2016-05-30得票数 4

回答已采纳

2回答

keras对指标或损失进行优先排序？

、、

我正在努力理解keras模型是如何工作的。当我们训练模型时，我们给出指标(如“准确性”)和损失函数(如交叉熵)作为参数。我想知道的是模型优化的目标是什么。拟合后，leant模型最大限度地提高了准确性？或者最大限度地减少损失？

浏览 30提问于2020-10-27得票数 0

1回答

Keras: model.inputs在VGG16中是什么

、、

我最近开始玩keras和vgg16，我正在使用keras.applications.vgg16。但是这里我提出了一个关于什么是model.inputs的问题，因为我看到其他人在中使用它，尽管它没有初始化它。 ... input_img = model.input ... layer_output = layer_dict[layer_name].output if K.image_data_format() == 'channels_first': loss = K.mean(layer_output[:, filter

浏览 0提问于2018-11-20得票数 2

回答已采纳

1回答

重新训练用于机器学习的Inception V3模型

、、、、

我正在使用Inception V3模型对两个类进行图像分类。因为我使用了两个新的类(正常和异常)，所以我冻结了初始V3模型的顶层，并用我自己的替换它。 base_model = keras.applications.InceptionV3( weights ='imagenet', include_top=False, input_shape = (img_width,img_height,3)) #Classifier Model ontop of Convolutional Model model_top = keras.

浏览 0提问于2018-08-23得票数 1

1回答

在tf.keras模型训练期间，无法找到可减少输出时间的可调参数

、、

在训练tf.keras (1.14)模型时，我一直看到这样的警告： Failed to find a tunable parameter that would decrease the output time. This means that the autotuning optimization got stuck in a local maximum. The optimization attempt will be aborted. 训练会一直持续下去，直到永远。有谁知道我如何捕捉这个警告并抛出一个错误，这样我就不需要永远训练模型了吗？

浏览 0提问于2020-03-04得票数 3

1回答

为什么即使我使用的是预先训练过的模型，验证的准确性也很低？

、、、、

我试图在google上对10种鸟类进行分类，使用一个来自tensorflow中心的预先训练模型，该模型已经对964种鸟类进行了培训。但是当我训练它的时候，它的准确性并没有我想象的那么高。损失也相当大。我不确定我在进口模型时是否做错了什么。由于某种原因，当我查看model.summary()时，KerasLayer的参数#显示为0。为什么会这样呢？我已经把我所有的代码附在下面。 import numpy as np import tensorflow as tf from tensorflow import keras from keras.preprocessing.i

浏览 23提问于2022-09-14得票数 0

1回答

跳过keras中预训练模型的连接

、、

因此，我目前正在下面的论文https://openaccess.thecvf.com/content_cvpr_2018/papers/Oh_Fast_Video_Object_CVPR_2018_paper.pdf中实现该模型如下模型所示，他们在被标记为暹罗编码器的模型Model's Image中使用了2个resnet50 我使用了Keras提供的resnet50模型，代码如下： input_shape = (480,854,4) inputlayer_Q = Input(shape=input_shape, name="inputlayer_Q") convla

浏览 22提问于2021-08-22得票数 1

回答已采纳

1回答

Keras模型中的分层学习率

、、、

在keras模型中，可以在编译时设置模型的学习速率，例如， model.compile(optimizer=Adam(learning_rate=0.001), loss=...) 这将为模型中的所有层设置相同的学习速率，但如何为模型的每一层设置不同的学习速率？像这样，第一层: 0.001 第2层: 0.05 第3层: 0.02 等。我如何在keras中做到这一点？或在tf.keras中

浏览 46提问于2022-02-06得票数 3

回答已采纳

1回答

target_f是如何在Keras解决方案中更新到深度Q学习Cartpole/Gym算法的？

、、、、

CartPole游戏有一个流行的解决方案，使用Keras和深度Q-学习：https://keon.github.io/deep-q-learning/ 但是有一行代码让人困惑，同一篇文章中也问过同样的问题，很多人都很困惑，但没有一个完整的答案。他们基本上是建立一个主网络，但也是一个目标网络，试图接近Q函数。在代码的这一部分中，它们将从缓冲区重放以训练目标网络： # Sample minibatch from the memory minibatch = random.sample(self.memory, batch_size) # Extract informations from e

浏览 0提问于2020-02-01得票数 2

回答已采纳

1回答

相同的神经网络结构给出了张量流和角点的不同精度

、、、

利用4，4个隐层对虹膜数据集进行训练，在tensorflow和keras中分别建立神经网络，得到了不同的结果。 tensorflow模型的测试准确率为96.6 %，而keras模型的准确率仅为50%左右。在这两种情况下，学习率、优化器、小批数等各种超参数是相同的。 Keras模型 model = Sequential() model.add(Dense(units = 4, activation = 'relu', input_dim = 4)) model.add(Dropout(0.25)) model.add(Dense(units = 4, activation =

浏览 0提问于2018-06-20得票数 2

2回答

基于测试运行的Keras模型优化可能吗？

、、、

我对Keras/Tensorflow字段有点陌生，目前正在尝试通过使用已有的教程模型来学习keras，然后尝试对它们进行修改。我选择了一个图像分类任务，因为这是我所需要的，因为如果我有足够的时间去处理所有的事情;) 情景：，我收集了20k的室内和室外公寓和房屋的照片，把它们分类为室内/室外图片。我使用并逐步修改的模型现在的准确度为95.2%，但我想尝试达到一个更高的精度。问题：在我的PC上运行，大约需要24小时才能运行50个历次的训练和测试，批量大小为128个，图片为256x256。这意味着，对模型的修改是否会导致结果的合理改进，这就需要无尽的检查。例如，较低的批次大小，较小的图片或较少的

浏览 3提问于2020-12-31得票数 0

回答已采纳

1回答

tensorflow后端在keras中使用learning_phase？

、、、、

我正在尝试使用tensorflow中的keras后端来训练resnet网络。每个批处理更新的提要字典如下所示： feed_dict= {x:X_train[indices[start:end]], y:Y_train[indices[start:end]], keras.backend.learning_phase():1} 我使用的是keras (keras.backend.set_session(sess))，因为原始的resnet网络是用keras定义的。由于该模型包含了辍学和batch_norm层，因此需要一个学习阶段来区分训练和测试。我观察到，当我设置keras.backe

浏览 0提问于2018-03-07得票数 9

1回答

模型不收敛于分布

、、、

我仍然是keras和玩它的初学者。我现在的目标是让一个模型学习一个分布。为此，我选择了numpy beta分布函数。我的目标是让模型学习beta分布，并判断一个值是否在其中。所以我制作了一个带有5000个beta/rect值的csv，该模型应该从中学习。但是，当模型在学习时，它绝对没有变化。似乎我有一个错误的方法来解决我的问题，或者它不能以这种方式解决。我试过改变模型，但似乎行不通。 data_size = 5000 X = np.zeros((data_size, 2)) Y = np.zeros((data_size, 1)) for i in range(np.size(X,

浏览 27提问于2019-05-09得票数 0

2回答

如何在没有GPU的情况下为深度学习模型服务

、、

由于节省了成本，我使用常规CPU运行深度学习模型。完成一个请求需要10秒，并且它是用python编写的。我正在考虑通过使用java、C++或rust来提高性能。是否有任何现有的rust框架来选择深度学习模型。

浏览 1提问于2020-08-12得票数 0

2回答

Keras -是否可以在Tensorboard中查看模型的权重和偏差

、、、

我刚刚开始使用Keras，并构建了一个Q学习示例程序。我创建了一个tensorboard回调函数，并将其包含在对model.fit的调用中，但TensorBoard中只显示了损失的标量摘要和网络图。有趣的是，如果我打开图中的密集层，我会看到一个标记为"bias_0“的小摘要图标和一个标记为"kernel_0”的摘要图标，但我没有看到这两个图标出现在TensorBoard的分布或直方图选项卡中，就像我在纯tensorflow中构建模型时一样。要在Tensorboard中启用这些功能，我还需要做些什么吗？我是否需要查看Keras生成的模型的详细信息并添加我自己的tensor_su

浏览 1提问于2017-05-09得票数 20