--我指的是下面的链接,以便在Script方法中使用Tensorboard .
https://www.tensorflow.org/tensorboard/get_started
下面的是我的训练脚本中的tensorboard回调,它是一个.py文件
model = create_model()
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
log_dir = "logs/fit/" + datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
model.fit(x=x_train,
y=y_train,
epochs=5,
validation_data=(x_test, y_test),
callbacks=[tensorboard_callback])
在笔记本中,我正在创建下面的Tensorflow估计器,在这里我将上面的脚本文件名传递为entry_point.。
estimator = TensorFlow(
entry_point='Script_File.py',
train_instance_type=train_instance_type,
train_instance_count=1,
model_dir=model_dir,
hyperparameters=hyperparameters,
role=sagemaker.get_execution_role(),
base_job_name='tf-fashion-mnist',
framework_version='1.12.0',
py_version='py3',
output_path=<S3 Path>,
script_mode=True,
)
我正在使用笔记本中的以下代码开始培训.
estimator.fit(inputs)
一旦完成训练,我将在终端中使用下面的代码(在我的笔记本单元中也尝试过)来启动tensorboard.。
tensorboard --logdir logs/fit
但是在拉伸板上,我不能看到任何图形。它正在显示消息“未能获取运行”。我遗漏了什么吗?或者我需要在我的脚本中做任何额外的设置才能在Tensorboard中看到我的日志?
发布于 2020-11-26 08:45:18
你的拉伸板logdir
不是logs/fit
。但有最新的日期。尝试使用logs/fit
作为log_dir
,看看它是否有效。
编辑
如果您想在本地使用张量板,则必须将张力板日志发送到S3并从中读取。为了做到这一点,您必须执行您的第三个链接示例所做的工作,因此请包含sagemaker调试器:
从sagemaker.debugger导入TensorBoardOutputConfig
tensorboard_output_config = TensorBoardOutputConfig( TensorBoardOutputConfig)
然后,您的tensorboard命令将如下所示:
AWS_REGION= AWS_LOG_LEVEL=3张量板--logdir S3://path/for/ tensorboard /data/发
或者,如果您想要在笔记本中使用张力板,则必须执行第二个链接示例所做的操作,因此只需在单元格中安装,然后运行张力板,如下所示:
https:///proxy/6006/
https://stackoverflow.com/questions/64909903
复制相似问题