如何使用经过训练的BERT模型检查点进行预测？_如何对这个经过训练的模型进行预测？_如何使用经过训练和存储的tensorflow模型进行预测 - 腾讯云开发者社区

、、、、

我有基于BERT的模型检查点，这是我在Tensorflow中从头开始训练的。我如何使用这些检查点来预测给定句子中的掩蔽词？例如，假设句子是，"CLS abc pqr MASK xyz SEP“，我想预测掩码位置的单词。我该怎么做呢？我在网上搜索了很多，但每个人都在使用BERT来完成特定于任务的分类任务。而不是使用BERT来预测被屏蔽的单词。请帮我解决这个预测问题。我使用create_pretraining_data.py创建数据，并使用官方BERT存储库(https://github.com/google-research/bert)中的run_pretraining.py从

浏览 24提问于2019-09-11得票数 0

1回答

加载BertModel时发出警告

、、、、

我使用以下代码片段加载了一个BERT模型： name = "bert-base-uncased" from transformers import BertModel from transformers import BertTokenizer print("[ Using pretrained BERT embeddings ]") self.bert_tokenizer = BertTokenizer.from_pretrained(name, do_lower_case=l

浏览 4提问于2022-03-30得票数 -1

1回答

使用Cloud恢复更新的BERT模型检查点时出现InfeedEnqueueTuple问题

、、、

如果您能在以下方面提供任何帮助，我将不胜感激。我制作了一份的副本，并使用Cloud和Bucket训练了团队数据集。对dev集的预测是可以的，因此我在本地下载了检查点、model.ckpt.meta、model.ckpt.index和model.ckpt.data文件，并尝试使用代码进行还原： sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True)) saver = tf.train.import_meta_graph(META_FILE) # META_FILE being path to .meta saver.r

浏览 1提问于2018-11-16得票数 3

回答已采纳

2回答

在Python中加载和使用经过训练的TensorFlow模型

、

我使用tf.estimator应用编程接口(更具体地说是使用tf.estimator.train_and_evaluate )在TensorFlow中训练了一个模型。我有训练的输出目录。如何从这里加载我的模型并使用它？我尝试通过加载最新的ckpt文件并恢复会话来使用tf.train.Saver类。但是，要调用sess.run()，我需要知道图的输出节点的名称，以便将其传递给fetches参数。名称是什么/如何访问此输出节点？有没有更好的方法来加载和使用经过训练的模型？请注意，我已经训练了模型并将其保存在ckpt文件中，因此请不要建议我使用simple_save函数。

浏览 16提问于2019-02-02得票数 0

1回答

保存用于tensorflow服务的自定义tf.estimator训练模型

、、、

如果我有一个使用自定义估计器的tensorflow模型，我如何保存该模型，以便可以将其部署到生产环境中。 https://colab.research.google.com/github/google-research/bert/blob/master/predicting_movie_reviews_with_bert_on_tf_hub.ipynb#scrollTo=JIhejfpyJ8Bx 我正在使用的模型类似于这个模型，我想知道如何在模型经过训练后保存它。我尝试过使用Savedmodel和使用检查点进行恢复，但两者都不成功(无法将其调整为适用于此示例)

浏览 5提问于2019-03-22得票数 0

2回答

如何使用经过训练的BERT模型检查点进行预测？

、、、、

我用小队2.0训练了BERT，并使用BERT-master/run_squad.py在输出目录中获得了model.ckpt.data、model.ckpt.meta、model.ckpt.index (F1分数: 81)以及predictions.json等 python run_squad.py \ --vocab_file=$BERT_LARGE_DIR/vocab.txt \ --bert_config_file=$BERT_LARGE_DIR/bert_config.json \ --init_checkpoint=$BERT_LARGE_DIR/bert_model.c

浏览 80提问于2019-06-28得票数 5

回答已采纳

1回答

如何使用经过训练和存储的tensorflow模型进行预测

、、

我有一个现有的经过训练的模型(特别是tensorflow word2vec https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/udacity/5_word2vec.ipynb)。我很好地恢复了现有的模型： model1 = tf.train.import_meta_graph("models/model.meta") model1.restore(sess, tf.train.latest_checkpoint("model/")) 但我不知道如何使用新加载(和训练

浏览 22提问于2019-01-31得票数 0

回答已采纳

1回答

无法从tensorflow检查点读取finetuning

、、、

我正在尝试使用一个预先训练的伯特模型，用SST2数据处理器进行微调。但是当我给出预训练模型的检查点时，它显示的是“在检查点中找不到密钥output_bias”。我想这可能是因为预先训练过的伯特模型检查站出了差错。所以我又做了一次训练。但是，我仍然面临着同样的问题。 TASK = 'STS' #@param {type:\"string\"} TASK_DATA_DIR = 'glue_data/STS-B/'# + TASK output_dir = 'trained_model/observation' tf.gfile.M

浏览 0提问于2019-08-19得票数 1

1回答

如何检验Tensorflow LinearClassifier的特征权重？

、、、、

我正在努力理解文档。这些文档激励这些模型如下：线性模型比神经网络更容易解释和调试。，您可以检查分配给每个特性的权重，以找出对预测影响最大的因素。因此，我从附带的中运行了扩展代码示例。特别是，我运行时，model-type标志设置为wide。它正确地运行并生成了accuracy: 0.833733，类似于Tensorflow网页上的accuracy: 0.83557522。该示例使用tf.estimator.LinearClassifier来训练权重。然而，与所引用的能够检查权重的动机相比，我无法找到任何函数来实际提取中经过训练的权重。问题：如何访问tf.estimator.Li

浏览 5提问于2017-09-09得票数 2

回答已采纳

1回答

将BERT模型作为泡菜文件保存在磁盘上

、

我已经设法让伯特模型工作在约翰斯诺实验室-火花-nlp库。我能够将“经过训练的模型”保存在磁盘上，如下所示。拟合模型 df_bert_trained = bert_pipeline.fit(textRDD) df_bert=df_bert_trained.transform(textRDD) 保存模型 df_bert_trained.write().overwrite().save("/home/XX/XX/trained_model") 然而，首先，根据这里的文档，可以将模型加载为 EmbeddingsHelper.load(path, spark, format, r

浏览 2提问于2020-01-23得票数 1

2回答

Tensorflow Slim恢复模型及预测

、、、、

我目前正在努力学习如何使用this，并遵循本教程：。假设我已经在检查点中保存了一个经过训练的模型，那么现在如何使用该模型并应用它呢？例如，在本教程中，我如何使用经过训练的MNIST模型，并在一组新的MNIST图像中提供信息，并打印预测？

浏览 5提问于2017-05-23得票数 2

回答已采纳

1回答

用Tensorflow vs PyTorch实现BERT

、、

BERT是Google开发的NLP模型。最初的BERT模型是由TensorFlow团队建立的，也有一个使用PyTorch构建的BERT版本。这两种模式的主要区别是什么？

浏览 0提问于2020-05-07得票数 1

回答已采纳

1回答

是否有任何方法来加速tensorflow格子的预测过程？

、、、、

我用tensorflow格子中的Keras预先制作的模型，使用python3.7构建了自己的模型，并保存了经过训练的模型。然而，当我使用经过训练的模型进行预测时，预测每个数据点的速度都在毫秒级，这似乎非常缓慢。有什么方法可以加快tfl的预测过程吗？

浏览 0提问于2021-04-21得票数 0

回答已采纳

1回答

基于BERT和Keras神经网络的文本分类

、、、、

我试图使用BERT运行一个二进制监督的文本分类任务，但我不知道如何做到这一点。我试着用拥抱Face ()库运行BERT，但是我不知道如何处理进程的输出。经过大量的互联网搜索，我最终得到了以下课程(根据的说法)： class BertTransformer(BaseEstimator, TransformerMixin): def __init__(self): self.tokenizer = BertTokenizer.from_pretrained("bert-base-uncased") self.model = BertMode

浏览 3提问于2021-02-03得票数 0

2回答

如何从本地/colab目录加载预培训的BERT模型？

、

嗨，我从这里下载了伯特预培训模型(https://storage.googleapis.com/bert_模型/2018年_10_18/外壳_L-12_H-768_A-12.zip)，并保存到gogole colab和本地的一个目录中。当我试图在colab中加载模型时，得到“我们假设”/content/驱动器/My Drive/bert_training/uncased_L-12_H-768_A-12/config.json“。尝试在局部机器上对模型进行laod，得到相同的误差。我就是这样加载模型的:从变压器导入BertForMaskedLM BertForMaskedLM 这是正确的方式

浏览 0提问于2019-12-06得票数 5

回答已采纳

1回答

保存和加载RL模型- DQN算法

、、

我正在使用DQN算法训练一个RL模型。在每次迭代时，我将模型保存如下： agent = dqn.DQNTrainer(env=CustomEnv,config=config) for n in range(100): result = agent.train() agent.save() 我想在不同的环境中使用经过训练的RL模型。我不知道如何在不同的环境中加载检查点并进行评估。我尝试加载经过训练的模型(最后一个检查点)，但它抛出了一个错误。我所做的工作如下： agent.restore('./RL_saved/checkpoint-100.tune_metad

浏览 21提问于2022-10-07得票数 1

回答已采纳

1回答

如何将经过训练的KNN分类模型应用于新数据？

、、、

我试图完成一个分类项目，在那里使用KNN算法，工作非常好。然而，问题是，我已经训练了模型，并将其保存为RDS文件。我想知道如何将模型应用于一些新的数据？例如，对于回归，您可以使用函数predict()，其中它使用已经训练过的模型作为参数，而对于knn()，它只使用训练过的数据集和测试数据集，并且没有办法使用已经训练过的knn模型作为参数，而不是使用火车数据集。有什么函数可以用经过训练的knn模型作为依据来预测新数据的分类吗？

浏览 4提问于2022-05-10得票数 -1

1回答

如何使用预先训练过的模型进行文本分类？精调模型与预训练模型的比较

、、

我想知道微调后的模型与不经过精细调整的模型相比有多大的改善，我想比较一下预先训练的模型( BERT)和通过对文本分类的预训练模型进行微调所获得的模型(微调BERT )的性能，我知道如何微调BERT来进行文本分类，但不太清楚如何直接使用BERT来实现classification.what呢?下面是微调模型的代码，如何重写它以直接使用经过培训的模型。  from transformers import BertTokenizer, BertModel import torch import torch.nn as nn im

浏览 12提问于2022-08-05得票数 0

1回答

CNN训练模型未正确保存

、、、、

我是一个使用tensorflow的新手，我建立了一个CNN，它经过训练和测试，准确率都达到了80-85%。我尝试使用model.save('example.h5')保存经过训练的模型，并使用files.download('example.h5')下载文件之后，我尝试使用model = tf.keras.models.load_model('example.h5')将其加载到我的flask后端。当我尝试对随机图像使用它时，感觉该模型以前从未训练过。有什么解决方案吗？谢谢

浏览 13提问于2020-06-19得票数 0

2回答

在小型定制语料库上预训练语言模型

、、、、

我很好奇是否可以在文本生成中使用迁移学习，并对特定类型的文本进行再培训/预训练。例如，有一个经过预先训练的BERT模型和一个小型的医学语料库(或任何“类型”)文本，就可以生成一个能够生成医学文本的语言模型。假设你没有大量的“医学文本”，这就是为什么你必须使用转移学习。我把它说成是一条管道，我把它描述为：使用经过预先训练的伯特装置。从我的新文本中获取新的标记，并将它们添加到现有的经过预先培训的语言模型中(例如，vanilla BERT)。使用组合标记器在自定义语料库上重新训练预训练的BERT模型。在小型定制语料库中生成类似于文本的文本。这听起来耳熟吗？抱着脸

浏览 5提问于2020-04-24得票数 7

1回答

如何在本地环境中部署亚马逊网络服务SageMaker线性学习者模型

我已经使用内置的线性学习算法训练了一个亚马逊网络服务SageMaker模型。我可以从S3下载经过训练的模型工件(model.tar.gz)。如何在独立于AWS的本地环境中部署模型，以便在没有互联网接入的情况下进行预测和推断呼叫？

浏览 6提问于2018-08-10得票数 0

7回答

为什么译码器不是伯特架构的一部分？

、、、

我看不出伯特是如何在不使用解码器的情况下做出预测的，这是之前所有模型的一部分，包括变压器和标准RNN。如何在不使用解码器的情况下在BERT体系结构中进行输出预测？怎么才能完全消除解码器呢？换句话说，我可以用什么解码器和伯特一起生成输出文本？如果BERT只编码，我可以使用什么库/工具从嵌入解码？

浏览 0提问于2019-12-21得票数 22

回答已采纳

2回答

我的CNN图像分类模型给出了很好的预测，除了2类。我该怎么办？

、

我为包含6个类的数据集构建了一个CNN图像分类器。数据集在所有6个类中都是平衡的。经过训练，该模型在除2类外的所有类中都具有较好的预测精度。为了进一步解释，让我们用从'0‘到'5’之间的整数来标记这6个类。经过训练的模型能很好地预测从'0‘到'3’之间的类。但几乎5%-10%的4级图像被预测为5级，5%-10%的5级图像被预测为4级。我该如何处理这种情况呢？

浏览 0提问于2022-05-31得票数 1

1回答

如何将一个样本文本输入到预先训练的LSTM模型中

、、、、

我正在尝试做有毒评论分类。我在中找到了一个数据集。它有许多注释，并为标签类"severe_toxic“..etc提供了相应的值。我希望将我的单个文本输入分类到相应的标记类中。我用LSTM创建并训练了一个模型。现在我想给出一个单一的文本句子作为模型的输入来预测输出。但我不知道如何转换文本输入，并将其提供给经过训练的模型。源代码已从获得.

浏览 2提问于2020-02-25得票数 0

回答已采纳

1回答

如何使用BERT模型回答lQuestions的主观/描述类型？

、、、、

我正在尝试实现BERT模型来完成问答任务，但它与现有的问答模型略有不同，它将给出一些文本(3-4页)，并将根据文本被问到问题，预期的答案可以是简短的或描述性的主观类型。我试着为这个任务实现伯特。我面临的问题：，的输入令牌限制是512。如何得到长形式的答案，可以描述任何实例、过程、事件等。

浏览 6提问于2022-12-02得票数 0

1回答

rllib -从检查点获取TensorFlow或PyTorch模型输出

、、、

我想在不同的代码中使用经过rllib训练的策略模型，在那里我需要跟踪为特定输入状态生成的操作。使用标准的TensorFlow或PyTorch (首选)网络模型可以提供这种灵活性，但我找不到关于如何从经过训练的rllib代理生成可用的dat或H5文件的明确文档，然后我可以将其加载到torch或tf/Keras模型中。

浏览 38提问于2020-08-23得票数 1

3回答

“BertEmbeddings”对象在转换tf检查点时没有属性‘偏差’

、、、、

当尝试转换自我训练的tensorflow BERT模型(使用谷歌的脚本)的检查点时，使用Huggingface的将检查点转换为Py手电筒模型。我最后总是出现以下错误：AttributeError：'BertEmbeddings‘对象没有属性’偏向‘ init_vars名称(仅仅是第一个名称)如下所示： ['bert/embeddings/layer_normalization/beta', 'bert/embeddings/layer_normalization/beta/adam_m', 'bert/embeddings/layer_norm

浏览 8提问于2020-09-01得票数 0

1回答

通过TF-hub导入后冻结BERT层并对其进行训练？

、

我将在这里描述我的意图。我想通过tf-hub函数hub.module(bert_url，trainable = True)导入BERT预训练模型，并将其用于文本分类任务。我计划使用一个大型语料库来微调BERT的权重，以及几个输入为BERT输出的密集层。然后我想冻结BERT的层，只训练BERT之后的致密层。我怎样才能有效地做到这一点呢？

浏览 25提问于2020-03-29得票数 0

1回答

通过Huggingface转换器更新BERT模型

、、、、

我正在尝试使用内部语料库更新预训练的BERT模型。我看过Huggingface的transformer文档，你会发现我有点困惑，below.My的目标是使用余弦距离计算句子之间的简单相似度，但我需要为我的特定用例更新预先训练的模型。如果你看一下下面的代码，这正是Huggingface文档中的代码。我试图“重新训练”或更新模型，我假设special_token_1和special_token_2表示来自我的“内部”数据或语料库的“新句子”。这是正确的吗？总而言之，我喜欢已经预训练的BERT模型，但我想使用另一个内部数据集来更新或重新训练它。任何线索都将不胜感激。 import tensorfl

浏览 53提问于2019-10-30得票数 9

4回答

如何将经过训练的Tensorflow模型转换为Keras？

、

我有一个经过训练的Tensorflow模型和权向量，它们分别被导出到protobuf文件和权值文件中。我如何将这些转换成JSON或YAML和HDF5文件，这些文件可以被Keras使用？我有Tensorflow模型的代码，所以将tf.Session转换为keras模型并将其保存在代码中也是可以接受的。

浏览 5提问于2017-06-09得票数 27

回答已采纳

1回答

使用领域文本预训练BERT/RoBERTa语言模型，估计需要多长时间？哪个更快？

、、

我想使用领域语料库(情感相关文本)预训练BERT和RoBERTa传销。使用50k~100k单词需要多长时间。由于RoBERTa没有经过训练来预测下一个句子的目标，比BERT少一个训练目标，并且具有更大的小批量和学习率，我假设RoBERTa会快得多？

浏览 28提问于2020-02-09得票数 1

回答已采纳

1回答

具有不同嵌入尺寸的经过训练模型上的resize_token_embeddings

、、、、

我想问一下如何改变经过训练的模型的嵌入大小。我有一个训练有素的模特models/BERT-pretrain-1-step-5000.pkl。现在，我将向令牌添加一个新的令牌[TRA]，并尝试将resize_token_embeddings使用到已接收的令牌。 from pytorch_pretrained_bert_inset import BertModel #BertTokenizer from transformers import AutoTokenizer from torch.nn.utils.rnn import pad_sequence import tqdm token

浏览 52提问于2022-06-27得票数 2

回答已采纳

1回答

谷歌AI平台上的JupyterLab笔记本在进行预测时超低速

、、、、

我已经上传了一个经过训练的tensorflow v2模型到谷歌AI平台上，以便对看不见的数据进行预测。这些数据以分片的形式存储在Google Cloud Storage中，每个分片大小为300 MB。我使用笔记本电脑对数据进行预处理，效果很好。当对预处理的数据进行预测时，它是有效的，但它是超低的，对于一个300MB的文件来说，大约需要90分钟。我得到了相当多这样的碎片，所以我必须找到一种方法来加快速度。我在cpu，RAM，甚至gpu方面尝试了不同的笔记本配置，但它在预测运行时没有什么不同。我是不是遗漏了什么？任何想法都是非常感谢的！

浏览 1提问于2019-11-19得票数 1

1回答

多位数检测

、、、

这个问题是关于检测单个图像中有多个数字的数字。我在tensorflow有一个经过训练的模型，使用深层CNN进行图像识别。培训是在只有一个数字和标签的裁剪图像上进行的。现在，任务是使用这个经过训练的模型从图像中识别任何数字。我希望这个模型能适用于任意大小的数字。那么，我如何从要预测的图像中提取某些特征，以便能够检测到单个数字。作为参考，这是google研究论文的链接，尽管它没有详细说明这个问题。这里是数据这个问题是相似的，但它没有完全回答，因为数字，不，太小，彼此接近。

浏览 0提问于2017-06-21得票数 3

1回答

在ml引擎上部署模型，使用tf.train.Saver()导出

、

我想在新版本的Google引擎上部署一个模型。以前，使用Google，我可以导出经过训练的模型，创建一个tf.train.Saver()，用saver.save(session, output)保存模型。到目前为止，我还没有能够找出导出的模型是否仍然可以在ml引擎上部署，否则我必须遵循描述的培训过程，创建一个新的训练器包，并且必须使用ml引擎来训练我的模型。我仍然可以使用tf.train.Saver()来获得我将部署在ml引擎上的模型吗？

浏览 4提问于2017-03-21得票数 4

回答已采纳

1回答

仅针对嵌入的BERT的无监督微调？

、、

我想在未标记的数据上对特定领域的BERT进行微调，并让输出层检查它们之间的相似性。我该怎么做呢？我是否需要首先微调分类器任务(或问题答案等)。然后拿到嵌入物？或者我可以只使用预训练的Bert模型，而不使用任务，并使用我自己的数据进行微调？

浏览 2提问于2020-04-22得票数 3

3回答

结合两种不同模型(sBERT和mBERT)的句子嵌入

、、

我正在研究一个帮助学生的聊天机器人。因此，我想利用在数学上表现更好的bert模型，这导致了我的数学-bert，但是上面的论文说它仅仅是在数学语料库上训练的，这意味着它在一般句子(例如在图像中)上不会有很好的表现，那么有什么方法将句子-bert和数学-bert结合起来吗？ undefined 或者，唯一的方法是从零开始训练伯特模型，使用语料库进行句子-伯特和数学-伯特。

浏览 0提问于2022-12-25得票数 0

回答已采纳

1回答

基于火花流和机器学习的在线数据实时预测

、、、

如何设计实时事务数据的体系结构，以便将其归类为欺诈？利用Scala和星火MLLib的历史数据开发、训练和测试随机森林分类器ML模型，并进行持久化处理。实时事务数据是利用Apache从一个主题中获取数据，并通过分类器ML模型处理并写入另一个主题进行预测。我关心的是:我如何提供和获得预测的当前事务数据收到从卡夫卡主题使用上述ML模式？使用经过训练和测试的ML模型获得预测的在线当前单事务数据的最佳实践是什么？欢迎任何设计建议。

浏览 1提问于2017-07-30得票数 5

1回答

Albert_base :使用bert-for-tf2调用时没有正确加载ckpt的权重。

、

我想用更多的mlm任务对Albert_base进行微调，但我意识到没有为albert-base提供预训练的ckpt文件。因此，我的计划是将saved_model(或从then加载的模型)转换为检查点，然后使用提供的代码()对albert基进行预培训。在进一步的预培训之前，为了检查对ckpt的转换是否成功，我将ckpt文件重新转换为saved_model格式，并使用bert-for-tf2 ()作为keras层加载它，但是，当我加载重新转换的albert_base时，它的嵌入与从原始albert_base加载的嵌入不同。下面是我如何将原始的saved_model转换为ckpt，然后返回到sa

浏览 7提问于2019-12-17得票数 0

回答已采纳

1回答

Tensorflow - Deep MNIST教程-将分类器导出为C++

、、、

我得到了经过训练的"Deep MNIST Tutorial“NN，并且我知道如何使用TensorFlow Python API测试该模型。现在我想将分类器导出到C++，这样我就可以在没有TensorFlow API的情况下使用它。我知道经过训练的模型拓扑、权重和激活函数。有没有这种实现的例子？我搜索了它，但发现如何在C++中创建和训练NN，而不是分类器示例。提前谢谢。

浏览 3提问于2017-03-23得票数 0

3回答

数据科学模型与培训-理解

、、、、

来自编写代码、测试、部署、运行的编程背景。我试图用数据科学中的“训练模型”或“受过训练的模型”的概念来思考，并部署这个经过训练的模型。我并不真正关心部署环境，自动化等等。我在努力了解部署部队..。受过训练的模特。一个经过训练的模型在文件系统上是什么样子的，它包含什么？我理解训练模型和将一组数据分成训练集和测试集的概念，但是让我说我有一个笔记本(python / jupyter)，我加载了一些数据，在训练/测试数据之间进行分割，并运行一个算法来“训练”我的模型。我的引擎盖下面有什么可交付的？当我训练一个模型的时候，我会想会有一定数量的数据存储在内存中。那么，这是如何成为训练模式的一部分的呢？

浏览 1提问于2018-01-10得票数 0

1回答

如何使用NER脚本继续从检查点进行微调？

我试图使用run_ner.py执行this script，但我试图从检查点继续微调的所有操作都失败了。有什么想法吗？我用Google Colab运行它。以下是我运行的单元格内容： %cd "/content/drive/My Drive/Colab Notebooks/NER/Batteria/transformers-master_2020_04_27" %pip install . %pip install --upgrade . %pip install seqeval from fastai import * from transformers import *

浏览 70提问于2020-04-28得票数 0

1回答

提取的gbm最终模型不返回与训练的gbm模型相同的结果。

、、

我试图使用从经过训练的gbm模型中提取的最终模型，但是提取的模型不像经过训练的模型那样返回分解结果。似乎提取的最终模型是根据返回的值工作的，但它只返回计算值。如何得到作为训练模型的因式分解结果。 library(caret) library(mlbench) data(Sonar) set.seed(7) Sonar$Class <- ifelse(Sonar$Class == 'R', 0, 1) Sonar$Class <- as.factor(Sonar$Class) validation_index <- createDataPartition(S

浏览 0提问于2018-10-25得票数 1

回答已采纳

3回答

tf.train.Saver -在不同的机器上加载最新的检查点

、

我有一个经过训练的模型，它使用tf.train.Saver保存，生成了4个相关文件 checkpoint model_iter-315000.data-00000-of-00001 model_iter-315000.index model_iter-315000.meta 现在，由于它是通过一个码头容器生成的，机器本身和对接器上的路径是不同的，就好像我们在两台不同的机器上工作一样。我试图在容器之外加载保存的模型。当我运行以下命令时 sess = tf.Session() saver = tf.train.import_meta_graph('path_to

浏览 1提问于2018-04-24得票数 2

回答已采纳

1回答

为什么BERT模型必须保持10%的掩码标记不变？

、、

我正在读BERT模型论文。在预训练BERT模型的掩蔽语言模型任务中，本文表示模型将随机选择15%的令牌。在选择的标记( Ti )中，80%将被替换为掩码标记，10%的Ti保持不变，10%的Ti将替换为另一个单词。我认为模型只需要替换为掩码或其他单词就足够了。为什么模型必须随机选择一个单词并保持不变？预训练过程是只预测掩码令牌，还是预测15%的整个随机令牌？

浏览 151提问于2020-09-23得票数 2

回答已采纳

2回答

如何从零开始培训伯特在传销和NSP的新领域？

、、、、

我正在尝试使用我自己的数据集使用HuggingFace库从零开始训练伯特模型。我想训练模型的方式，它有确切的结构，原来的伯特模型。在最初的文章中，它指出：“BERT被训练完成两项任务:预测随机蒙面标记(MLM)和预测两个句子是否相互跟随(NSP)。SCIBERT采用与BERT相同的体系结构，但却接受了科学文本方面的预先培训。“ 我正试着理解如何像上面这样在两个任务上训练模型。目前，我将模型初始化如下： from transformers import BertForMaskedLM model = BertForMaskedLM(config=config) 然而，这将只是为传销，而不是NS

浏览 1提问于2021-01-09得票数 9

回答已采纳

1回答

Python -如何在未知数据上使用拟合的ARIMA模型

、、

我正在使用statsmodels.tsa.arima.model.ARIMA在时间序列上拟合ARIMA模型。如何使用此模型对看不见的数据进行预测？似乎预测和预测功能只能从模型拟合到的训练集中的最后一次看到的数据进行预测。举个例子，我想用一个静态模型来预测未来。这是为了实时多步预测的目的，其中重新拟合模型是不可行的。例如，假设我们有一个10,000的数据集，分为训练和测试(70/30)。我们训练的最后一个读数是7,000，可以使用经过训练的模型并在6997到7000中传递来预测7001到7004，然后在接下来的迭代中使用相同的模型传递6998到7001来预测7002到7005。这种类

浏览 33提问于2021-10-28得票数 0

1回答

在google云中，哪个是最佳的选择调用训练机器学习模型？

、、

我在python中有一个经过训练的机器学习模型来获得一个回归输出，这个模型是用scikit- learning训练的。我想将这个预测插入到防火墙中，我将使用云函数来完成它，每天使用云调度程序来调度它。我的问题是我要把这个受过训练的机器学习模型藏在哪里？我能把它存储到google存储中并在云函数中调用它来获得预测吗？还是我应该把它存储在人工智能平台上？如果答案是进入人工智能平台，为什么？如果我把它存储到AI平台上，我有什么优势？我能用那里的新数据训练模型吗？我一直在读到，这是可能的，但我不知道为什么更好，如何更好

浏览 3提问于2019-10-28得票数 0

回答已采纳

1回答

在开发机器学习模型时，测试集中每个类的大小是否重要？

、、

我正在考虑如何在现实世界中应用经过训练的分类器。我们知道，当我们对数据集进行过度/欠采样以平衡数据集时，我们永远不会触及测试集，因为我们希望保持数据集的真实行为。但是，我不理解的部分是测试集的分布在分类器性能中的作用。假设我有一个模型，可以将电子邮件标记为垃圾邮件或非垃圾邮件。如果我在我的电子邮件服务中启动这个模型，在特定的时间窗口中，我的分类器接收到的所有电子邮件都可能是非垃圾邮件。但经过训练的模型对每个类别都有50-50%的分布。我的问题是，does this difference in the distribution--during the prospective applicati

浏览 0提问于2020-11-16得票数 2

3回答

使用keras保存的ML.NET加载模型

、、、、

我有一个用Python和Keras实现的神经网络。一旦我训练了它，我就导出了模型，我得到了两个文件: model.js和model.h5。现在，我想在.NET项目中进行实时分类，并使用经过训练的神经网络进行分类。在ML.NET中，有没有一种方法可以把用python导出的模型和经过训练的权重加载到模型对象中？我在documentation1中看到可以加载以前保存的模型，但显然是存储在.zip中，我找不到格式(可能是为了编写一个脚本，从python中获取模型并将其‘转换’为ML.NET模型。显然，hdf5格式是一个standard2，有没有办法用ML.NET加载它？ 1 2

浏览 22提问于2019-04-30得票数 4

回答已采纳