可以通过多种方式将CNN的输出与下个RNN相连,但是在所有的方式中,从CNN中提取的特征向量都需要经历一些处理步骤才能用作RNN第一个单元的输入。...训练你的模型时,它是指图像标注对的数量,用于在每个训练步骤中修改模型权重。
vocab_threshold - 它是指在将单词用作词汇表的一部分之前,单词必须出现在训练图像标注中的总次数。...在代码片段的line 1中,标注中的每个字母都转换为小写,且nltk.tokenize.word_tokenize 函数用于获取字符串值token的列表。...', ]
然后将此token列表转换为整数列表,其中,词汇表中的每个不同单词都具有各自相关联的整数值:
[0, 3, 98, 754, 3, 396, 207, 139, 3, 753, 18...在这个列表中,每个训练标注都有一个entry(其中,值用于存储相应标注的长度)。
在下面的代码单元格中,我们使用此列表输出每个长度的训练数据中的标注总数。 接下来你会看到,大多数标注的长度为10。