常用的就是Input_size就是输入的大小,一般就是多维度的最后一个维度的值。
hidden_size 是输出的维度,也是指输出数据的维度的最后一个维度的大小。...bidrectional表示是否为双向lstm。这可能影响输出维度,后面讲。...=0.5,bidirectional=True)
上面就定义了一个双向LSTM,输入的最后一个维度为10,比如说(50,64,10),其中50为每个序列的长度,64为批量大小,10就是50个元素中每个元素对应的向量长度...输出
结果包含:output, (h_n, c_n)
output的维度:除了最后一个维度外前面的维度和输入的唯独相同,大小为(序列长度,批量大小,方向数 * 隐藏层大小)
如果是单向lstm,最后一个维度是输入参数里边的...比如上面的例子中,输出的output大小为(50,64,2*10)
h_n, c_n表示每个句子的最后一个词对应的隐藏状态和细胞状态。
大小为(1*2, 64, 10).