LSTM()函数
输入参数
参数有input_size, hidden_size, num_layers, bias, batch_first, dropout, bidrectional....元祖包含(h_0, c_0),
h_0的维度是(num_layers*num_directions,batch_size,hidden_size),表示隐藏层的出事状态,c_0的维度和h_0 的一样表示初始细胞状态...输出
结果包含:output, (h_n, c_n)
output的维度:除了最后一个维度外前面的维度和输入的唯独相同,大小为(序列长度,批量大小,方向数 * 隐藏层大小)
如果是单向lstm,最后一个维度是输入参数里边的...如果是双向的,最后一个维度是输入参数里边hidden_size的两倍.
h_n和c_n包含的是句子的最后一个时间步的隐藏状态和细胞状态,维度也相同,是:(隐藏层数 * 方向数, 批量大小,隐藏层大小)...比如上面的例子中,输出的output大小为(50,64,2*10)
h_n, c_n表示每个句子的最后一个词对应的隐藏状态和细胞状态。
大小为(1*2, 64, 10).