我正在尝试用PyTorch Fast Dense Feature Extractor实现这篇文章,但我在将他们提供的火炬实现示例转换成PyTorch时遇到了麻烦。到目前为止,我的尝试有一个问题,即当向特征映射添加额外的维度时,卷积权重与特征形状不匹配。这在Torch中是如何管理的(从他们的实现来看,Torch似乎并不关心这一点,但PyTorch关心)。我的代码:https://gist.github.com/system123/c
我正在遵循的论文来实现和关注池化网络来构建一个问答系统。在2.1章中,它谈到了CNN层:其中,q_emb是使用word2vec嵌入每个标记(单词)的问题。d是单词嵌入的维度,M是问题的长度。以类似的方式,a_emb是用shape (d, L)嵌入的答案。我的问题是:卷积是如何完成的,怎么可能两次操作的W_1和b_1是相同的?目前,我已经在PyTorch中实现了这个操作:
### Input is a tensor of shape (batch_size,