在纸中我看到:
$\mathcal{Q}$是一组单词。
$\psi_{G^w}$是字嵌入。
因此,${\psi_{G^w}( w_t ),\forall w_t \in \mathcal{q}$给出了一组$\mathcal{Q}$中所有单词的嵌入。
例如,如果我有:
Q = {'a', 'b', 'c'}
embedding_gw.shape = (1000, 8) # 1000 words in vocab, embedding size is 8
我会得到:
{
[1,2,3,4,5,6,7,8], #embedding of 'a'
[8,7,6,5,4,3,2,1], #embedding of 'b'
[4,5,3,6,7,8,1,2] #embedding of 'c'
}
$\max{\psi_{G^w}( w_t ),\forall w_t \in \mathcal{q}$的结果应该是单个向量。
我的问题是,how我能得到这个单一的$\max$向量吗?
发布于 2018-08-09 12:28:56
第二个选择是正确的。从文件中:
在这种情况下,我们在w的所有实例的开始嵌入上执行一个组件级的最大值,以获得w所有出现的最佳特性。
前面的引文可以在等式17、第二栏、页面顶部找到几个段落。
https://datascience.stackexchange.com/questions/36683
复制相似问题