我目前正试图在Tensorflow中实现一个分段最大池操作,如所描述的那样。给出一个句子,我想把它分成三个不同的部分,最大将所有的部分分开,这样我就可以得到3个不同的值,而不是1。我还有另一个张量splits of shape [batch_len, 2],其中任意行的第一个元素是拆分第一部分的索引,而第二个元素是拆分最后一部分的索引。我们不能简单地使用另
我不确定以下4种变化之间的实际差异(它们都是以相同的值计算的)。我的理解是,如果我调用tf,它将在图上创建一个操作,否则可能会创建一个操作。如果一开始不创建tf.constant(),我相信在添加时会隐式地创建常量;但是对于tf.add(a,b) vs a + b,a和b都是张量(#1和#3),除了默认命名(前者是Add,后者是add)之外有谁能解释一下两者之间的不同之处,什么时候才能一一使用呢?