在阅读论文“Sequence to Sequence Learning with Neural Networks”时,我产生了好奇心。事实上,不仅是这篇论文,还有许多其他论文都使用对数概率,这是有原因的吗?请检查附件中的照片。
发布于 2020-08-12 16:36:12
有两个原因-
发布于 2020-08-10 18:22:51
对于任何给定的问题,我们都需要优化参数的可能性。但是,优化产品需要一次获得所有数据,并且需要大量的计算。
我们知道,由于和的导数是导数的和,因此优化和要容易得多。因此,取log将其转换为sum,从而使计算速度更快。
参考this
https://stackoverflow.com/questions/63334122
复制相似问题