我正在读毕晓普的混合密度网络论文,网址是:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/bishop-ncrg-94-004.pdf
这是一篇很好的论文,但我仍然对一些小细节感到困惑。我想知道是否有人能帮我一下:
发布于 2018-08-06 22:33:14
实际上,上α和上西格玛不是要设置的自由参数,它们只是用来表示对应于混合系数和方差的输出活动。它们被用来区分相对于α和西格玛的导数。我是在克里斯托弗·毕晓普的“模式识别和机器学习”一书第275页中这样说的:
https://datascience.stackexchange.com/questions/36557
复制相似问题