首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

玻尔兹曼机的学习

玻尔兹曼机的学习算法通常基于最大似然。所有玻尔兹曼机都具有难以处理的配分函数,因此最大似然梯度必须进行近似处理。玻尔兹曼机有一个有趣的性质,当基于最大似然的学习规则训练时,连接两个单元的特定权重的更新仅取决于这两个单元在不同分布下收集的统计信息:Pmodel(v)和 ˆPdata(v)Pmodel(h | v)。网络的其余部分参与塑造这些统计信息,但权重可以在完全不知道网络其余部分或这些统计信息如何产生的情况下更新。这意味着学习规则是 ‘‘局部’’ 的,这使得玻尔兹曼机的学习似乎在某种程度上是生物学合理的。我们可以设想每个神经元都是玻尔兹曼机中随机变量的情况,那么连接两个随机变量的轴突和树突只能通过观察与它们物理上实际接触细胞的激发模式来学习。特别地,正相期间,经常同时激活的两个单元之间的连接会被加强。这是 Hebbian 学习规则(Hebb, 1949) 的一个例子,经常总结为好记的短语——“fire together, wire together’’。Hebbian 学习规则是生物系统学习中最古老的假设性解释之一,直至今天仍然有重大意义 (Giudice et al., 2009)。

不仅仅使用局部统计信息的其他学习算法似乎需要假设更多的学习机制。例如,对于大脑在多层感知机中实现的反向传播,似乎需要维持一个辅助通信的网络,并借此向后传输梯度信息。已经有学者 (Hinton, 2007a; Bengio, 2015) 提出生物学上可行(和近似)的反向传播实现方案,但仍然有待验证,Bengio (2015) 还将梯度的反向传播关联到类似于玻尔兹曼机(但具有连续潜变量)的能量模型中的推断。从生物学的角度看,玻尔兹曼机学习中的负相阶段有点难以解释。正如所主张的,人类在睡眠时做梦可能是一种形式的负相采样。尽管这个想法更多的只是猜测。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230306A03M0000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券