首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

LSTM与GRU简单介绍

和我们人一样,RNN虽然擅长处理序列问题,但它也只能记住重要的短时信息,对于长时间的信息它则很难处理。也就是说,如果一条序列足够长,那它将很难把信息从较早的时间步传送到后面的时间步。因此,如果你准备进行一个文本预测任务,RNN 可能会遗漏一些间隔时间较长的重要信息。为什么会如此?因为RNN在反向传播的过程中,会面临梯度消失的问题,即梯度会随着时间推移慢慢下降。当梯度变得足够小,它就不会再进行学习。而LSTM和GRU就是短时记忆问题的解决方案。因为它们内部具有一些“门”可以调节信息流。这些“门”知道序列中哪些重要的数据是需要被保留,而哪些是需要被删除的。随后它可以沿着长链序列传递相关信息以进行预测,这也是为什么LSTM和GRU在后来的实际应用中越来越受欢迎的原因。

01
领券