首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

《Scikit-Learn与TensorFlow机器学习实用指南》 第14章 循环神经网络

击球手击出垒球,你会开始预测球的轨迹并立即开始奔跑。你追踪着它,不断调整你的移动步伐,最终在观众的掌声中抓到它。无论是在听完朋友的话语还是早餐时预测咖啡的味道,你时刻在做的事就是在预测未来。在本章中,我们将讨论循环神经网络 -- 一类预测未来的网络(当然,是到目前为止)。它们可以分析时间序列数据,诸如股票价格,并告诉你什么时候买入和卖出。在自动驾驶系统中,他们可以预测行车轨迹,避免发生交通意外。更一般地说,它们可在任意长度的序列上工作,而不是截止目前我们讨论的只能在固定长度的输入上工作的网络。举个例子,它们可以把语句,文件,以及语音范本作为输入,使得它们在诸如自动翻译,语音到文本或者情感分析(例如,读取电影评论并提取评论者关于该电影的感觉)的自然语言处理系统中极为有用。

02

LSTM与GRU简单介绍

和我们人一样,RNN虽然擅长处理序列问题,但它也只能记住重要的短时信息,对于长时间的信息它则很难处理。也就是说,如果一条序列足够长,那它将很难把信息从较早的时间步传送到后面的时间步。因此,如果你准备进行一个文本预测任务,RNN 可能会遗漏一些间隔时间较长的重要信息。为什么会如此?因为RNN在反向传播的过程中,会面临梯度消失的问题,即梯度会随着时间推移慢慢下降。当梯度变得足够小,它就不会再进行学习。而LSTM和GRU就是短时记忆问题的解决方案。因为它们内部具有一些“门”可以调节信息流。这些“门”知道序列中哪些重要的数据是需要被保留,而哪些是需要被删除的。随后它可以沿着长链序列传递相关信息以进行预测,这也是为什么LSTM和GRU在后来的实际应用中越来越受欢迎的原因。

01
领券