看完发现RNN原来是这样，机器学习入门贴送上

xumingxiang
2020-05-31 08:25:06 23

+关注

循环神经网络：机器学习入门

明天，我们将介绍一种专门处理序列数据的神经网络——循环神经网络（RNN）。这类网络因其在处理文本方面的能力而常被应用于自然语言处理（NLP）任务中。

RNN的应用场景

传统的神经网络和卷积神经网络（CNN）通常需要固定的输入和输出大小，这使得它们难以处理可变长度的数据。相比之下，RNN可以灵活处理不同长度的输入和输出。例如，在机器翻译任务中，原始文本序列被输入到RNN中，然后RNN生成翻译后的文本序列。同样地，在情感分析任务中，RNN可以通过分析输入的文本，生成一个单一的分类结果，判断这段文本是积极的还是消极的。

RNN的工作机制

RNN的核心在于其能够迭代更新隐藏状态（hidden state），这一状态包含了网络先前接收的所有输入信息。对于任意时刻的隐藏状态 ( ht )，它是由当前输入 ( xt ) 和上一个隐藏状态 ( h_{t-1} ) 共同决定的。通过这种方式，前一次的输入结果会参与到下一次的隐藏状态更新中，形成一个循环的过程。