我试图为文本数据上的多类分类问题建立一个LSTM模型。到目前为止,我只建立了一个模型,当一个输入属于其中一个类别。如果一个输入可以属于多个类(即:一个数据条目可以属于2-3个类别),我该怎么办?有人能帮我建立一个建立这样一个模型的直觉博客或资源吗?
谢谢。
发布于 2019-06-06 16:13:37
LSTM和其他神经网络一样,隐含地支持多标签分类。您应该确保输出层有n神经元,每个类都有一个,并且应该使用逻辑激活而不是softmax激活(通常用于多类问题中的最后一层)。
最后一层中的每个神经元N_i将输出一个介于0到1之间的值。如果N_i的输出大于0.5,则该示例是label i的成员。
这里's是一篇很好的文章,可能会有所帮助。
发布于 2019-06-06 12:40:42
当每个对象可以从0分类到多个类别时,这是一个多标签分类问题。有几种方法可以解决这个问题,其中最著名的可能是一比一的策略:它包括将问题划分为多个二进制分类任务,每个可能的标签。
然而,深层神经网络支持本质上的多标记分类。最后分类层的每个神经元都可以与标签相关联。由于您希望有多个输出神经元,如果一个对象有多个标记,那么应该在最后一层使用sigmoid激活函数和二进制交叉熵损失函数。
网上有几个教程。
https://datascience.stackexchange.com/questions/53307
复制相似问题