为什么sigmoid的多类分类会失败？

sigmoid函数在二分类问题中非常常见，它将输入的值映射到0到1之间的概率值，可以用于判断一个样本属于某一类的概率。然而，在多类分类问题中，使用sigmoid函数会存在一些问题，导致其失败的原因如下：

输出空间受限：sigmoid函数的输出范围是0到1之间，表示概率值。在二分类问题中，可以使用一个sigmoid函数输出一个样本属于某一类的概率，但在多类分类问题中，每个类别都需要一个独立的sigmoid函数来表示概率，这样会导致输出空间受限，无法准确表示多个类别之间的关系。
互斥性问题：在多类分类问题中，每个样本只能属于一个类别，即互斥性。然而，sigmoid函数输出的是概率值，不具备互斥性。当使用多个sigmoid函数进行多类分类时，每个类别的概率是独立计算的，无法保证每个样本只属于一个类别，可能存在多个类别的概率都很高的情况。
梯度消失问题：sigmoid函数的导数在接近0和1的时候会非常接近0，这导致在反向传播过程中，梯度会逐渐消失。在多层神经网络中，梯度消失问题会导致训练过程变得困难，模型无法充分学习到复杂的特征和关系。

为了解决sigmoid的多类分类问题，常用的方法是使用softmax函数。softmax函数可以将输入的值转化为概率分布，能够有效地处理多类分类问题。softmax函数的输出是一个概率向量，每个元素表示样本属于对应类别的概率。它具有以下优势：