Sklearn库中有各种类型的朴素贝叶斯算法:

它们都能用于文本分类吗?哪一个在表演贝特
我使用多项朴素贝叶斯( Bernoulli )测试了一个简单的文本分类。
朴素贝叶斯和高斯朴素贝叶斯。似乎多项比较好。
我对其他人不确定,我的观察也可能局限于我的数据集。
发布于 2021-08-04 09:54:01
正如文档文档中提到的,这些变体对应于将数据表示为特性的不同方式。
因此,有可能是的,它们都可以用于文本分类。但是,它们中的每一个都希望以特定的方式表示数据。例如,高斯NB认为特征是数字的,所以用它的符号频率来表示文本是有意义的。Bernouilli NB需要布尔特征,因此文本必须用一次热编码表示.
https://datascience.stackexchange.com/questions/99602
复制相似问题