我有一个4字标签的文本分类问题。
有人能帮我从下面的文本分类器中选择吗?
我被建议选择第二个(一个同时使用单数和大写),但我真的不明白为什么。

发布于 2020-05-24 10:13:03
好吧,所以把它写得很短,而且是在你问题的背景下-
准确性告诉我们,在所有的文件中,有多少是正确分类的。
精确性告诉我们在一个类别中预测的所有文档中,其正确的频率有多大。
Uni -gram- "nasa","is“"space”,"agency“”bi-gram“,"nasa is","space agency”。
现在让我们来看看这些数字,在这两种情况下,准确性和精确度并没有显着性差异。
但是,正如我们所看到的,bi可以给我提供更多的信息,因此可以在看不见的数据上具有更好的性能。试着在看不见的数据/验证集上测试模型,并比较difference.May、be、tri等。
https://datascience.stackexchange.com/questions/74702
复制相似问题