我是刚接触scikit的人,我正在学习下面的例子
然而,我想知道,如果我想要分类的字符串A和B都被归入来自朴素贝叶斯的同一文档组,我是否能够找到哪个字符串更有可能被归入文档组?computer graphics‘,我有一个字符串"Computers are cool",另一个字符串是"OpenGL和CUDA are cool",虽然它们都可能被归入该文档组,但第二个字符串在该文档组下的分类可能更强,因为它的tf
我如何将从朴素贝叶斯预测的句子类别表示为CRF++或Wapiti中的一个特征?例如,如果句子Tumblr merges with Yahoo.被归类为Business,那么在编写crf的训练文件时,我可以在哪里将标签Business表示为特征?那么模板应该如何建模呢?列车文件应该是这样的吗merges business O
with busin