我对ML.Net并不熟悉,我还在玩一些基本的MultiClassClassification场景,我想知道它现在是否已经可以默认地处理停止词了,还是应该在数据准备中这样做?
发布于 2018-12-09 05:10:03
请查看本节 of ML.NET食谱。
如果在管道中使用mlContext.Transforms.Text.FeaturizeText,默认情况下它将删除英语停止词。
当然,您可以使用其他ML.NET提供的组件来调整您的NLP预处理,但是,根据我在文本分类方面的一些经验,FeaturizeText在大多数情况下都做得很合理。
https://stackoverflow.com/questions/53677181
复制相似问题