我对ML很陌生。我接手了一个分类项目,这个项目涉及分析退货客户的数据,我需要确定退货原因(~10个类别)。这些数据是在计数器上捕获的,可以包括这样的单词: LGTM (我觉得很好看) NFF (无故障发现)等等。
我有1000条记录的训练集,当使用Google时,我得到了一个"classificationAccuracy“值"0.82”和10个标签。
问题: 1.是否建议使用API来分析这类数据?2.什么是好的"classificationAccuracy“值?
谢谢
发布于 2016-01-22 01:00:00
http://scikit-learn.org/stable/tutorial/text_分析/工作_使用_文本_data.html
您可以使用上面的教程来了解文本分类。之后,提出一些非琐碎的问题就更容易了。
https://datascience.stackexchange.com/questions/9889
复制相似问题