我使用机器学习来训练与抑郁相关的句子。表现最好的是LinearSVC。除了LinearSVC之外,我还尝试了MultinomialNB和LogisticRegression,我选择了这三个模型中精度最高的模型。顺便说一句,我想要做的是能够提前考虑哪种模型适合,就像Scikit-learn提供的ml_map一样。我可以从哪里获得这些信息?我搜索了几篇论文,但除了SVM适合用于文本分类之外,找不到任何包含更详细信息的信息。我如何学习才能获得像这样的ml_map先验知识?
发布于 2020-11-13 17:10:58
我该如何学习才能获得像这样的先验知识呢? ml_map?
尝试通过使用不同的算法在不同的数据类型上使用不同的example datasets。有成百上千的东西需要探索。一旦你很好地掌握了它们是如何工作的,它就会变得更加清晰。别忘了尝试用谷歌搜索一下算法X的优点,它会有很大帮助。
和以下是我的想法,我想我以前曾经问过这样的问题,我希望它可以帮助你如果你正在苦苦挣扎:你为一个特定的问题在不同的机器学习模型上工作越多,你很快就会意识到数据和feature engineering
扮演着比算法本身更重要的角色。scikit-learn
提供的路线图让您可以很好地了解使用哪组算法来处理特定类型的数据,这是一个很好的开始。然而,它们之间的界限是相当微妙的。换句话说,一个问题可以通过不同的方法来解决,这取决于您如何组织和设计数据。
总而言之,为了在解决问题的同时实现良好的样本外(即良好的泛化)性能,必须查看具有不同设置组合的训练/测试过程,并注意您的数据(例如,回答这个问题:它是否涵盖了大部分样本在野外的分布,还是只覆盖了其中的一部分?)
https://stackoverflow.com/questions/64798088
复制相似问题