我已经在我的数据集上使用了所有类型的分类算法,但是无论我如何尝试,我都无法提高我的分数。
所以我读过关于Xgboost分类器的文章。因此,我想知道在大约1000行的数据集中使用xgboost是否实用。
请让我知道。
发布于 2018-10-23 23:32:26
是的,XGBoost以使用小型数据集(通常少于1000个实例)获得非常好的结果而闻名。
当然,在选择适合您的数据的机器学习模型时,实例的数量非常重要,并且与您需要匹配的模型参数的数量有关。模型中的参数越多,就需要越多的数据来减少最终模型的偏差。如果在极少数情况下使用复杂模型得到了很好的结果,那么很有可能您是过度拟合的。例如,1000个实例很难适应深度神经网络。
尽管如此,类的分布和数据中的噪声始终是限制您选择的任何模型是否适合您的数据的一个限制因素。
https://datascience.stackexchange.com/questions/40107
复制相似问题