我试图使用监督的机器学习算法对数据进行分类。
一切都很好,但出于好奇心,我在一个数据集中同时尝试了6种分类算法。以下步骤如下:
1>对所有算法进行了培训。 2>通过所有算法分别预测所有test_data的结果(或1或0)。 如果大多数3>给出了,我认为该数据对的结果是,类似于结果1。 ,4>,,然后我发现了总体的准确性。
我预计的总体精度会高于单独的结果(通过每个算法各自工作),但我几乎获得了平均精度。(这里的平均值意味着单个算法的精度的平均值)。
,谁能帮我找出原因吗?
发布于 2017-03-28 16:16:02
这取决于你选择的算法。许多算法对不同的事物都很敏感。例如,k均值聚类、线性支持向量机聚类和幂迭代聚类将得到明显不同的结果.
你得到了你想要的:你平均了选票,而没有以任何方式协调算法。你得到了一个一般的结果。
我怀疑加权平均会有多大帮助;你所做的只是训练一个元模型。相反,请考虑您拥有的数据集。您需要研究建模算法,并选择一种能够很好地处理数据集统计形状的算法,以达到预期的目的。既然你没有给我们任何这样的背景,我们就无法提供细节。
https://stackoverflow.com/questions/43071526
复制相似问题