我正在学习梯度下降算法,我在Boston ( sklearn)上实现了这样一个**(在python中)**。我还实现了一个成本函数,它接收所有的系数、截距和训练数据,并返回这些系数和拦截的成本。我在1500迭代和learning_rate = 0.000003202的波士顿数据集上运行了该算法,并成功地进行了收敛,使最小成本为61.840725406571245,但是当我对相同的训练数据训练sklearn的LinearRegression()算法时,使用.coef_和.intercept_发现了成本。的成本最低为19.958219814238042。所以我的问题是,怎么才能说出一定数量的迭代,会给我最少的/最优的成本呢?例如,我运行算法n次,并获得特定的成本,那么我如何知道这个成本足够好,或者我需要进一步降低它呢?
发布于 2020-06-27 11:11:46
您可以在培训中使用验证集。它们将是模型性能测试阶段的一个更好的指标,而不仅仅是培训错误。而且,您的learning_rate相当小,这会导致模型在大量迭代中收敛。您可以使用这些参数来查看它如何影响您的培训。
https://stackoverflow.com/questions/62608927
复制相似问题