我有一个线性回归模型,我的成本函数是误差平方和函数。我已经将我的完整数据集拆分为三个数据集:训练、验证和测试。我不确定如何计算训练误差和验证误差(以及两者之间的差异)。 训练误差是使用训练数据集计算的残差平方和误差吗? 举个例子:如果我在Python中这样做,假设我在训练数据集中有90个数据点,那么这是训练错误的正确代码吗? y_predicted = f(X_train, theta) #predicted y-value at point x, where y_train is the actual y-value at x
training_error = 0
for i in ran
我正在尝试用新的训练数据更新scikit多项式分类器。以下是我尝试过的方法
from sklearn.feature_extraction.text import HashingVectorizer
import numpy as np
from sklearn.naive_bayes import MultinomialNB
# Training with first training set
targets = ['education','film','sports','laptops','phones']