文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么测试集上的MSE非常低，并且似乎不会发展(在增加周期后不会增加)

问为什么测试集上的MSE非常低，并且似乎不会发展(在增加周期后不会增加)
EN

Stack Overflow用户

提问于 2019-02-11 15:00:34

回答 1查看 460关注 0票数 1

我正在研究一个使用LSTM预测股票价值的问题。

我的工作基于以下project。我使用了一个总长度为12075的数据集(股票价格的时间序列)，我将其分为训练集和测试集(几乎占10%)。它与link项目中使用的相同。

train_data.shape (11000，)

test_data.shape (1075，)

在我们的模型中，我们首先在多对多lstm模型上对其进行训练，在该模型中，我们提供N个输入序列(股票价格)和N个标签序列(通过将train_data排序为N个片段作为输入进行采样，标签作为输入的以下值序列进行采样)。

然后，我们开始分别预测每个值，并将其作为输入提供给下一次，直到我们达到num_predictions预测。

损失只是预测值和实际值之间的MSE。

最后的预测看起来还不错。然而，我就是不明白为什么训练误差会急剧减少，而测试误差总是非常非常低(尽管它一直在减少很少)。我知道，通常情况下，由于过拟合，测试误差在一定数量的时期后也会开始增加。我已经使用更简单的代码和不同的数据集进行了测试，并且我遇到了相对相似的MSE图。

下面是我的mane循环：

for ep in range(epochs):

# ========================= Training =====================================
for step in range(num_batches):

    u_data, u_labels = data_gen.unroll_batches()

    feed_dict = {}
    for ui,(dat,lbl) in enumerate(zip(u_data,u_labels)):
        feed_dict[train_inputs[ui]] = dat.reshape(-1,1)
        feed_dict[train_outputs[ui]] = lbl.reshape(-1,1)

    feed_dict.update({tf_learning_rate: 0.0001, tf_min_learning_rate:0.000001})

    _, l = session.run([optimizer, loss], feed_dict=feed_dict)

    average_loss += l

# ============================ Validation ==============================
if (ep+1) % valid_summary == 0:

  average_loss = average_loss/(valid_summary*num_batches)

  # The average loss
  if (ep+1)%valid_summary==0:
    print('Average loss at step %d: %f' % (ep+1, average_loss))

  train_mse_ot.append(average_loss)

  average_loss = 0 # reset loss

  predictions_seq = []

  mse_test_loss_seq = []

  # ===================== Updating State and Making Predicitons ========================
  for w_i in test_points_seq:
    mse_test_loss = 0.0
    our_predictions = []

    if (ep+1)-valid_summary==0:
      # Only calculate x_axis values in the first validation epoch
      x_axis=[]

    # Feed in the recent past behavior of stock prices
    # to make predictions from that point onwards
    for tr_i in range(w_i-num_unrollings+1,w_i-1):
      current_price = all_mid_data[tr_i]
      feed_dict[sample_inputs] = np.array(current_price).reshape(1,1)
      _ = session.run(sample_prediction,feed_dict=feed_dict)

    feed_dict = {}

    current_price = all_mid_data[w_i-1]

    feed_dict[sample_inputs] = np.array(current_price).reshape(1,1)

    # Make predictions for this many steps
    # Each prediction uses previous prediciton as it's current input
    for pred_i in range(n_predict_once):

      pred = session.run(sample_prediction,feed_dict=feed_dict)

      our_predictions.append(np.asscalar(pred))

      feed_dict[sample_inputs] = np.asarray(pred).reshape(-1,1)

      if (ep+1)-valid_summary==0:
        # Only calculate x_axis values in the first validation epoch
        x_axis.append(w_i+pred_i)

      mse_test_loss += 0.5*(pred-all_mid_data[w_i+pred_i])**2

    session.run(reset_sample_states)

    predictions_seq.append(np.array(our_predictions))

    mse_test_loss /= n_predict_once
    mse_test_loss_seq.append(mse_test_loss)

    if (ep+1)-valid_summary==0:
      x_axis_seq.append(x_axis)

  current_test_mse = np.mean(mse_test_loss_seq)

  # Learning rate decay logic
  if len(test_mse_ot)>0 and current_test_mse > min(test_mse_ot):
      loss_nondecrease_count += 1
  else:
      loss_nondecrease_count = 0

  if loss_nondecrease_count > loss_nondecrease_threshold :
        session.run(inc_gstep)
        loss_nondecrease_count = 0
        print('\tDecreasing learning rate by 0.5')

  test_mse_ot.append(current_test_mse)
  #print('\tTest MSE: %.5f'%np.mean(mse_test_loss_seq))
  print('\tTest MSE: %.5f' % current_test_mse)
  predictions_over_time.append(predictions_seq)
  print('\tFinished Predictions')
  epochs_evolution.append(ep+1)

这可能是正常的吗？我应该只是增加测试集的大小吗？有什么地方做错了吗？请对如何测试/调查有什么想法？

lstm

recurrent-neural-network

mse

tensorflow

machine-learning

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-03 07:26:40

训练和测试之间MSE的上述差异背后的原因是我们计算的不是同一件事。在训练期间，MSE是训练数据中每个样本在时间步长上的误差总和的平均值，因此它很大。在测试期间，我们进行N=50预测，并计算预测值和实际值之间的平均误差。这个平均值总是非常小，并且在上图中几乎是恒定的。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54625377

复制

相似问题

问为什么测试集上的MSE非常低，并且似乎不会发展(在增加周期后不会增加)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么测试集上的MSE非常低，并且似乎不会发展(在增加周期后不会增加)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么测试集上的MSE非常低，并且似乎不会发展(在增加周期后不会增加)
EN