我正在努力解决工作中的一个问题,这个问题带来了一些困难。我已经包括了一个非常广泛的例子来演示我正在处理的问题。
在这种情况下,假设我查看了几家公司( A、B和C公司)过去几年的数据,并为每一家公司开发了基于行业质量分数(考虑的唯一功能)预测销售收入的模型。我分析过的3家公司在规模和质量上都有很大的差异。
问题是,我想用我创建的模型的预测来预测D公司的收入(目前得分在2左右),如果它的质量分数达到10分的话。
下面是我用来设置问题的代码:
import numpy as np
import matplotlib as mpl
from matplotlib import pyplot as pl
我用df of 921 rows x 10165 columns训练了一个带有Keras的921 rows x 10165 columns模型,每一行都是一个具有10160特性的示例。然后,我使用预先训练的模型进行预测。
我确保培训数据是平衡的,大约50%的样本使用标签0,其余的50%使用标签1。模型的准确性看起来不错,但在预测过程中存在问题。
所以输入数据如下所示:
X = df.iloc[:,0:10160]
X = X.to_numpy()
X = X.reshape([X.shape[0], X.shape[1],1])
X_train