我正在用私有数据集构建一个5类分类器。每个数据样本有67个特征,大约有40000个样本。特定类的样本被复制以克服类不平衡问题(因此有40000个样本)。
使用一个vs-一个多类支持向量机,我在验证集上的准确率为79%。特征标准化,准确率达79%。如果不进行标准化,我得到的准确度为72%。类似的结果,当我尝试50倍交叉验证。
接下来是MLP结果,
例2:具有批规范层的重复Exp 1
为了适应过度,增加了MLP的深度。Exp 1网络的更深层版本
关于可能发生的事情的想法?
发布于 2018-05-07 20:24:53
有些事情可能会发生:
我见过的经验法则是:
Nh=Ns/(α∗(Ni+No))
Nh = number of hidden neurons.
Ni = number of input neurons.
No = number of output neurons.
Ns = number of samples in training data set.
α = an arbitrary scaling factor usually 2-10.
在你的例子中,这会让你喜欢5000个神经元,但既然你对你的类进行了过度采样,我也建议你用欠采样代替,这可能会让你达到1024左右,这是相当标准的。67 512 5构型为纯肠道反应。
https://datascience.stackexchange.com/questions/31343
复制相似问题