本节介绍在deeplearning中常出现的几个问题
首先介绍过拟合和欠拟合
在讲解之前,首先以一个房屋面积与价格的小例子进行引入
如上图,横轴为房屋的面积,竖轴为房屋的价格。通过收集的数据以点的方式列于图上,由图可看出整体呈线性模型,面积越大价格越高。而其呈现线性模型的原因在于我们在计算房价时也以房屋面积乘以每平方米的房屋价格再加上一个偏执得到。
那么下图是一个班级的GPA分布,它的横轴为GPA分数,竖轴为人数的密度。由图可看出其整体不呈线性分布。图上GPA为中间分数(0.3左右)时的人数最高,而GPA为4和0.1左右的人数较少。这也是老师进行考试的原则,希望成绩整体呈现这种类似于高斯分布的状况。
那么以上两个图中,关于每平方米的房价、高斯分布的均值即为重要的参数。若能知道这些参数即可很方便的进行预测和研究,但实际情况中很难一上来就知道这些参数和分布的类型。
同样在deep learning中我们也无法解释这些。
另外我们即使梦对了这些参数,但在现实中常伴随有各类noise(噪声),噪声的存在是不可避免的,如在房价预测中,由于不同人不同方法带来的测量误差、不同地域、楼层带来的区域误差等均无法准确预测。
因此较少的数据会带来较大的误差,我们需要更多的数据来得到更好的结果。
本文分享自 python pytorch AI机器学习实践 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!