标签是什么?特征是什么?
过拟合是什么?泛化又是什么?
不用很麻烦很累,点击观看下方视频,
你对人工智能的认知就能轻松超过全世界 99% 的人类!
要让机器学会认识世界,首先要有数据。
像是要判断草莓甜不甜,就要先收集一些关于草莓的数据。
比如个头较小、色泽鲜艳、质地柔软的草莓是甜的;
个头较大,色泽较浅,质地较硬的草莓是酸的。
在机器学习中,大小、色泽和质地被称为特征(Feature),较小,鲜艳、较软是对应的属性值(attribute value),酸和甜则被称为标签(label)。
机器学习,就是找到特征与标签之间的关系,来判断草莓是不是甜的。
通过数据学得模型的过程就是我们常说的学习(learning),也被称为训练(training)。
不过在学习过程中,有时太过认真的认识已有的草莓,会造成无法判断其他草莓甜不甜的状况,这种状况被称为「过拟合」。
往往我们希望学得的模型能很好的认识新的草莓,这种能力被称为「泛化」。
一般来说,训练样本越多,模型的泛化能力就越好,就越能准确判断新草莓是不是甜的。
「知智一分钟」是由「KnowingAI知智」推出的,以人工智能基础知识为主的短视频栏目。
每次一分钟,轻松了解 AI 领域基础概念!
领取专属 10元无门槛券
私享最新 技术干货