机器学习：今天的草莓甜不甜？

文章来源：企鹅号 - KnowingAI知智

标签是什么？特征是什么？

过拟合是什么？泛化又是什么？

不用很麻烦很累，点击观看下方视频，

你对人工智能的认知就能轻松超过全世界 99% 的人类！

要让机器学会认识世界，首先要有数据。

像是要判断草莓甜不甜，就要先收集一些关于草莓的数据。

比如个头较小、色泽鲜艳、质地柔软的草莓是甜的；

个头较大，色泽较浅，质地较硬的草莓是酸的。

在机器学习中，大小、色泽和质地被称为特征（Feature），较小，鲜艳、较软是对应的属性值（attribute value），酸和甜则被称为标签（label）。

机器学习，就是找到特征与标签之间的关系，来判断草莓是不是甜的。

通过数据学得模型的过程就是我们常说的学习（learning），也被称为训练（training）。

不过在学习过程中，有时太过认真的认识已有的草莓，会造成无法判断其他草莓甜不甜的状况，这种状况被称为「过拟合」。

往往我们希望学得的模型能很好的认识新的草莓，这种能力被称为「泛化」。

一般来说，训练样本越多，模型的泛化能力就越好，就越能准确判断新草莓是不是甜的。

「知智一分钟」是由「KnowingAI知智」推出的，以人工智能基础知识为主的短视频栏目。

每次一分钟，轻松了解 AI 领域基础概念！

相关快讯