前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Machine Learning初探

Machine Learning初探

作者头像
吉吉的机器学习乐园
发布2022-07-13 16:37:05
2520
发布2022-07-13 16:37:05
举报
文章被收录于专栏:吉吉的机器学习乐园

Machine Learning definition:

  1. "Field of study that gives computers the ability to learn without being explicitly programmed." 在没有明确设置的情况下,使计算机具有学习能力的研究领域。
  2. "A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience E." 一个适当的学习问题定义如下,计算机程序从经验E中学习,解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。

Machine Learning algorithms:

  1. Supervised learning(监督学习)
  2. Unsupervised learning(无监督学习)

Others:Reinforcement learning(强化学习)

Recommender systems(推荐系统)

目前有各种不同类型的机器学习算法,最主要的两类是监督学习和无监督学习,简单的说,监督学习就是我们教会计算机学习某些东西,而在无监督学习中我们让计算机自己学习。


🌸🌸🌸我是一条华丽的分割线🌸🌸🌸


Supervised learning(监督学习):

举个栗子~

吉吉呢收集了一些房价的数据,把这些数据用二维图表画出来就是这样的👇

横坐标代表房子的面积,纵坐标代表它的价格,现在吉吉有个朋友叫小吃货,她有一套750平方英尺的房子想要卖掉,她想知道这房子能卖多少钱。

我们可以在这些数据中画一条直线,尽可能多的让每个点离直线更近一些。当然,我们可以不用直线来拟合这些数据,用二次方程去拟合效果可能会更好。

可以看出,监督学习指的是我们给学习算法一个数据集,这个数据集全部由“正确答案”组成,通过某种学习算法,算出更多的“正确答案”。

那么想知道小吃货的房子能卖多少钱这个问题,从术语上讲,这叫做“Regression problem(回归问题)”,这里的回归问题指的是,我们想要预测连续的数值输出,即房子的价格。

那么,再举个栗子~

吉吉有个死对头叫甄坏,做坏事做多了会被惩罚的,所以甄坏最近去医院体检,怀疑他长了一颗肿瘤,他现在来求我帮他预测一下这个肿瘤是良性的还是恶性的,吉吉从朋友郝医生那里取来一些数据。

横坐标代表着肿瘤的大小,纵坐标代表是否为恶性肿瘤,0代表不是,1代表是。

在这样的数据中,我们可以清楚的看到,决定肿瘤类别的特征只有一个,那就是肿瘤的大小,我们将两类肿瘤的大小映射到一条线上,我们可以粗略的得到一个结论:肿瘤越大,肿瘤是恶性的几率也就越大。

假设我们从郝医生那里又拿到了对应患者的年龄信息,那么数据就变成了这个样子👇

其中,蓝色圆圈代表良性肿瘤,红色叉叉代表恶性肿瘤。很明显,它们的分布是有一定规律的,中间的一条黑线基本上能够将两类肿瘤划分开来。那么这条线是怎么来的呢?我们后面会学到,现在只需要知道,这条线是通过特征数据学习而来的。

这类问题叫做“Classification problem(分类问题)”,分类问题有简单的二分类问题和多分类问题,这种学习的目的是为了预测一组离散的结果。

以上呢,就是监督学习的内容,总结一句话,监督学习就是通过学习人为给出的“正确答案”,进而得出一个预测结果的过程


🌸🌸🌸我是一条华丽的分割线🌸🌸🌸


Supervised learning(监督学习):

相比于监督学习中的“正确答案”数据,无监督学习可谓是放飞自我了,在无监督学习的数据中,每个数据“生而平等”,它们身上不带有任何标记或是都带有相同的标记。

让我们来看看无监督学习的数据分布叭~👇

针对这样的数据,通过无监督学习,它们被分成两个不同的聚集簇,这种方法叫做聚类算法。

无监督学习的应用十分广泛,而且作用极大。比如谷歌新闻中,每天新产生的新闻事件非常多,那么谷歌新闻把这些新闻收集起来,通过无监督学习的应用,将这些新闻是统一种类的自动聚类到一起。类似的应用还有许多,像基因学的理解应用、社交网络的分析、市场分割等等。

总之,无监督学习就是将大量数据交给算法,让算法为我们从数据中找出某种结构。一般的机器学习算法,都可以分为监督学习和无监督学习。

🆗,至此Machine Learning 的初探环节就结束啦。学习是个循序渐进的过程,我希望我能用最简单的话语描述这些问题,对我来说也是一种宝贵的学习经验。

· END ·

一个有理想、有热血的吉吉


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 吉吉的机器学习乐园 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档