首页
学习
活动
专区
工具
TVP
发布

谁都能懂的机器学习

机器学习,传说中的machine learning,从字面意思上来看,就是让机器去学习,机器这两个字很容易理解,那么学习是什么,学的是什么。其实很简单,就是参数。

我们日常生活很大一部分时间其实是在做分类任务,尤其是对于选择恐惧症来说,你要做的分类任务更多。比如这件衣服要不要买,这都是二分类问题——买or不买。今中午吃什么,那么我脑子里肯定会有若干备选方案,或者在食堂里有多种多样的菜摆在我的面前供我选择,这也是二分类问题,对于每一样,你选择吃或者不吃。诸如此类,很多很多。

那么问题来了,是什么决定买或者不买呢,你就开始多方比较了,每个人侧重点不同,自然比较的点就不同,比如价格,价格合适我就买了,太贵买不起,比如颜色,我喜欢哪些颜色,再比如款式,是短的,长的,肥的还是瘦的……很多指标。

最终,心细的你权衡各种指标下了决心买还是不买。比较,如果你是价格流,这个价格很合适,刚好搞活动,颜色稍微有点跑偏也没关系。如果你走的是土豪流路线,价格无所谓,但是对样式,颜色等条件十分挑剔,那么就开始各种试,找到一款中意的了。

如果这件事交给机器去做,那就是传说中的机器学习了。把那些指标进行量化,比如,价格,那就是一个整数了,不同的颜色,你可以给它一个数值表示这个颜色,从浅到深也可以用数字划分一个等级……最终,买或者不买,分别给个0和1。

机器要做的,就是根据你之前买衣服的样本,给每个指标乘以一个权重,计算后会得到一个值,如果这个值落在某个范围内,你就买,否则你就不买,不断调整这些权重的值,使得最终你买衣服的记录可以很好地符合这个模型,即很好地吻合你买或者不买的结论。机器学习的任务就完成了。当你再输入一个新的衣服的各种指标,带入刚刚训练的模型,同样得到一个数,你就可以根据这个数值预测或者决策啦。

那么问题又来了,怎么搞这些权重呢,这个就比较复杂了,会有很多种统计学方法确定当前得到的模型和真实模型之间的差距,根据这个差距不断调整权重。其实效果好坏,关键还是在你的样本,样本好了,整个模型就亮了。这就好比别人已经见过你穿某种风格的各种衣服,再见你穿类似的衣服的时候,默默地就会来一句:和你很搭。此时别人就是机器,你就是样本。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180607G00KRK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券