首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不懂AI?用大白话告诉你什么是强化学习和迁移学习

人工智能现在越来越火,很多非行业内的人对深度学习,强化学习,迁移学习等概念会感到很陌生,同时各种偏理论性和学术性的解释也会显得很晦涩难懂。

其实这类机器学习的机制和人类的学习机制其实很相似,因此本文会列举一些日常中人们是如何学习的例子来说明深度学习,强化学习和迁移学习等概念。

一.深度学习(Deep Learning)

深度学习是近期人工智能取得重大突破的重要因素之一。现在商用的多是有监督的深度学习,需要大量的标注数据。

举个例子,怎么教小朋友认识小狗呢。你会找些图片给小朋友看,告诉他这是小狗;路上碰见小狗,你会指给他看,告诉他这个是小狗;而小朋友指着电视上的猫说这是小狗,你会赶紧指正,告诉他这不是小狗,旁边那个才是小狗。时间久了,次数多了,小朋友就大致能够知道哪些是小狗了。其实这就是一个监督学习的过程,而你在这个过程中提供了大量的标注数据(小狗的图片,路边的指认等等)。

从原理上来说,深度学习主要关注的是特征的提取,通过大量的标注数据来训练模型来达到精准的特征提取和识别。

二.强化学习(Reinforcement Learning)

强化学习是一种自我修正和反馈的机器学习机制,让机器拥有自我学习和自我思考的能力。AlphaGo Zero就运用了强化学习。强化学习主要解决的是延时反馈的问题。

举个例子,教小朋友用筷子,你只需要告诉小朋友大概的拿筷子的手法,然后示范两下,接下来就得让小朋友自己去尝试着用筷子夹东西。小朋友夹东西时的步骤,角度,力度等等因素都会对最终的结果造成影响。他们自己会从每次的结果反馈中去寻找每一步最合适的角度和力度等,慢慢地学会使用筷子。这就区别于上面我们举的有监督的深度学习的例子了,你不需要找很多很多的视频来告诉小朋友怎么做,因为影响因素太多,变量太多,很难做到足够的标准化,统一化。

强化学习最开始是运用于机器人路径规划方向,但其实它的应用面也很广,尤其是很多有反馈的任务中,每一步对最终的结果都造成影响,这种情况下单纯的深度学习处理起来就比较困难了。

三.迁移学习(Transfer Learning)

迁移学习是一种举一反三的能力。让机器在处理全新领域的问题时能够根据以往的模型,根据少量的数据快速训练出适合新场景的模型。最近Google推出的Cloud Auto ML就是运用了迁移学习,这不是简单的准备一个通用的预训练模型,而是用少量的数据来重新训练一个模型。

举个例子,我们小时候有学骑自行车,可能跌倒了很多次之后,终于学会了。而我们再去学骑摩托车,相对就容易多了,你可能不会花学习骑自行车用的那么多的时间,尽管这其中还是存在很大的不同,但是依然有很多的经验可以迁移,来降低你学习新技能的难度和成本。

在工业界,迁移学习主要解决了两个问题,第一,数据量不足的问题。虽然现在是数据大爆炸的时代,但是在某些领域,比如疑难杂症,数据量还是很少的,并且将大数据处理成为优质的可以供机器训练用的数据,还需要花费很多的人力投入。第二,个性化方面的问题。每个人的兴趣喜好,行为习惯都不同,通过一个人的数据可以分析出一个人的用户画像。但是怎么给一个没有过买书记录的人推荐书呢?可以通过迁移学习来解决,根据他的兴趣爱好,购物行为等在没有这个领域下数据的时候做到个性化推荐。

总的来说,深度学习、强化学习和迁移学习不是相互独立和矛盾的存在,现在就有人尝试着把这三种学习方法结合着来解决一些具体领域的问题。如果说深度学习是现在的话,那强化学习和迁移学习就是未来,能够让机器变得不再那么笨。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180228G1H0KT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券