首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何使用机器学习来理解人类学习?

如何使用神经网络来类比理解学习?

我们可以使用对比学习法来分析机器学习和人类学习,两者进行对比,总会有强弱,我们可以使用强的那个来补弱的那个,也就是以强补弱。机器学习发展迅速,逻辑和方法清晰,很多方面已经超过了人类学习。比如在现代的围棋中,很多棋手都是和机器进行对弈训练,学习机器的方法,然后再和人类进行比赛。所以有的棋手认为现在的围棋就是背机器棋谱。

在无监督学习中,没有老师,神经元进行自学。输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)试图使类内差距最小化,类间差距最大化。一句话就是:给定数据,寻找隐藏的结构。无监督学习和人类自学有点类似,没有老师告诉你什么是正确的,而你只是自己来找不同。有点像不会英文的人一直在看英文资料,虽然不知道讲了什么,但是能发现一些词组的固定搭配,句式等等(如图1所示)。

在有监督的学习中,也就是有老师,这个老师指的是给学习系统的数据都是有标签的。然后训练学习系统,学习系统进行输出,然后老师会告诉学习系统偏差在哪,学习系统按照偏差进行修正。一句话:给定数据,预测标签。有监督的学习和人类的教学类似,老师教给学生知识,学生有错误老师进行指正,然后学生改正错误而进步。有点像我们用中英文对照的文章学习英文,看的文章多了,学会了英文,然后也能看懂别的英文文章(如图2所示)。

强化学习是介于无监督学习和有监督学习之间的一种方法,有一个老师,他不会告诉你哪里做错了,只是在给你的行为打分,做得好分数高。一句话:给定数据,学习如何选择一系列行动,以最大化长期收益。比如你和别人在网上下棋,没人告诉你怎么走能赢,而你就在不断试错,如果你最后赢了,就能赢得奖励,这样通过试错,你下棋的能力提高了。阿拉法狗就是通过强化学习进行训练(如图3所示)。

费曼技巧的学习和神经网络的强化学习有点类似,介于有老师学习和无老师学习之间。费曼技巧中的你如同强化学习中的学习系统,小白如同环境。你给小白讲述如同对环境的动作,而是否卡壳是反馈的状态,奖赏则是你不卡壳的满足感(如图4所示)。

在机器学习中,我们可以看到,环境的状态反馈和奖励都是促进学习的,那么在学习中,我们如何获得状态反馈和奖励呢?

费曼技巧的小白就是环境,我们也可以找到其他环境,比如学习论坛、学习小组、微信群、豆瓣小组、知乎、哔哩哔哩等,我们可以把自己所学整理发到上边,这样就会获得反馈。有的时候你认为自己的想法很完美了,结果被网友找到各种漏洞。通过写作获得反馈,就能促进学习。在哈佛的MBA案例教学中,一个学生对案例进行准备,然后在课堂上讲解自己的分析,其他学习踊跃的提出不同意见,这也是环境的反馈,这种方式和强化学习很像。好的环境会产生好的反馈,使得参与者能力快速提高,比如维也纳精神分析小组,维纳、麦卡洛克和皮茨的金三角、贝宝黑帮、八个天才的叛逆等。这也是孟母三迁、很多人拼命考好大学、去好公司的原因。

合理的奖励是有助于学习的,比如老师的表扬,奖状等。而自学时,可以自己给自己设置奖励。可以将自己想要的东西按照难度进行分级,然后学习也分级,学会不同级别的知识对应不同的奖励。比如学会了视频制作奖励自己一个好电脑。

《世界十大学习方法》帮你提高学习效率,降低学习成本!

微信视频:https://mp.weixin.qq.com/s/wCJrh7v8i7TdYC4OGsR5mg

B站视频: https://b23.tv/4xmaoBf

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230617A02AM100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券