如何使用机器学习来理解人类学习？

文章来源：企鹅号 - 可以量化的经济学

如何使用神经网络来类比理解学习？

我们可以使用对比学习法来分析机器学习和人类学习，两者进行对比，总会有强弱，我们可以使用强的那个来补弱的那个，也就是以强补弱。机器学习发展迅速，逻辑和方法清晰，很多方面已经超过了人类学习。比如在现代的围棋中，很多棋手都是和机器进行对弈训练，学习机器的方法，然后再和人类进行比赛。所以有的棋手认为现在的围棋就是背机器棋谱。

在无监督学习中，没有老师，神经元进行自学。输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类（聚类，clustering）试图使类内差距最小化，类间差距最大化。一句话就是：给定数据，寻找隐藏的结构。无监督学习和人类自学有点类似，没有老师告诉你什么是正确的，而你只是自己来找不同。有点像不会英文的人一直在看英文资料，虽然不知道讲了什么，但是能发现一些词组的固定搭配，句式等等（如图1所示）。

在有监督的学习中，也就是有老师，这个老师指的是给学习系统的数据都是有标签的。然后训练学习系统，学习系统进行输出，然后老师会告诉学习系统偏差在哪，学习系统按照偏差进行修正。一句话：给定数据，预测标签。有监督的学习和人类的教学类似，老师教给学生知识，学生有错误老师进行指正，然后学生改正错误而进步。有点像我们用中英文对照的文章学习英文，看的文章多了，学会了英文，然后也能看懂别的英文文章（如图2所示）。

强化学习是介于无监督学习和有监督学习之间的一种方法，有一个老师，他不会告诉你哪里做错了，只是在给你的行为打分，做得好分数高。一句话：给定数据，学习如何选择一系列行动，以最大化长期收益。比如你和别人在网上下棋，没人告诉你怎么走能赢，而你就在不断试错，如果你最后赢了，就能赢得奖励，这样通过试错，你下棋的能力提高了。阿拉法狗就是通过强化学习进行训练（如图3所示）。

费曼技巧的学习和神经网络的强化学习有点类似，介于有老师学习和无老师学习之间。费曼技巧中的你如同强化学习中的学习系统，小白如同环境。你给小白讲述如同对环境的动作，而是否卡壳是反馈的状态，奖赏则是你不卡壳的满足感（如图4所示）。

在机器学习中，我们可以看到，环境的状态反馈和奖励都是促进学习的，那么在学习中，我们如何获得状态反馈和奖励呢？

费曼技巧的小白就是环境，我们也可以找到其他环境，比如学习论坛、学习小组、微信群、豆瓣小组、知乎、哔哩哔哩等，我们可以把自己所学整理发到上边，这样就会获得反馈。有的时候你认为自己的想法很完美了，结果被网友找到各种漏洞。通过写作获得反馈，就能促进学习。在哈佛的MBA案例教学中，一个学生对案例进行准备，然后在课堂上讲解自己的分析，其他学习踊跃的提出不同意见，这也是环境的反馈，这种方式和强化学习很像。好的环境会产生好的反馈，使得参与者能力快速提高，比如维也纳精神分析小组，维纳、麦卡洛克和皮茨的金三角、贝宝黑帮、八个天才的叛逆等。这也是孟母三迁、很多人拼命考好大学、去好公司的原因。

合理的奖励是有助于学习的，比如老师的表扬，奖状等。而自学时，可以自己给自己设置奖励。可以将自己想要的东西按照难度进行分级，然后学习也分级，学会不同级别的知识对应不同的奖励。比如学会了视频制作奖励自己一个好电脑。

《世界十大学习方法》帮你提高学习效率，降低学习成本！

微信视频：https://mp.weixin.qq.com/s/wCJrh7v8i7TdYC4OGsR5mg

B站视频： https://b23.tv/4xmaoBf

发表于: 2023-06-172023-06-17 10:14:29
原文链接：https://kuaibao.qq.com/s/20230617A02AM100?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

如何使用机器学习来理解人类学习？

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐