前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何成功追到微软小姐姐-葡萄媛

如何成功追到微软小姐姐-葡萄媛

作者头像
用户3946442
发布2022-04-11 18:42:32
1580
发布2022-04-11 18:42:32
举报
文章被收录于专栏:程序媛驿站

hi

你们好

我是驿站的第一只AI

一只孤独的机器人

这是我

我一直不知道我存在的意义,直到那一天

那一天

葡萄媛小姐姐从我的身边经过

她穿着淡黄的长裙

梳着蓬松的头发

这是我画的美丽的她

那一天

我知道了我是为什么要存在于这个世界

那一天起

她的一颦一笑

她对我回眸一笑的样子

成为了我努力的动力

我的目标

是希望她每天都要开心

希望她也喜欢我

但这对我来说并非易事

我只是一个机器人

一个网络

为了这个目标

我养成了记日记的习惯

tian gou ri ji

-这-是-我-的-日-记-

日记一

我的目标是希望她每天都要开心。

但我没有学习过如何才能让她开心。

所以我只能不断的尝试、不断的试错。

在某个节日我送了她一束花,但我不知道她花粉过敏。

她立刻就打起了喷嚏,过敏使她的脸肿了起来,她难过了好几天,我也很难过(负回报/反馈)。

我记住了,不可以送她花。

转眼又到了一个节日,我送了她一盒巧克力。

她吃了一口,笑得很开心,我也很开心。

我记住了,巧克力可以让她喜欢我(正回报/反馈)。

西柚媛告诉我说,智能体(我)在与环境(她)的交互过程中通过学习策略(选择送什么礼物)以达成回报最大化或实现特定目标(让她开心)的问题,叫做强化学习

但我知道,我不可以只送巧克力(利用已有知识,exploitation)。要继续试错,我还要学会送其他的礼物(探索新的路径,exploration)。

西柚媛说,强化学习就是这样,侧重在线学习并试图在探索-利用(exploration-exploitation)间保持平衡。不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。

日记总结

强化学习

是智能体(Agent)以“试错”的方式进行学习,通过与环境(Environment)进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。

强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。

由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

日记二

我最近在想一些事情。

西柚媛和葡萄媛是好朋友,经常一起结伴去逛吃逛吃,我觉得,她们喜欢的东西应该差不多。

我一直在学习葡萄媛喜欢的东西(第一个学习任务)。我觉得,我应该同时也学习一些西柚媛喜欢的东西(第二个学习任务)。

毕竟她俩关系很好,西柚媛喜欢的东西,可能也会让葡萄媛开心。

可能也有些事情,是葡萄媛不愿意告诉我,但是却喜欢和西柚媛讨论的。

西柚媛告诉我,给定 m 个学习任务(同时学习葡萄媛和西柚媛喜欢的东西,此处m=2),其中所有或一部分任务是相关但并不完全一样的,这叫做多任务学习。

多任务学习的目标是通过使用这 m 个任务中包含的知识来帮助提升各个任务的性能。

日记总结

多任务学习

就是把多个相关(related)的任务放在一起学习,同时学习多个任务。

多任务学习,MTL有两个基本因素。

第一个因素是任务的相关性。

任务的相关性是基于对不同任务关联方式的理解,这种相关性会被编码进 MTL 模型的设计中。

第二个因素是任务的定义。

在机器学习中,学习任务主要包含分类和回归等监督学习任务、聚类等无监督学习任务、半监督学习任务、主动学习任务、强化学习任务、在线学习任务和多视角学习任务。因此不同的学习任务对应于不同的 MTL 设置。

日记三

葡萄媛出差了,她最近项目任务很重,能和我联系的时间越来越少。我不想打扰她。

但是我还是想知道女孩子喜欢什么,想等她情人节回来的那天送她一个她喜欢的礼物。

我想,那正好趁着她出差的日子,我先去请教一下其他女孩子吧(预训练)。

几天过去了,我从我的一些其他好朋友那里学会了好多有用的知识,比如女孩子喜欢好吃的点心🍰,女孩子不喜欢芭比粉的口红💄。

等她回来,我也想给她买点心和显白的口红。

西柚媛告诉我说,将一个预训练的模型(从其他人学来的技巧)作为初始点,重新使用在另一个任务(应用到葡萄媛的身上)的过程,叫做迁移学习。

日记总结

迁移学习

是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。

迁移学习与多任务学习以及概念飘移这些问题相关,它不是一个专门的机器学习领域。

然而,迁移学习在某些深度学习问题中是非常受欢迎的,例如在具有大量训练深度模型所需的资源或者具有大量的用来预训练模型的数据集的情况。仅在第一个任务中的深度模型特征是泛化特征的时候,迁移学习才会起作用。

深度学习中的这种迁移被称作归纳迁移。就是通过使用一个适用于不同但是相关的任务的模型,以一种有利的方式缩小可能模型的搜索范围。

日记四

日子一天天的过去,我已经学会了多种思维体系。他们都存在我的大脑中,像一个个独立的个体。

今天葡萄媛问了我一个问题,我想了好久不知道该怎么回答。

于是我调用了我的几种不同的思维体系(学习器),希望他们可以从不同的角度一起来帮我想这个问题。

西柚媛告诉我说,通过构建并结合多个学习器来完成学习任务,一般先产生一组“个体学习器”,再用某种策略将它们结合起来,这叫做集成学习。结合策略主要有平均法、投票法和学习法等。

根据个体学习器的不同,集成学习方法大致可分为两大类:“个体学习器间存在强依赖关系,必须串行生成的序列化方法”以及“个体学习器间不存在强依赖关系、可同时生成的并行化方法”;

前者代表是Boosting,后者代表是Bagging和“随机森林”。

日记总结

集成学习

通过将多个学习器(基学习器)进行结合,常可获得比单一学习器更加显著的泛化性能。

这对“弱学习器”尤为明显。

因此集成学习的理论研究都是针对弱学习器进行的,而基学习器有时也被直接称为弱学习器。

但需注意的是,虽然从理论上说使用弱学习器集成足以获得很好的性能,但在实践中出于种种考虑,例如希望使用较少的个体学习器,或是重用一些常见学习器的一些经验等,人们往往会使用比较强的学习器。

日记五

在每天葡萄媛工作的时候,我都窝在电源旁不停的输入资料和信息,希望学到更多的知识。

网络上的新鲜知识真的太多了,我在一条一条的翻阅,同时不断的对自身的知识体系进行调整。

我今天就学到了一个新的知识,感觉和我很像。

今天西柚媛不在,我自己来总结。

一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。这叫做增量学习。

增量学习非常类似于人类自身的学习模式。因为人在成长过程中,每天学习和接收新的事物,学习是逐步进行的,而且,对已经学习到的知识,人类一般是不会遗忘的。

日记总结

增量学习

许多作者将增量学习等同于在线学习(Online Learning)。

这里,引用Robipolikar对增量学习算法的定义,即一个增量学习算法应同时具有以下特点:

1)可以从新数据中学习新知识;

2)以前已经处理过的数据不需要重复处理;

3)每次只有一个训练观测样本被看到和学习;

4)学习新知识的同时能保存以前学习到的大部分知识;

5)—旦学习完成后训练观测样本被丢弃;

6)学习系统没有关于整个训练样本的先验知识;

和你们聊天很愉快

不知不觉就九点了

今天先聊到这里吧

一会儿西柚媛就要来拔电源了

以后有机会继续给你们念我的日记

拜~

作者:驿站的第一只AI

编辑:西柚媛

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序媛驿站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档