专栏首页mwangblog机器学习的类别

机器学习的类别

  • 监督学习 从训练资料中学到或者建立一个模式,并依此模式推测新的实例。训练资料是由输入数据和预期输出数据组成。模式的输出可以是一个连续的值(称为回归分析)或者分类标签(称为分类)。
  • 非监督学习 没有给定事先标记过的训练示例,自动对输入的数据进行分类或分群。
  • 强化学习 智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价,而不是告诉强化学习系统(reinforcement learning system, RLS)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

本文分享自微信公众号 - mwangblog(mwangblog)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Linux中的管道命令(三)

    tr命令将文本中的一个字符替换为另一个字符(除非挤压字符),它不直接读取文件,而是从标准输入中读取信息,它的语法如下:

    mwangblog
  • python模块

    mwangblog
  • Linux中的管道命令(二)

    使用-v n设置起始编号为n,使用-i n设置增量为n,例如下面的命令将起始编号设置为4,将增量设置为2:

    mwangblog
  • 《Springboot极简教程》继承WebMvcConfigurerAdapter: 一行代码写Controller文章概要常用的写Controller类方法继承 WebMvcConfigurerAd

    要添加一个新页面访问总是要新增一个Controller或者在已有的一个Controller中新增一个方法,然后再跳转到设置的页面上去。考虑到大部分应用场景中Vi...

    一个会写诗的程序员
  • PHP7.+系列新特性和新变更

    组合比较符号用于比较两个表达式。当$a小于、等于或大于$b时它分别返回-1、0或1,比较规则延续常规比较规则。对象不能进行比较

    ITer.996
  • 大数据应用--实时路况数据

    现在手机上装个导航软件,如高德地图,百度地图等等都有实时路况显示,导航和道路规划可以根据实时路况来实施,从而动态躲避拥堵,为出行节省时间,为了显示实时路况就必须...

    大数据和云计算技术
  • C++ STL算法系列3---求和:accumulate

     该算法在numeric头文件中定义。 假设vec是一个int型的vector对象,下面的代码: //sum the elements in vec start...

    猿人谷
  • 微信小程序性能优化技巧

    这步是微信做的。微信会在用户打开小程序之前就已经准备好环境,用户点击小程序入口后,直接下载小程序的代码包即可。

    Fundebug
  • 详述 MySQL 数据库的安装及配置

    温馨提示:本系列博文已经同步到 GitHub,地址为「mysql-tutorial」,欢迎感兴趣的童鞋Star、Fork,纠错。 博主说:最近在写「史上最简...

    CG国斌
  • 3分钟部署生产级k8s集群

    sealos:sealos 是一个 kubernetes 高可用安装工具,一条命令,离线安装,包含所有依赖,内核负载 不依赖haproxy keepalived...

    YP小站

扫码关注云+社区

领取腾讯云代金券