首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深度 | DeepMind ICML 2017论文: 超越传统强化学习的价值分布方法

    选自DeepMind 机器之心编译 参与:机器之心编辑部 设想一个每天乘坐列车来回跋涉的通勤者。大多数早上列车准时运行,她可以轻松愉快地参加第一个早会。但是她知道,一旦出乎意料的事情发生:机械故障,信号失灵,或者仅仅是碰到一个雨天,这些事情总会打乱她的模式,使她迟到以及慌张。 随机性是我们日常生活中经常遇到的现象,并且对我们的生活经验有十分深远的影响。但随机性同样在强化学习应用中极其重要,因为强化学习系统需要从试验和错误中学习,并且由奖励驱动。通常,强化学习算法从一个任务的多次尝试中预测它可能收到的奖励期望

    06

    微服务努力的成败不仅仅取决于技术细节

    最近我研究了微服务的一些事,因为我已经感觉到这块话题正被引导到关联数据、REST以及其他超媒体数据讨论的部分。这意味着这条路上有无数的优胜者,它们坚持着告诉我该如何做,以及其他人是在如何错误的线路上行进,而不是帮助我们理解究竟什么是微服务,以及如何做好它。 对我来说,当我遇到这些高科技层面时感觉就如同,它们是非常高科技含量的,并且通常由一群“高科技兄弟”(高科技公司销售人员、营销人员和初创公司创始人)为骨干领导负责,往往代表了某个特定的供应商,或特定的一系列的供应商解决方案。即使现实如此,在过去的一年中我也

    010
    领券