杨熹的专栏-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

杨熹的专栏

专栏成员

302

文章

379896

阅读量

55

订阅数

《不会被机器替代的人》：智能时代的生存策略

机器人短信游戏

一开始人们以为，高级的脑力劳动不会被替代，比如医生、律师，可是现在医生、律师的活都可以干，而且比人的效率高很多。

2018-12-13

5590

强化学习第5课：什么是马尔科夫决策过程

强化学习其他机器人游戏

它和我们前面讲的决策过程是有一样的结构，只不过它会有更多限制。这里同样也有 agent 和环境，只不过还就多了一个状态，用 s 来表示。状态 state 是 agent 可以在环境中所观察到的东西, 然后 agent 可以选择一个行为，并从环境中获得反馈。

2018-12-10

6890

强化学习第4课：这些都可以抽象为一个决策过程

强化学习机器人游戏

这个过程有两步，首先你的代理会观察环境的一些特质，有时是传感器感知到的，有些是输入的用户特征。然后代理会选择一个行为，将这个行为反馈给环境。之后代理不仅仅会收到在这个行为下的环境的反馈，同时还以某些方式，影响着环境改变着环境。例如，你不仅收到了用户是否点击了你的横幅广告的反馈，还影响着你的用户基础。

2018-12-07

3930

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态