首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用DQN解决大数据平台参数优化问题怎么定义奖励?

使用DQN解决大数据平台参数优化问题怎么定义奖励?

提问于 2019-02-27 13:25:03
回答 1关注 0查看 518

您好!我是一名研究生,最近看到您的“智能化大数据平台打造实践”这篇文章,我对大数据平台的参数优化问题很感兴趣。我从文中了解到你们使用DQN来处理参数优化的问题,我有个问题想请教您。假如强化学习的奖励设置为作业的完成时间,那不是要作业运行之后才能获取到奖励值吗,是不是可以理解成需要提前多次运行作业以获取不同参数值对应的奖励,也就是作业完成时间呢?

回答

和开发者交流更多问题细节吧,去 写回答
相关文章

相似问题

相关问答用户
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档