前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >实时精准控制机械臂AGIagent

实时精准控制机械臂AGIagent

作者头像
CreateAMind
发布2023-11-30 13:23:08
1410
发布2023-11-30 13:23:08
举报
文章被收录于专栏:CreateAMind

AGI agent 通过贝叶斯推理自由能目标函数,进行实时推理并完美解决pendulum任务环境;追踪目标能力极强

先简单看一下强化学习的效果

强化学习的Pendulum 效果:

这里使用juliareinforcementlearning库;epoch步数高达5000步

代码语言:javascript
复制
functionRL.Experiment(    ::Val{:JuliaRL},    ::Val{:BasicDQN},    ::Val{:PendulumDiscrete},    ::Nothing;    seed =123, )    rng = StableRNG(seed)    env = PendulumEnv(continuous =false, max_steps =5000, rng = rng)    ns, na = length(state(env)), length(action_space(env))    agent = Agent(        policy = QBasedPolicy(            learner = BasicDQNLearner(                approximator = NeuralNetworkApproximator(                    model = Chain(                        Dense(ns,64, relu; init = glorot_uniform(rng)),                        Dense(64,64, relu; init = glorot_uniform(rng)),                        Dense(64, na; init = glorot_uniform(rng)),                    ) |> gpu,                    optimizer = ADAM(),                ),                batch_size =32,                min_replay_history =100,                loss_func = huber_loss,                rng = rng,            ),            explorer = EpsilonGreedyExplorer(                kind = :exp,                ϵ_stable =0.01,                decay_steps =500,                rng = rng,            ),        ),        trajectory = CircularArraySARTTrajectory(            capacity =5_000,            state =Vector{Float32} => (ns,),        ),    )    stop_condition = StopAfterStep(50_000, is_show_progress=!haskey(ENV,"CI"))    hook = TotalRewardPerEpisode()    Experiment(agent, env, stop_condition, hook,"")end

强化学习不能完美解决,而且每次目标参数变化要重新训练

AGI agent 效果:

AGI agent 通过贝叶斯推理自由能目标函数,进行实时推理并完美解决pendulum任务环境;追踪目标能力极强

目标位置、环境重力、物体质量、推力、摩擦力、等参数都可以实时调整,实时推理,实时完成

对比强化学习每次不同的目标,不同的配置都需要重新训练,且每次通过随机动作尝试达到目标的方法,贝叶斯推理明显是高维智能。

其他参考:

27次训练即可解决小车双摆的强化学习算法

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-11-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档