https://zhuanlan.zhihu.com/p/34309324
https://github.com/openai/baselines/issues/314
https://arxiv.org/abs/1802.09464
the agent’s action frequency is f = 25 Hz. Observations include the 24 positions and velocities of the robot’s joints
没有使用图像。
https://github.com/openai/baselines/pull/337/files
几分钟训练好的到达指定位置的功能
训练1小时的类似桌球的运动
训练10小时但效果仍然不好的转笔动作,你要来挑战吗?