虽然架构设计完成,但是期间出了很多问题,最严重的就是数据分布的改变,因此我们借鉴R2D2的做法,使用burn in和对episode的整体保存,以下是对问题的处理的思考。
2. 架构分析
3. 问题分析
4. 实验分析