RL 基础 | 如何搭建自定义 gym 环境

主要就是 __init__, step, reset 三个方法,① __init__ 要记得定义 state action space,② step 返回 (obs, reward, done, info),③ reset 返回 obs。返回的 obs 要用 np.ndarray a56爆大奖在线娱乐。
posted @ 2023-03-03 11:03  MoonOut  阅读(189)  评论(0编辑  收藏  举报