用 Gaussian Process 建模 state-action 空间相关性,加速 Multi-Fidelity RL

基于 14 年的 MFRL 论文,利用相邻 state-action 的空间相关性来加速学习,用 gaussian processes 建模 env dynamics(model-based)/ Q function(model-free),得到了两种跟 14 年 MFRL 很相似的算法。
posted @ 2023-04-16 13:21  MoonOut  阅读(92)  评论(0编辑  收藏  举报