【推荐】快速超好用的RL强化学习框架——天授1500行代码实现DQN /PG/A2C-qiji100-ChinaUnix博客

文章分类

文章存档

我的朋友

最近访客

推荐博文

分类：大数据

2020-04-20 10:28:24

强化学习算法已经有各种实现平台，譬如基于tensorflow的OpenAI Baselines，rllib，基于Pytorch的 PyTorch DRL ，rlpyt。最新推荐一个轻量快速实现的RL框架，由清华大学的本科生推出，相比于之前的RL平台，有一下几点优势：

实现简洁，轻巧：1500行代码搞定
模块化：多种不同API可供调用，轮子多就是好
调用方便，速度快，3秒钟实现一个PG算法

RL算法框架比较：

在这里插入图片描述

阅读(1261) | 评论(0) | 转发(0) |

上一篇：没有了

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们