Chinaunix首页 | 论坛 | 博客
  • 博客访问: 18655
  • 博文数量: 6
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 85
  • 用 户 组: 普通用户
  • 注册时间: 2020-04-20 10:15
文章分类
文章存档

2020年(6)

我的朋友
最近访客

分类: 大数据

2020-04-20 10:28:24

强化学习算法已经有各种实现平台,譬如基于tensorflow的OpenAI Baselines,rllib,基于Pytorch的 PyTorch DRL ,rlpyt。最新推荐一个轻量快速实现的RL框架,由清华大学的本科生推出,相比于之前的RL平台,有一下几点优势:

实现简洁,轻巧:1500行代码搞定
模块化:多种不同API可供调用,轮子多就是好
调用方便,速度快,3秒钟实现一个PG算法 

RL算法框架比较:

在这里插入图片描述

阅读(1253) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~