支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新

2022 年 2 月 28 日 机器之心

机器之心报道

编辑:杜伟

你在用了吗? 

OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。

目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。


项目地址:https://github.com/openai/gym

近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。

API 变化

首先是 API 变化,包括如下:

  • env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);

  • 环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;

  • Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。


环境变化

  • blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;

  • 机器人环境已移动到 gym-robotics 包中;

  • bipedal walker 和 lunar lander 环境现在被合并称为一类;

  • Atari 环境现在使用标准种子 API 了;

  • 修复了 car_racing box2d 环境中的大错误修复,碰撞版本;

  • 重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。


其他变化

  • 移除 DiscreteEnv 类,内置环境将不再使用;

  • 增加了大数类型提示;

  • 支持 Python 3.10 版;

  • 大量额外的代码重构、清理、错误消息改进和小错误修复;

  • 所有环境文件的描述文件现在都有了明显改进。




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
0

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
【2022新书】Python手册,275页pdf
专知会员服务
178+阅读 · 2022年3月18日
专知会员服务
31+阅读 · 2021年9月7日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【DeepMind】强化学习教程,83页ppt
专知会员服务
147+阅读 · 2020年8月7日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
177+阅读 · 2020年5月29日
苹果发布最新Safari技术预览 支持120Hz滚动动画
威锋网
0+阅读 · 2021年11月16日
2021 年 Python 的好与坏
InfoQ
2+阅读 · 2021年11月16日
2021年了,Python开发者不容错过的7个VS Code扩展
机器之心
0+阅读 · 2021年1月25日
RL解决'LunarLander-v2' (SOTA)
CreateAMind
62+阅读 · 2019年9月27日
使用强化学习训练机械臂完成人类任务
AI研习社
13+阅读 · 2019年3月23日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
VIP会员
相关VIP内容
【2022新书】Python手册,275页pdf
专知会员服务
178+阅读 · 2022年3月18日
专知会员服务
31+阅读 · 2021年9月7日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【DeepMind】强化学习教程,83页ppt
专知会员服务
147+阅读 · 2020年8月7日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
177+阅读 · 2020年5月29日
相关资讯
苹果发布最新Safari技术预览 支持120Hz滚动动画
威锋网
0+阅读 · 2021年11月16日
2021 年 Python 的好与坏
InfoQ
2+阅读 · 2021年11月16日
2021年了,Python开发者不容错过的7个VS Code扩展
机器之心
0+阅读 · 2021年1月25日
RL解决'LunarLander-v2' (SOTA)
CreateAMind
62+阅读 · 2019年9月27日
使用强化学习训练机械臂完成人类任务
AI研习社
13+阅读 · 2019年3月23日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员