适合初学者的强化学习教程(1): python使用gym实践和注意事项

2023-11-17

作者:知乎@Ai酱

安装步骤和报错问题

  1. 安装 pip install gym
  2. 报错 AttributeError: module 'gym.envs.box2d' has no attribute 'BipedalWalker'
  • 这是因为gym没有安装box2d的原因。
    pip install box2d-py
    如果上面这条命令出下面这个报错:
    error: command ‘swig.exe’ failed: No such file or directory
    那就是swig这个软件没装,如果是装了anoconda的话输入命令conda install -c anaconda swig。用pip应该也有相应方法装swig。

列出gym可以用的所有可以用的模型和模拟环境:

from gym import envs
print(envs.registry.all())

下面是我根据程序跑出来的gym make()的模拟的环境名(参数名)列表
(Acrobot-v1),
(AirRaid-ram-v0),
(AirRaid-ram-v4),
(AirRaid-ramDeterministic-v0),
(AirRaid-ramDeterministic-v4),
(AirRaid-ramNoFrameskip-v0),
(AirRaid-ramNoFrameskip-v4),
(AirRaid-v0),
(AirRaid-v4),
(AirRaidDeterministic-v0),
(AirRaidDeterministic-v4),
(AirRaidNoFrameskip-v0),
(AirRaidNoFrameskip-v4),2d飞机
(Alien-ram-v0),
(Alien-ram-v4),
(Alien-ramDeterministic-v0),
(Alien-ramDeterministic-v4),
(Alien-ramNoFrameskip-v0), 2d迷宫小游戏
(Alien-ramNoFrameskip-v4),
(Alien-v0),小游戏迷宫打怪
(Alien-v4),
(AlienDeterministic-v0),
(AlienDeterministic-v4),
(AlienNoFrameskip-v0),
(AlienNoFrameskip-v4),
(Amidar-ram-v0), 、
(Amidar-ram-v4),
(Amidar-ramDeterministic-v0),
(Amidar-ramDeterministic-v4), 小游戏迷宫打怪
(Amidar-ramNoFrameskip-v0),
(Amidar-ramNoFrameskip-v4), 小游戏迷宫打怪
(Amidar-v0),
(Amidar-v4),
(AmidarDeterministic-v0),
(AmidarDeterministic-v4),小游戏迷宫
(AmidarNoFrameskip-v0),
(AmidarNoFrameskip-v4), 2d迷宫
(Ant-v2),
(Assault-ram-v0), 2d飞行小游戏
(Assault-ram-v4),
(Assault-ramDeterministic-v0), 小游戏2d飞行打怪
(Assault-ramDeterministic-v4),
(Assault-ramNoFrameskip-v0),
(Assault-ramNoFrameskip-v4), 小游戏打怪
(Assault-v0),
(Assault-v4),
(AssaultDeterministic-v0),
(AssaultDeterministic-v4),
(AssaultNoFrameskip-v0),
(AssaultNoFrameskip-v4),
(Asterix-ram-v0),
(Asterix-ram-v4),
(Asterix-ramDeterministic-v0),
(Asterix-ramDeterministic-v4),小游戏飞行打怪
(Asterix-ramNoFrameskip-v0),
(Asterix-ramNoFrameskip-v4),
(Asterix-v0),
(Asterix-v4),
(AsterixDeterministic-v0),
(AsterixDeterministic-v4),
(AsterixNoFrameskip-v0),
(AsterixNoFrameskip-v4),
(Asteroids-ram-v0),
(Asteroids-ram-v4), 小游戏
(Asteroids-ramDeterministic-v0),
(Asteroids-ramDeterministic-v4), 小游戏打怪
(Asteroids-ramNoFrameskip-v0),
(Asteroids-ramNoFrameskip-v4),
(Asteroids-v0),
(Asteroids-v4),
(AsteroidsDeterministic-v0),
(AsteroidsDeterministic-v4),
(AsteroidsNoFrameskip-v0),
(AsteroidsNoFrameskip-v4),
(Atlantis-ram-v0),
(Atlantis-ram-v4),
(Atlantis-ramDeterministic-v0), 打水怪
(Atlantis-ramDeterministic-v4),
(Atlantis-ramNoFrameskip-v0),小游戏打水怪
(Atlantis-ramNoFrameskip-v4),
(Atlantis-v0),
(Atlantis-v4),
(AtlantisDeterministic-v0),飞行打怪小游戏
(AtlantisDeterministic-v4), 2D飞机打水怪
(AtlantisNoFrameskip-v0),
(AtlantisNoFrameskip-v4),
(BankHeist-ram-v0),
(BankHeist-ram-v4),
(BankHeist-ramDeterministic-v0), 2d迷宫
(BankHeist-ramDeterministic-v4),
(BankHeist-ramNoFrameskip-v0),
(BankHeist-ramNoFrameskip-v4),
(BankHeist-v0),
(BankHeist-v4),
(BankHeistDeterministic-v0),
(BankHeistDeterministic-v4),
(BankHeistNoFrameskip-v0),
(BankHeistNoFrameskip-v4),
(BattleZone-ram-v0),
(BattleZone-ram-v4),
(BattleZone-ramDeterministic-v0),
(BattleZone-ramDeterministic-v4),
(BattleZone-ramNoFrameskip-v0),
(BattleZone-ramNoFrameskip-v4), 2D坦克
(BattleZone-v0),
(BattleZone-v4),
(BattleZoneDeterministic-v0), 坦克小游戏
(BattleZoneDeterministic-v4),
(BattleZoneNoFrameskip-v0),
(BattleZoneNoFrameskip-v4),
(BeamRider-ram-v0),
(BeamRider-ram-v4),
(BeamRider-ramDeterministic-v0),
(BeamRider-ramDeterministic-v4),
(BeamRider-ramNoFrameskip-v0),
(BeamRider-ramNoFrameskip-v4),
(BeamRider-v0),
(BeamRider-v4),
(BeamRiderDeterministic-v0),
(BeamRiderDeterministic-v4), 小游戏2d飞行打怪
(BeamRiderNoFrameskip-v0),
(BeamRiderNoFrameskip-v4),
(Berzerk-ram-v0),
(Berzerk-ram-v4),
(Berzerk-ramDeterministic-v0),小游戏迷宫打怪
(Berzerk-ramDeterministic-

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

适合初学者的强化学习教程(1): python使用gym实践和注意事项 的相关文章

  • 如何恢复tensorflow inceptions检查点文件(ckpt)?

    I have inception resnet v2 2016 08 30 ckpt文件是预先训练的初始模型 我想使用恢复这个模型 saver restore sess ckpt filename 但为此 我将需要编写训练该模型时使用的变量
  • 如何替换 Pandas Dataframe 中不在列表中的所有值? [复制]

    这个问题在这里已经有答案了 我有一个值列表 如何替换 Dataframe 列中不在给定值列表中的所有值 例如 gt gt gt df pd DataFrame D ND D garbage columns S gt gt gt df S 0
  • Pandas set_levels,如何避免标签排序?

    我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
  • Gunicorn 工作人员无论如何都会超时

    我正在尝试通过gunicorn运行一个简单的烧瓶应用程序 但是无论我做什么 我的工作人员都会超时 无论是否有针对应用程序的活动 工作人员在我设置任何内容后总是会超时timeout值到 是什么导致它们超时 当我发出请求时 请求成功通过 但工作
  • VSCode Settings.json 丢失

    我正在遵循教程 并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区 但是当我在 VSCode 中打开设置时 工作区设置 选项卡不在 用户设置 选项卡旁边 我还尝试通过以下方式手动转到文件 APPDATA Code User s
  • Pycharm 在 os.path 连接上出现“未解析的引用”

    将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告 未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
  • 打印数字时添加千位分隔符[重复]

    这个问题在这里已经有答案了 我真的不知道这个问题的 名称 所以它可能是一个不正确的标题 但问题很简单 如果我有一个数字 例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
  • 打印包含字符串和其他 2 个变量的变量

    var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
  • 从 Powershell 脚本安装 Python

    当以管理员身份从 PowerShell 命令行运行以下命令时 可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
  • 使用 python/numpy 重塑数组

    我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
  • 导入错误:没有名为flask.ext.login的模块

    我的flask login 模块有问题 我已经成功安装了flask login模块 另外 从命令提示符我可以轻松运行此脚本 不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
  • Django 视图中的“请求”是什么

    在 Django 第一个应用程序的 Django 教程中 我们有 from django http import HttpResponse def index request return HttpResponse Hello world
  • pandas - 包含时间序列数据的堆积条形图

    我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
  • 将 Matlab 的 datenum 格式转换为 Python

    我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题 时间信息以 Matlab 的日期数字格式存储 对于那些不熟悉它的人 日期序列号将日历日期表示为自固定基准日期以来已经过去的天数 在 MATLAB
  • 重新分配唯一值 - pandas DataFrame

    我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人 总体目标是使用尽可能少的个人 诀窍在于这
  • 如何使用 Boto3 启动具有 IAM 角色的 EC2 实例?

    我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例 以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
  • 根据 Pandas 中的列表选择数据框行的子集

    我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
  • 将索引与值交换的最快方法

    考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
  • 如何将Python3设置为Mac上的默认Python版本?

    有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本 我已经完成的步骤 看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
  • NLTK:查找单词大小为 2k 的上下文

    我有一个语料库 我有一个词 对于语料库中该单词的每次出现 我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表 我在算法上做得很好 见下文 但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

  • Leetcode算法——63、不重复路径II(unique paths II)

    一个机器人位于一个m n的网格的左上角 它每次只能向下或向右移动一格 它试图到达网格的右下角 网格中有一些障碍物 机器人不能通过 求有多少种不重复的路径 备注 1 m 和 n 都不大于 100 2 障碍物和空地分别被标为 1 和 0 示例
  • 如何开发一个小程序游戏?

    小程序游戏开发需要开发人员具备以下几点能力 有一定的编程基础 例如 JavaScript TypeScript 至少熟悉一种游戏开发引擎 比如 Cocos Unity等 对游戏机制 游戏系统有一定的理解 有一定的 UI 界面审美 能够开脑洞
  • 字典树Trie和三叉搜索树Ternary Tree的学习总结

    字典树Trie和三叉搜索树Ternary Tree的学习总结 出处 西西整理 作者 西西 日期 2012 12 31 2 39 04 大 中 小 评论 0 我要发表看法 Trie树 又称字典树 单词查找树或者前缀树 是一种用于快速检索的多叉
  • 第38讲 Android Camera2 API 通过CropRegion控制Zoom缩放

    本讲是Android Camera专题系列的第38讲 我们介绍Android Camera2 API专题的通过CropRegion控制Zoom缩放 包括如下内容 Android Zoom简介 如何查询当前Camera支持的Zoom能力 通过
  • pycharm中from,import文件/模块出现问题(最全方法)

    1 引用本地文件 如上图所示 在pycharm中可能会出现引用 本地项目文件夹中的 py文件出现问题的时候 这时我们需要考虑是否是IDE环境未将项目路径设置到引用环境变量中 有一下几种方法可以解决 1 这时可以通过sys path inse
  • iOS开源系列——OC框架排名列表

    Objective C框架排名 快点我
  • PRD文档范例,产品经理值得收藏的写作手册

    2015年 我写了一篇梳理PRD的文章 PRD到底该怎么写 获得3 5万次阅读 423次收藏 至今已过去5年 在这5年里 我一直从事产品产品相关的工作 也经历过一次完整的创业 对PRD又有了一些新的思考 这篇文章是 PRD怎么写 的升级版
  • 软件测试方法——静态测试与动态测试

    从测试方法的角度可以分为手工测试和自动化测试 1 静态测试 所谓静态测试 static testing 就是不实际运行被测软件 而只是静态地检查程序代码 界面或文档中可能存在的错误的过程 从概念中我们可以知道 其包括对代码测试 界面测试和文
  • Python re.match函数的使用详解

    正则表达式是用于匹配和操作文本的强大工具 在Python中 re模块提供了一组函数来处理正则表达式 其中 re match函数用于尝试从字符串的起始位置匹配一个模式 本文将详细介绍re match函数的使用方法 并提供相应的源代码示例 re
  • MiniDump不生成或者生成0字节

    今天在使用C写一个Windows多线程程序时 发现退出过程中有段错误 为了方便快速的定位问题 我使用了MiniDump MiniDump c源码如下 include
  • 2021年系统集成项目管理工程师(软考中级)连夜整理考前重点

    一 信息与信息化 1 信息论奠基者香农认为 信息就是能够用来消除不确定性的东西 8种状态需要3位比特表示 5位比特则可表示64种状态 信息 物质材料 能源是三大戓略资源 2 信息论两个层次 本体论和认识论 3 信息传输模型 信源 编码 信道
  • Qt鼠标单击与长按

    在Qt中 可以通过重载QWidget的mousePressEvent mouseReleaseEvent 和mouseMoveEvent 等事件来实现对鼠标事件的处理 判断鼠标是长按还是点击 可以通过记录鼠标按下的时间和释放的时间 通过两个
  • 15.DDT+unittest+excel ddt框架结合单元测试

    Excel读取数据的三种方式 1 一次性读取所有的数据 对内存的要求高点 必须掌握 2 需要用的时候读取所有的数据 就是磁盘读写要求高点 磁盘 速度最低 内存 速度中间 CPU 速度最高 3 使用DDT进行参数化 方法一 一次性读取所有的数
  • 缓存相关

    缓存雪崩怎么解决 如果缓存因为某个原因不可用 导致大量请求涌向数据库 可能会导致数据库崩溃 缓存雪崩目前主要有两种方案 1 使用集群 集群部署缓存 当一台宕机时 其他机器仍能提供缓存服务 2 Hystrix 熔断器 起到熔断 降级 限流三个
  • 文章内容无法复制复制不了

    一些文档 什么的复制不了 主要有几种方法 目录 1 禁用js 2 ctrl P打印 3 选中要复制的内容 gt 拖到网址输入框 另外 通过一些浏览器插件 感觉用处不大 1 禁用js 优点 可以直接复制原有段落文字的格式 缺点 有点麻烦 对百
  • 通俗理解三大范式

    关系型数据库中我们用的最多的就是第一范式 1NF 第二范式 2NF 第三范式 3NF 所以需要我们深入理解三大范式 第一范式 1NF 要求数据库的每一列都是不可分割的原子数据项 在上面的表中 家庭信息 和 学校信息 列均不满足原子性的要求
  • Windows下C语言操作硬件设备的方法

    本文作者 Fezl 本文原地址 http blog csdn net u010147522 article details 49912221 之前都是在linux下操作硬件设备 open read write ioctl 相当方便 最近要检
  • jQuery 入门教程(23): jQuery UI Autocomplete示例(一)

    AutoComplete 在获取焦点后 随着用户键入的内容 可以在预订的数据源中查找和已输入的内容相匹配的内容列表供用户选择 这可以用作之前输入过的内容也可以用作自动填充相关内容 比如根据城市名 自动填充邮编等 你可以使用本地数据源或是远程
  • nvm的安装及使用、下载cnpm以及git的配置

    nvm下载 下载图中安装包 下载完了就有这个 双击安装 路劲把C改为D即可 这是直接下载选择好安装路劲之后 没配置的环境变量 配置后的环境变量 1 文件夹设置 2 环境变量配置 查询nvm版本号 nvm常用命令如下 使用nvm下载 node
  • 适合初学者的强化学习教程(1): python使用gym实践和注意事项

    作者 知乎 Ai酱 安装步骤和报错问题 安装 pip install gym 报错 AttributeError module gym envs box2d has no attribute BipedalWalker 这是因为gym没有安