V100 和 P100 在 Google Compute Engine 上的可用性

2024-04-15

描述

我刚刚尝试了一段时间,使用我的个人帐户设置或保留用于机器学习的虚拟机,我在 n1 上使用了几个月,具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100,现在尝试了至少一半具有 P100/V100 可用性的区域,并且总是收到如下所示的资源错误:

操作类型 [插入] 失败,并显示消息“区域 'projects/lexical-list-285719/zones/us-central1-c' 没有足够的可用资源来满足请求。请尝试其他区域,或稍后重试。”

zone-x 中没有可用资源。我最近从试用中转过来。

问题:

A)这种情况常见吗?

B) 有解决办法吗?

C) 我可以做什么(如果有的话)来获得具有这些规格或类似性能的机器?

我知道这是因为该区域没有可用的这些规范,我应该尝试切换。我也知道托管实例组。但这不会那么困难,不是吗?

谷歌已经订满了吗?

可能的解决方案

目前我的修复想法是:

  • 多区域托管组(仍需检查我的项目是否与之兼容)
  • 遍历所有可用区域的云 shell 脚本(需要研究 shell 脚本如何工作)

非常感谢任何有此主题经验的人分享他们的解决方案或更好的解决方案的经验。

对我来说一个好的答案是not包括以下任何一项:

  • 区域切换(尝试过)

  • 较小的机器(尝试过,项目不适用于太小的机器)

  • 保留(尝试过)

  • 等待(已经知道这一点,如果我现在想要一台机器,那没有帮助)

不过我建议任何没有那么持久或紧急问题的人也去做这些事情。


这不是问题,这样的事件时有发生。

该错误消息的意思是特定区域的 Google 端没有 CPU/RAM/GPU 等可用资源。您可以在文档中找到更多详细信息VM 创建故障排除 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-instances#vm-not-created部分资源可用性 https://cloud.google.com/compute/docs/troubleshooting/troubleshooting-vm-creation#resource_availability:

当您尝试在区域中请求新资源时发生资源错误 由于当前无法满足您的请求 Compute Engine 资源,例如 GPU 或 CPU。

资源错误仅适用于区域中的新资源请求,并且不会 不影响现有资源。资源错误与您无关 Compute Engine 配额,仅适用于您在中指定的资源 您发送请求时的请求,而不是发送到中的所有资源 该区域。

资源可用性取决于用户请求,因此是动态的。

有几种方法可以解决这个问题:

  1. 尝试在另一个地方创建您的实例GPU可用的区域 https://cloud.google.com/compute/docs/gpus/gpu-regions-zones (要求增加配额 https://cloud.google.com/compute/quotas#requesting_additional_quota如果需要的话)。
  2. 等待一段时间,然后重试。
  3. 请求一些较小的虚拟机(如果可能),稍后您将能够尝试请求一些更大的虚拟机(与配额请求 https://stackoverflow.com/a/62128974/12428794).
  4. 储备资源 https://cloud.google.com/compute/docs/instances/reserving-zonal-resources对于您的虚拟机,请遵循文档以避免将来出现此类问题(需要额外付款).
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

V100 和 P100 在 Google Compute Engine 上的可用性 的相关文章

随机推荐

  • .NET 中的引导字节顺序

    我正在创建一个像这样的GUID Guid g new Guid new byte 0 1 2 3 4 5 6 7 8 9 0xA 0xB 0xC 0xD 0xE 0xF Console WriteLine g 这输出 03020100 05
  • 无法使用 PySpark 和 Databricks Connect 连接到 Azure Data Lake Gen2

    最近 Databricks 推出Databricks Connect that 允许您使用 Spark 本机 API 编写作业 并让它们在 Azure Databricks 群集上远程执行 而不是在本地 Spark 会话中执行 除非我尝试访
  • 从图片中选择主颜色

    我是 Dart Flutter 框架的新手 我仍在探索它们的可能性 我知道在 Android 中可以拍照并以编程方式从中提取主要颜色值 我想知道 在纯 Dart 中如何实现这一点 我希望它能够兼容 iOS 和 Android 操作系统 这是
  • Clojure 测试:测试断言的否定

    这对我有用 is thrown AbstractMethodError fun obj 1 但这却炸了 is not thrown AbstractMethodError fun obj 1 出现以下错误 java lang Runtime
  • Roslyn:如何加载 Visual Studio 之外的现有项目

    正如这个问题中所写 我可以从 MsBuild Task 类中访问 MsBuildWorkspace 吗 https stackoverflow com questions 27948207 can i access the msbuildw
  • 根据用户输入在 Laravel 中创建新表?

    我正在尝试根据 Laravel 框架中的用户输入创建新的 mysql 表 用户提交一个在控制器中处理的表单 保存表单数据 然后根据用户的输入创建一个新表 以便稍后接收数据 在 Laravel 中 可以使用 schema create 创建表
  • 使用 unique_ptr 的 value_type 构造 unordered_map

    这段代码似乎不起作用 因为唯一的指针被存储到一个pair对象中 然后尝试从中复制 这可以避免吗 std unordered map
  • OpenGL C++ 鼠标光线拾取 glm:unproject

    我目前正在开发 C 游戏引擎 我想在应用程序中构建鼠标交互 我之前通过光线拾取完成了此操作 但当时我使用了固定的鼠标位置 现在我想不使用它 我读到您可以使用 glm unProject 函数来执行此操作 但我的函数不起作用 该函数给出的坐标
  • 分页:找出项目所在的页面(给定主键和排序顺序)

    假设我像这样进行分页 SELECT article id article content FROM articles ORDER BY article rating OFFSET page 1 items per page LIMIT it
  • git push origin 和 git push origin master 有什么区别

    将本地 git 存储库的 master 分支推送到名为 origin 的远程存储库的 master 分支有什么区别吗 git push origin master或与git push origin 默认动作为git push and git
  • Go中如何使用剪贴板?

    如何使用 Go 复制到剪贴板或从中获取数据 我有点担心有文档中没有结果 http golang org search q clipboard and 谷歌给了我这个结果 https groups google com forum msg g
  • OpenGL alpha 测试 - 如何替换已弃用的 AlphaFunc?

    我正在尝试用 Alpha 绘制球体 但我的 Z 缓冲区有问题 有些像素是透明的 但会写入 Zbuffer 因此后面的不透明像素会被隐藏 这是我的设置 gl Enable gl DEPTH TEST gl DepthFunc gl LEQUA
  • 哪些 Java 库可用于生成 KML? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 如何正确计算两个日期之间的实际月份数?

    我已经按照方法getDiffDateMap计算两个日期之间的差异并返回Map分别表示毫秒 秒 分钟 小时 天 月和年的整数 public static Map
  • 业务逻辑是主观的吗? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 使用 Visual Studio 2013 和 Intel Fortran 编译混合 C++/C 代码

    我正在尝试编译一个简单的 C Fortran 混合程序 但存在链接问题 我使用的是Visual Studio 2013 Ultimate和Intel Visual Fortran Compiler XE 14 该程序非常简单 是从网上的某个
  • 我正在制作 PEMDAS 求解器,但不知道该写什么

    我正在尝试做一个PEMDAS https en wikipedia org wiki Order of operations用户输入 PEMDAS 问题的求解器 例如 他们输入 4 4 2 5 程序就会为他们解答 是否有任何代码可以让 py
  • OnNewText 事件后何时重绘 VirtualTreeView?

    我使用此代码来填充 VirtualStringTree 并允许重命名项目 Structure for the tree struct TVSTdata UnicodeString Name Initialization o
  • 如何停止散景服务器?

    我确实使用散景来绘制本地 LAN 上的实时传感器数据 Bokeh 是使用 popen 从我的 python 应用程序中启动的 Popen bokeh serve host localhost 5006 host 192 168 8 100
  • V100 和 P100 在 Google Compute Engine 上的可用性

    描述 我刚刚尝试了一段时间 使用我的个人帐户设置或保留用于机器学习的虚拟机 我在 n1 上使用了几个月 具有大约 8 GB 或更多 GB RAM 以及用于机器学习的 P100 或 V100 现在尝试了至少一半具有 P100 V100 可用性