Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用）

2024-02-01

更新：这个问题与Google Colab的“笔记本设置：硬件加速器：GPU”有关。这个问题是在添加“TPU”选项之前写的。

阅读了有关 Google Colaboratory 提供免费 Tesla K80 GPU 的多个令人兴奋的公告，我尝试运行fast.ai http://course.fast.ai/教训它永远不会完成 - 很快就会耗尽内存。我开始调查原因。

最重要的是，“免费 Tesla K80”并不是对所有人来说都是“免费”的——对于某些人来说，只有一小部分是“免费”的。

我从加拿大西海岸连接到 Google Colab，但本应是 24GB GPU RAM 的却只有 0.5GB。其他用户可以使用 11GB GPU RAM。

显然 0.5GB GPU RAM 不足以满足大多数 ML/DL 工作的需要。

如果您不确定会得到什么，这里是我整理的一些调试功能（仅适用于笔记本电脑的 GPU 设置）：

# memory footprint support libraries/code
!ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smi
!pip install gputil
!pip install psutil
!pip install humanize
import psutil
import humanize
import os
import GPUtil as GPU
GPUs = GPU.getGPUs()
# XXX: only one GPU on Colab and isn’t guaranteed
gpu = GPUs[0]
def printm():
 process = psutil.Process(os.getpid())
 print("Gen RAM Free: " + humanize.naturalsize( psutil.virtual_memory().available ), " | Proc size: " + humanize.naturalsize( process.memory_info().rss))
 print("GPU RAM Free: {0:.0f}MB | Used: {1:.0f}MB | Util {2:3.0f}% | Total {3:.0f}MB".format(gpu.memoryFree, gpu.memoryUsed, gpu.memoryUtil*100, gpu.memoryTotal))
printm()

在运行任何其他代码之前在 jupyter 笔记本中执行它会给我：

Gen RAM Free: 11.6 GB  | Proc size: 666.0 MB
GPU RAM Free: 566MB | Used: 10873MB | Util  95% | Total 11439MB

获得完整卡的幸运用户将看到：

Gen RAM Free: 11.6 GB  | Proc size: 666.0 MB
GPU RAM Free: 11439MB | Used: 0MB | Util  0% | Total 11439MB

您是否发现我从 GPUtil 借用的 GPU RAM 可用性计算有任何缺陷？

您能否确认，如果您在 Google Colab 笔记本上运行此代码，您会得到类似的结果吗？

如果我的计算正确，有什么办法可以在免费盒子上获得更多 GPU RAM 吗？

更新：我不知道为什么我们中的一些人得到的只是其他用户的 1/20。例如帮助我调试这个的人来自印度，他掌握了整个事情！

note：请不要再发送任何有关如何消除可能消耗 GPU 部分的潜在卡住/失控/并行笔记本的建议。不管你如何划分它，如果你和我在同一条船上并运行调试代码，你会发现你仍然获得总共 5% 的 GPU RAM（截至本次更新）。

因此，为了防止另外十几个答案在该线程建议的上下文中无效，建议 !kill -9 -1，让我们关闭该线程：

答案很简单：

截至撰写本文时，Google 仅向我们中的一些人提供 5% 的 GPU，而向其他人提供 100%。时期。

2019 年 12 月更新：问题仍然存在 - 这个问题的赞成票仍在继续。

2019 年 3 月更新：一年后，一位 Google 员工 @AmiF 评论了事情的现状，指出该问题不存在，任何似乎遇到此问题的人都需要简单地重置其运行时来恢复内存。然而，投票仍在继续，对我来说这表明问题仍然存在，尽管@AmiF 提出了相反的建议。

2018 年 12 月更新：我有一个理论认为，当 Google 的机器人检测到非标准行为时，Google 可能会将某些帐户或浏览器指纹列入黑名单。这可能完全是巧合，但在相当长的一段时间里，我在任何需要谷歌重新验证码的网站上都遇到了问题，在这些网站上，我必须先完成数十个谜题才能被允许通过，通常是这样。我花了 10 分钟以上才能完成。这种情况持续了好几个月。突然之间，从这个月开始，我完全没有任何困惑，任何谷歌重新验证码只需单击鼠标即可解决，就像一年前一样。

我为什么要讲这个故事？嗯，因为同时我在 Colab 上获得了 100% 的 GPU RAM。这就是为什么我怀疑如果你在理论上的谷歌黑名单上，那么你就不会被信任获得大量免费资源。我想知道你们中是否有人发现有限的 GPU 访问和重新验证码噩梦之间存在相同的相关性。正如我所说，这也可能完全是巧合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用）的相关文章

InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

首先遍历图广度，在 Haskell 中标记访问过的节点

所以问题很简单给定一个图我希望图的结构在这个问题中并不重要我该如何对其进行 BFS 呢我最近问了一个关于生成列表的问题其中每个元素都将许多元素附加到其末尾希望答案应该能让我创建一个执行 BFS 所需的队列但是搜索还需要另一个关
SQL Server 中更新查询后插入

我有一个存储在存储过程中的更新查询我想在执行存储过程后插入更新的查询这是我的存储过程 ALTER PROCEDURE dbo sp assign account id agency int month nvarchar 2 region
如何仅克隆 Git 存储库的子文件夹并使子文件夹中的所有文件最终位于根目录中？

我意识到以前也有人问过类似的问题如何仅克隆 Git 存储库的子目录 https stackoverflow com questions 600079 is there any way to clone a git repositorys
如何用Python绘制ROC曲线

我正在尝试绘制 ROC 曲线来评估我使用逻辑回归包在 Python 中开发的预测模型的准确性我计算了真阳性率和假阳性率但是我无法弄清楚如何使用正确绘制这些matplotlib并计算AUC值我怎么能这么做呢您可以尝试以下两种方法假
使用自定义基本 URL 为 Keycloak docker 配置反向代理

我怎样才能设置docker keycloak base url作为参数我有以下 nginx 反向代理配置 server listen 80 server name example com location keycloak proxy p
从 pandas 数据框中选择特定索引、列对

我有一个数据框x x pd DataFrame np random randn 3 3 index 1 2 3 columns A B C x A B C 1 0 256668 0 338741 0 733561 2 0 200978 0
如何使用 ASCII 符号绘制图像？

我正在尝试从图像制作 ASCII 艺术但由于某种原因输出总是旋转我检查了我的代码很多次但我根本找不到错误我猜这与imageWidth and imageHeight但对我来说一切看起来都很好代码可以在github https g
NotSerializedException org.neo4j.kernel.EmbeddedGraphDatabase

我正在使用 neo4j 创建图表将 mongodb 中的数据作为文档独立代码运行良好没有风暴但是在将其与 Storm 集成时我得到了 java io NotSerializedException org neo4j kernel
使用 VBA 过滤函数时的性能注意事项

我不明白 Filter 功能如何运行得这么快我对各种数据使用了 Filter 无论数据类型如何 Filter 都会消除我使用的任何替代方法我经常使用由 Stephen Bullen 编写的二分搜索算法和 QuickArraySort 算
从 R 中的给定字符串中提取日期

这是我有的一个字符串 7MA S VE MS FB MEASURE P1 2013 08 21 17 42 19 BMP 我正在尝试以这种方式提取日期 library stringr as Date str extract test 0 9
如何向多个收件人发送消息？

我在使用 Gmail API 向多个地址发送邮件时遇到一些问题我已成功将一封邮件仅发送到一个地址但当我在邮件中包含多个以逗号分隔的地址时出现以下错误 To field 请求时发生错误 https www googleapis com
如何避免在多态打印宏中使用 #if

让我们尝试运行以下代码 include
JavaScript 获取数组的一部分

如何创建一个新数组其中包含旧数组中编号为第 n 到第 n k 的所有元素你想要的slice https developer mozilla org en US docs JavaScript Reference Global Objec
Python ZeroMQ PUSH/PULL——丢失消息？

我正在尝试使用python with zeroMQ in PUSH PULL模式发送大小的消息4 MB 每隔几秒钟由于某种原因虽然看起来所有消息都已发送但服务器似乎只收到了其中一些消息我在这里缺少什么这是客户端的代码 clien
SQL查询获取具有子记录列表的父表记录

我在 MS SQL Server 2005 数据库中有两个表父表和子表其中父表可能与许多子记录相关 Child parent id 与 parent id 相关子表也有列 foo 我需要带回父表中的所有记录其中 child foo
如何在 Python 上使用 Xlib 模拟鼠标点击

出于教育目的我开始使用以下命令编写 python 脚本cwiid and Xlib这样我就可以像鼠标一样使用我的wiimote 到目前为止我已经通过调用让光标移动disp warp pointer dx dy 然后打电话disp syn
SVGSVGElement.children 在 IE11 中不起作用？

我这里有一个非常简单的jsfiddle http jsfiddle net 9uS3u http jsfiddle net 9uS3u 它由以下 html 组成
httprequest.getsession 返回 null

我编写了一个过滤器它将使当前会话无效并创建新会话并将旧会话的属性复制到新会话中这在 tomcat5 和 jdk 1 4 中工作正常但是当我将其切换到 tomcat6 和 jdk 1 6 时一旦过滤器运行然后处理下一个请求httpr
如何使用 Python 跟踪在网络浏览器中打开的网页？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想编写一个 Python 脚本它可以跟踪我的网络浏览器 Mozilla Firefox 23 中打开了哪些网页我不知道从哪里开始
Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用）

更新这个问题与Google Colab的笔记本设置硬件加速器 GPU 有关这个问题是在添加 TPU 选项之前写的阅读了有关 Google Colaboratory 提供免费 Tesla K80 GPU 的多个令人兴奋的公告我尝试

Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用）

Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用） 的相关文章

随机推荐

热门标签

Google Colaboratory：有关其 GPU 的误导性信息（仅 5% RAM 可供某些用户使用）的相关文章