Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃

2023-12-26

我使用简单的 MINST 神经网络程序在 Windows 10 上运行 tensorflow-gpu。当它尝试运行时，它遇到了CUBLAS_STATUS_ALLOC_FAILED错误。谷歌搜索没有发现任何东西。

I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:885] Found device 0 with properties:
name: GeForce GTX 970
major: 5 minor: 2 memoryClockRate (GHz) 1.253
pciBusID 0000:0f:00.0
Total memory: 4.00GiB
Free memory: 3.31GiB
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:906] DMA: 0
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:916] 0:   Y
I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 970, pci bus id: 0000:0f:00.0)
E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_blas.cc:372] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
W c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\stream.cc:1390] attempting to perform BLAS operation using StreamExecutor without BLAS support
Traceback (most recent call last):
  File "C:\Users\Anonymous\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1021, in _do_call
    return fn(*args)
  File "C:\Users\Anonymous\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\client\session.py", line 1003, in _run_fn
    status, run_metadata)
  File "C:\Users\Anonymous\AppData\Local\Programs\Python\Python35\lib\contextlib.py", line 66, in __exit__
    next(self.gen)
  File "C:\Users\Anonymous\AppData\Local\Programs\Python\Python35\lib\site-packages\tensorflow\python\framework\errors_impl.py", line 469, in raise_exception_on_not_ok_status
    pywrap_tensorflow.TF_GetCode(status))
tensorflow.python.framework.errors_impl.InternalError: Blas SGEMM launch failed : a.shape=(100, 784), b.shape=(784, 256), m=100, n=256, k=784
         [[Node: MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](_recv_Placeholder_0/_7, Variable/read)]]
         [[Node: Mean/_15 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/cpu:0", send_device="/job:localhost/replica:0/task:0/gpu:0", send_device_incarnation=1, tensor_name="edge_35_Mean", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/cpu:0"]()]]

对于 TensorFlow 2.2，当遇到 CUBLAS_STATUS_ALLOC_FAILED 问题时，其他答案都不起作用。找到了解决方案https://www.tensorflow.org/guide/gpu https://www.tensorflow.org/guide/gpu:

import tensorflow as tf
gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    try:
        # Currently, memory growth needs to be the same across GPUs
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
        logical_gpus = tf.config.experimental.list_logical_devices('GPU')
        print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
    except RuntimeError as e:
        # Memory growth must be set before GPUs have been initialized
        print(e)

我在进行任何进一步计算之前运行了此代码，发现之前产生 CUBLAS 错误的相同代码现在在同一会话中工作。上面的示例代码是一个具体示例，它设置了多个物理 GPU 之间的内存增长，但它也解决了内存扩展问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃的相关文章

Tensorflow：加权交叉熵中权重的解释

张量流函数tf nn weighted cross entropy with logits 接受论证pos weight The 文档 https www tensorflow org versions r0 11 api docs pyt
如何在Keras模型中替换（或插入）中间层？

我有一个训练有素的 Keras 模型我想要 1 用相同但没有偏差的Con2D层替换Con2D层 2 在第一次激活之前添加 BatchNormalization 层我怎样才能做到这一点 def keras simple model fro
如何保存 Tensorflow.js 模型？

我想制作一个创建保存和训练 tensorflow js 模型的用户界面但我无法在创建模型后保存模型我什至从tensorflow js文档复制了这段代码但它不起作用 const model tf sequential layers t
我的训练和验证代码（张量流）是否正确以及模型是否过度拟合？

这是我的代码 for it in range EPOCH 24410 BATCH SIZE tr pa tr sp sess run tr para tr spec train loss sess run loss fw op feed d
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d
处理后退导航 Windows 10 (UWP)

在我的 Xaml 页面中我有一个框架我正在尝试使用 backButton 事件来在frame 内导航所以我尝试使用这段代码 public MainPage this InitializeComponent if Windows Fou
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
支持 Nvidia CUDA 工具包 9.2

Tensorflow gpu 绑定到 Nvidia CUDA Toolkit 的特定版本的原因是什么当前版本似乎专门寻找 9 0 并且不适用于任何更高版本例如我安装了最新的 Toolkit 9 2 并将其添加到路径中但 Tensor
具有高级计算功能的 Keras 自定义层

我想写一些自定义的Keras分层并在层中进行一些高级计算例如使用 Numpy Scikit OpenCV 我知道有一些数学函数keras backend可以对张量进行操作但我需要一些更高级的功能但是我不知道如何正确实现这一点我收到
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
如何更改 x:Bind 的默认模式？

我不知道为什么他们决定设置默认值Mode to OneTime但这不是我大多数时候想要的浪费了我一整天的时间去调试有没有办法设置OneWay值作为默认值Mode of x Bind
Windows 10：如何防止切换或关闭应用程序

我正在为 Windows 10 设备开发一个应用程序该设备将在公共场所暴露给用户并且其硬件按钮将无法访问如何防止用户使用触摸屏手势关闭我的应用程序使用分配的访问权限设置您的应用程序 http www winbeta org news
UWP 关闭信息亭模式

我有一个发布到 Windows 应用商店的 UWP 应用程序并且该应用程序可以启动进入信息亭模式分配访问权限它工作得很好但我尝试在应用程序上创建一个按钮来关闭信息亭模式并返回到 Windows 登录屏幕我尝试了文档中给出的代码 h
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 Keras Tuner 调整模型时如何跳过有问题的超参数组合？

使用 Keras Tuner 时似乎没有办法允许跳过有问题的超参数组合例如 Conv1D 层中的过滤器数量可能与后续 MaxPooling1D 层中的池大小的所有值不兼容从而导致模型构建错误然而在运行调谐器之前可能不知道这一点一
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
此 JavaScript 如何在 Firefox 中打开 Windows 设置？

新安装 Firefox 45 开发版后我看到了这个页面它有一个按钮让我们开始吧单击该按钮时会以某种方式打开选择默认应用程序Windows 10 中的设置页面这是怎么做到的我无法通过开发者控制台在该页面上迷宫般的代码中找到任何内
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或

随机推荐

64 位计算机上的 32 位程序不会因 NullReferenceException 而崩溃

我有一段代码抛出一个NullReferenceException dataSource DataSource GetView 它抛出是因为dataSource is null GetView返回一个DataTable 但是当在一台计算机
Ruby 中的一行 if 语句

我有以下代码 if day gt 31 day 31 month April end 我可以把它写在一行中而不是 if day gt 31 then day 31 and month April end 我试过这样 if day gt 3
使用VideoJS播放器播放RTMP流

我正在尝试玩RTMP流式传输VideoJS玩家下面是我的代码
Wildfly 9 http 转 https

我想将请求从 HTTP 重定向到 HTTPS 我正在使用 Wildfly 9 经过谷歌搜索后我发现了以下内容但它不起作用我希望有人
如何在 Java 中将 BigInteger 值转换为十六进制

我正在制作一个Java程序我有一个 BigInteger 数字我需要将其转换为十六进制我尝试了以下代码 String dec null System out println Enter the value in Dec Buffere
更改特定数据的颜色

我想更改 json 文件中某些数据的颜色如果我有一个包含日期的数据集并且我想要 2017 年的日期为浅粉色我怎样才能在不影响2018年 2019年等的情况下实现这一目标日期 json文件 id 1 month 2017 03 01
大型 XML 文件和分页，可能吗？

问题当在您的计算机上本地打开非常大的 XML 文件时几乎可以肯定的是该文件需要一段时间才能打开这通常意味着您的计算机因认为没有响应而被锁定如果您为用户提供他们使用的相当复杂的数据库或系统的 XML 备份这就是一个问题他们能够打
WPF - 如何保存没有任何 Alpha 通道的 PNG？

我有一个BitmapSource 我将它保存为像这样的png PngBitmapEncoder enc new PngBitmapEncoder enc Frames Add myBitmapSource enc Save fs 如何在没有
C 中自动 stdout 缓冲区刷新的规则是什么？

我只是好奇应该满足哪些条件才能自动刷新标准输出缓冲区首先我很困惑这个伪代码不会在每次迭代时打印输出 while 1 printf Any text sleep 1 但如果我添加换行符它就会经过几次实验我发现在我的机器上标准输出缓冲
用 C++ 模拟 CPU 负载

我目前正在使用 C 在 Windows 中编写一个应用程序我想模拟 CPU 负载我有以下代码 void task1 void param unsigned elapsed 0 unsigned t0 while 1 if t0 cloc
批处理文件检查具有相同扩展名的文件

所以我不太擅长代码我有一个代码可以检查扩展名文件的大小 txt我需要它来验证具有该扩展名的所有文件如果大于限制则写入一个例如 size txt里面是超出大小限制的文件的名称我已经拥有并给我的代码是它没有写入文件的部分size
Spring Flux 和 Async 注解

我有一个 Spring Flux 应用程序在某些时候我需要在后台执行一些繁重的任务调用者 HTTP 请求不需要等到该任务完成如果没有反应堆我可能会使用Async https docs spring io spring framew
使用浮点数求级数总和

我计算了该系列的前 20 个元素有两种方式第一种向前第二种向后为此我做了 include
构造函数和 Pydantic

我想创建一个带有构造函数的 Pydantic 类该构造函数对输入进行一些数学运算并相应地设置对象变量 class PleaseCoorperate BaseModel self0 str next0 str def init self p
从 Java 输入流读取下一个字符（完整的 unicode 代码点）

我需要逐个字符地解析UTF 8输入来自文本文件按字符我指的是完整的UTF 8字符 UTF 8代码点而不是Java的字符我应该使用什么方法 There s CharSequence codePoints https docs orac
有没有办法“传播”或“扁平化”GraphQL 响应？

我有一个如下所示的 GraphQL 查询 allContentfulDocuments edges node documents id 有什么办法可以压平edges and node层变成基本上像这个查询一样工作的东西 allConten
多进程和子进程有什么区别？

我的工作应该使用并行技术并且我是Python的新用户我想知道你是否可以分享一些关于Python的材料multiprocessing and subprocess模块这两者有什么区别 The subprocess模块允许您运行和控制其他
是否存在完全“布局中立”的 HTML 容器元素？

有时我想在其他几个 HTML 元素周围放置一个包装元素带着唯一的目的设置一个方便的 CSS 选择器来引用所有包含的元素
获取 N 维 numpy 数组中第一次出现的值

我见过这个问题 https stackoverflow com questions 432112 is there a numpy function to return the first index of something in an
Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃

我使用简单的 MINST 神经网络程序在 Windows 10 上运行 tensorflow gpu 当它尝试运行时它遇到了CUBLAS STATUS ALLOC FAILED错误谷歌搜索没有发现任何东西 I c tf jenkins

Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃

Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃 的相关文章

随机推荐

热门标签

Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃的相关文章