Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果

2024-02-27

我正在尝试实现一个程序来测试 GPU 设备上的 Tensorflow 性能。数据测试是MNIST数据，使用多层感知器（神经网络）进行监督训练。我跟着这个简单的例子 http://gist.github.com/nishidy/8176548ecf37b8fab5c028aab8776b8f但我将性能批量梯度的数量更改为10000

for i in range(10000) :
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(train_step,feed_dict={x : batch_xs, y_ : batch_ys})
if i % 500 == 0:
    print(i)

最终，当我使用此代码检查预测准确性时

correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,"float"))
print(sess.run(accuracy,feed_dict={x:mnist.test.images,y_:mnist.test.labels}))
print(tf.convert_to_tensor(mnist.test.images).get_shape())

事实证明，CPU 和 GPU 的准确率不同：GPU 返回的准确率约为 0.9xx，而 CPU 仅返回 0.3xx。有谁知道原因吗？或者为什么会发生这个问题？

造成这种行为的主要原因有两个（除了错误之外）。

数值稳定性

事实证明，数字相加并不完全像看起来那么容易。假设我想将一万亿个 2 加在一起。正确答案是二万亿。但是，如果您在字长仅为（例如 32 位）的机器上以浮点形式将它们加在一起，一段时间后，您的答案将陷入较小的值。原因是一段时间后，您添加的 2 低于浮点和尾数的最小位。

这类问题在数值计算中比比皆是，这种特殊的差异在 TensorFlow 中是已知的（1 https://github.com/tensorflow/tensorflow/issues/5527,2 https://github.com/tensorflow/tensorflow/issues/3775，仅举几例）。您可能正在看到这种效果。

初始条件

训练神经网络是一个随机过程，因此，它取决于您的初始条件。有时，特别是如果你的超参数没有调整得很好，你的网络会陷入一个糟糕的局部最小值附近，最终你会得到平庸的行为。调整优化器参数（或者更好，使用像 Adam 这样的自适应方法）可能会有所帮助。

当然，尽管如此，这是一个相当大的差异，所以我会仔细检查你的结果，然后再将其归咎于底层数学包或运气不好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果的相关文章

如何传递架构以从现有数据帧创建新数据帧？

要将 schema 传递到 json 文件我们这样做 from pyspark sql types import StructField StringType StructType IntegerType data schema Stru
使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案由于存储信息的性质以及信息的不同值和键我们决定使用文档存储数据库因为它完全适合目的在本例中我们选择 MongoDB 作为此 CRM 解决方案的一部分我们希望存储实体之间的关
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
嵌套作用域和 Lambda

def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp

随机推荐

Cocos2d for android 支持不同分辨率

我正在尝试构建一款游戏并且想知道如何支持不同的分辨率和屏幕尺寸对于精灵的位置我实现了一个基本函数它根据一定的比例设置位置这是通过从sharedDirector的winSize方法获取屏幕宽度和高度获得的但这种方法没有经过测试因
使用 std::fill 用递增的数字填充向量

我想填写一个vector
git status --ignored 无限期挂起

tl dr 跑步git status ignored在我的项目的根永远不会完成 git status工作正常我开始从我的 IDE PhpStorm 中看到此问题的症状尽管此问题适用于所有 IntelliJ IDE 没有与 git 相关的
如何在 TreeTable 的第二列中显示树线

我正在使用 TreeTable com jidesoft grid 请参阅树表 http www jidesoft com javadoc com jidesoft grid TreeTable html 来显示分层数据它在第一列上使用特
typedef 和模板参数同名

为什么这种情况不正确这是合乎逻辑的 template
Python物理库？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有适用于 Linux 的 Python 的最新物理库我刚刚开始使用 PyGame 来学习 Pyt
您如何处理 C# 的新功能，以免它们导致编写出糟糕的代码？

C 3 0 中引入了许多让我感到不安的功能例如对象初始值设定项扩展方法和隐式类型变量现在在 C 4 0 中像动态关键字这样的东西我变得更加担心我知道这些功能中的每一个CAN以适当的方式使用BUT在我看来它们使开发人员更容易做出
如何从我的应用程序将信用卡添加到 Google Pay？

我正在开发移动银行应用程序显然它管理我们的银行信用卡所以现在我需要在我的应用程序中实现将此卡添加到 Google Pay 按钮但如何为此执行 Google Pay API 请求我无法找到任何相关文档这这里只有一个关于 SO 的问
如何知道用户是否已付费订阅

我正在看这个tutorial https www patchesoft com paypal api subscription php创建我自己的贝宝订阅网关我以前从未对 API 如此困惑和迷失过因此当我们创建计划时我们会设置商家偏
相同的元组给出不同的泡菜

这种情况很奇怪我希望有一些关于 pickle 模块的东西我不知道我有两个元组s1 and s2 如果我比较它们它会返回True s1 s2 True 如果我腌制它们并比较结果它会返回False pickle dumps s1 pick
Kendo UI 工具提示显示，访问目标？

可以通过传递参数来访问目标e到匿名函数获取内容 gridToolTipz grid kendoTooltip filter td role gridcell content function e var target e target th
SOAP 和 REST 如何与 XML/JSON 响应配合使用？

这是一个在堆栈溢出时一次又一次被问到的非常常见的问题我读了很多关于这个问题的答案但我仍然有点困惑我需要从 iPhone sdk 调用网络服务这是我的问题我不清楚 SOAP 或 REST 返回什么响应是否有什么具体说明如果响应是
是否有布尔值的后赋值运算符？

你好 Java 中可能有这样的事情吗 boolean flag true if flag return flag false return true and assign false to flag afterwards 澄清上面的方法有
在 redshift postgresql 中我可以使用复制功能跳过列吗

我有一个 csv 表 t1 其中包含以下列亚马逊 S3 存储中的 c1 c2 c3 我想将其复制到亚马逊红移中我创建包含以下列的表 c1 c2 c3 其中所有列均可为空我用命令复制复制 t1a c1 c3 从 t1 我预计它会从 t
本地网络上的 WebRTC？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我一直在阅读有关 WebRTC 的内容它看起来非常有前途我想制作一个简单的局域网游戏自动连接同一网络上的人们尽管我可以找到人们
此电子邮件验证正则表达式中不可打印控制字符的用途是什么？

背景资料我们使用 SonarQube 来获取有关代码库的质量指标根据规则 SonarQube 在我们的 Node js 代码库中标记了十多个错误S6324 https rules sonarsource com javascript R
多线程Python请求[重复]

这个问题在这里已经有答案了对于我的学士论文我需要从大约 40000 个网站中获取一些数据因此我使用 python 请求但目前从服务器获取响应非常慢有没有办法加快速度并保持当前的标题设置我发现的所有教程都没有标题这是我的代码片
如何使用 Firebase 在 Flutter 中使用 Future Builder 将两个 Future 的结果合并为一个 Future

所以基本上我想将两个查询的结果添加到一个查询中删除重复项然后显示我该怎么做 Future
iOS开发中“线程”和“队列”有什么区别？ [复制]

这个问题在这里已经有答案了我是 iOS 开发新手现在我对两个概念很困惑线程和队列我所知道的是它们都是关于多线程编程的谁能为我解释这两个概念以及它们之间的区别提前致谢 NSOperationQueue 和 NSThread 的
Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果

我正在尝试实现一个程序来测试 GPU 设备上的 Tensorflow 性能数据测试是MNIST数据使用多层感知器神经网络进行监督训练我跟着这个简单的例子 http gist github com nishidy 8176548ec

Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果

Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果 的相关文章

随机推荐

热门标签

Tensorflow 相同的代码，但从 CPU 设备到 GPU 设备得到不同的结果的相关文章