为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？

2024-04-16

我正在尝试将 CUDA 添加到 90 年代末编写的现有单线程 C 程序中。

为此，我需要混合两种语言：C 和 C++（nvcc 是 c++ 编译器）。

问题在于 C++ 编译器将结构视为特定大小，而 C 编译器将相同的结构视为略有不同的大小。那很糟。我对此感到非常困惑，因为我找不到 4 字节差异的原因。

/usr/lib/gcc/i586-suse-linux/4.3/../../../../i586-suse-linux/bin/ld: Warning: size of symbol `tree' changed from 324 in /tmp/ccvx8fpJ.o to 328 in gpu.o

我的 C++ 看起来像

#include <stdio.h>
#include <stdlib.h>
#include "assert.h"
extern "C"
{
#include "structInfo.h" //contains the structure declaration
}
...

我的 C 文件看起来像

#include "structInfo.h"
...

structInfo.h 看起来像

struct TB {
   int  nbranch, nnode, root, branches[NBRANCH][2];
         double lnL;
}  tree;
...

我的 make 文件看起来像

PRGS =  prog
CC = cc
CFLAGS=-std=gnu99 -m32
CuCC = nvcc
CuFlags =-arch=sm_20
LIBS = -lm -L/usr/local/cuda-5.0/lib -lcuda -lcudart
all : $(PRGS)
prog: 
        $(CC) $(CFLAGS) prog.c gpu.o $(LIBS) -o prog
gpu.o:
        $(CuCC) $(CuFlags) -c gpu.cu

有人问我为什么不使用不同的主机编译选项。我认为主机编译选项自 2 版本前就已被弃用？还它似乎从未做到它所说的那样 https://devtalk.nvidia.com/default/topic/508479/cuda-programming-and-performance/nvcc-forces-c-compilation-of-cu-files/#entry1340190.

nvcc warning : option 'host-compilation' has been deprecated and is ignored

GPU 需要所有数据的自然对齐，例如4 字节 int 需要与 4 字节边界对齐，8 字节 double 或 long long 需要与 8 字节对齐。 CUDA 也对主机代码强制执行此操作，以确保代码的主机和设备部分之间的结构尽可能兼容。另一方面，x86 CPU 通常不需要数据自然对齐（尽管缺乏对齐可能会导致性能损失）。

在这种情况下，CUDA 需要将结构体的双精度部分与 8 字节边界对齐。由于奇数个 int 组件位于 double 之前，因此需要填充。切换组件的顺序，即将双组件放在前面，并没有帮助，因为在此类结构体的数组中，每个结构体都必须是 8 字节对齐，因此结构体的大小必须是 8 字节的倍数才能实现这一点，这也需要填充。

要强制 gcc 以与 CUDA 相同的方式对齐双精度数，请传递标志-malign-double.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？的相关文章

如何动态加载包含非托管代码的原始程序集？（绕过“无法验证的代码失败策略检查”异常）

我将举一个使用的例子系统 Data SQLite DLL http sqlite phxsoftware com 这是一个包含非托管代码的混合程序集如果我执行这个 var assembly Assembly LoadFrom System
如何使用 ILoggerFactory 记录 Polly 的重试

或者如何从静态方法记录 From https github com App vNext Polly https github com App vNext Polly你有这样的例子其中记录器神奇地可用 Policy Timeout 30
每次调用新方法时触发事件

我正在做一个logger for a c 应用程序需要记录每个方法被调用的时间以及每个方法执行时间我可以通过调用自己的方法来做到这一点EventLogger LogMethodCall方法在每个方法的开头但我想知道是否有办法使CLR每次
如何启动异步任务对象

我想开始收集Task同时处理对象并等待所有对象完成下面的代码显示了我想要的行为 public class Program class TaskTest private Task createPauseTask int ms works w
无缝滚动瓷砖地图

我正在开发一个自上而下的角色扮演游戏并且想要实现无缝滚动地图也就是说当玩家探索世界时地图之间没有加载屏幕也没有通往下一个区域的门我有两种方法可以打破世界在顶层我有区域它只是 9 个地图的集合这些区域仅由目录表示
StreamReader，C#，peek

我有一个 StreamReader 它偶尔会检查它是否有更多内容可以从简单的文本文件中读取它使用 peek 属性问题是当我使用 peek 时位置发生了变化尽管不应该发生 FileStream m fsReader new File
有没有办法将 boost::json::serializer 切换为美化输出？

Using boost json serializer如中的示例所示文档快速查看 http vinniefalco github io doc json json usage quick look html以紧凑格式保存 json tre
求一个数的因数。无法得到准确的结果

有人可以帮助纠正我的算法吗我已经对几个数字进行了测试但它没有输出完整的因式分解对于具有大量因子的数字它完全失败 int num 20 for int i 2 i lt num i if num i 0 cout lt lt i lt
WinForms - 表单大小错误

我们有以下代码 private void MainForm Shown object sender EventArgs e RepositionForm private void RepositionForm Rectangle rect
C++：初始化静态字符串成员

我在 C 中初始化静态字符串成员时遇到一些问题我有几个类每个类都包含几个表示 id 的静态字符串成员当我通过调用静态函数初始化变量时一切都很好但是当我想为一个变量分配另一个变量的值时它仍然保留空字符串这段代码有什么问题 st
Qt QML 数据模型似乎不适用于 C++

我一直在使用中的示例http doc qt digia com 4 7 qdeclarativemodels html http doc qt digia com 4 7 qdeclarativemodels html这是 QML 声明性数
命名空间“Microsoft”中不存在类型或命名空间名称“Practices”

我正在使用 Microsoft Visual Studio 2005 for c 我的代码中有以下命名空间 using Microsoft Practices EnterpriseLibrary using Microsoft Practi
本地主机上的 .net HTTP_X_FORWARDED_FOR NULL

抱歉如果其他地方已经回答了这个问题我找不到它如果没有我会尝试查找访问过该站点的机器的原始 IP 根据我的基本理解变量HTTP X FORWARDED FOR无论代理和其他过滤器如何都会显示用户的 IP 如果这是真的我正在尝试对
ASP.NET MVC 路由 - 向路由添加 .html 扩展名

我对 MVC 和路由非常陌生我被要求修改一个应用程序以使用不同的 url 由于我没有经验这项任务对我来说有点困难好吧让我们谈谈一些代码 routes MapRoute CategoryBySeName Route name prod
C++ 错误：从“char”到“const char*”的转换无效

我对 C 完全陌生我创建了这个函数 bool guessWord string compWord cout lt lt Guess a letter string userLetter cin gt gt userLetter for u
如何降级cuda版本

我目前使用的是 cuda 版本 4 2 但我需要将其更改为 3 1 是否可以卸载当前版本 4 2 版然后安装以前的版本 3 1 版编辑请参阅我的操作系统是linux ubuntu 10 04 64位编辑我找到了如何获取 3 1 版
未找到 _sqlite3_open 等符号错误

您好我收到此错误 Undefined symbols sqlite3 open referenced from main in ccRlWVer o sqliite3 close referenced from main in ccRlW
如何在 C# 中以编程方式创建柔和的颜色？

根据所需的颜色数量均匀分布地生成它们如果指定的计数为 8 则看起来像这样 List
扔掉挥发物安全吗？

大多数时候我都是这样做的 class a public a i 100 OK delete int j Compiler happy But is it safe The following code will lead compilat
如何从尖点库矩阵格式获取原始指针

我需要从尖点库矩阵格式获取原始指针例如 cusp coo matrix

随机推荐

PASSWORD_DEFAULT 与 PASSWORD_BCRYPT

PASSWORD DEFAULT 和 PASSWORD BCRYPT 有什么区别他们都使用Blowfish加密算法吗算法中的成本是什么如何在 PHP 中设置 password hash 产生 255 哈希长度而不是 60 现在PASS
RubyMine 无法识别 git 存储库中的 gem

我们有一个带有自定义 gem 的 git 存储库要安装它 Gemfile 有一行 gem my gem git gt email protected cdn cgi l email protection my gem git 安装 gem
在 Spark 2.4 中使用 Delta Lake 源时出错 (Hdinsight)

出现以下错误相同的代码在 Databricks 中有效但在 Hdinsight 中无效我还在类路径中添加了 delta 库和 hadoop azure 库 io delta delta core 2 11 0 5 0 org apac
Android Cordova 插件中的请求权限不会提示用户

我正在尝试编写一个 Cordova 插件以便为离子混合应用程序提供 Facebook 聊天头像浮动图标这需要 SYSTEM ALERT WINDOW 权限由于 Android M 及以上版本要求用户在应用程序第一次启动时授予权限因此
JS 数组在子组内排序

我有这个 JS 数组 Event code BW 114 Interest area Nursing and midwifery Start time 9 00 AM End time 3 00 PM Session type Tour a
如何在Java中打印递归程序中的值？

我正在尝试使用递归程序打印一个序列该序列从一个值开始达到最大值然后返回到原始值程序不能使用静态变量或全局变量也不能使用数组 Ex f 5 10 prints 5 6 7 8 9 10 9 8 7 6 5 我想我已经有了这个概念至
String类如何重写+运算符？

为什么在 Java 中当 String 是一个类时您可以使用运算符添加字符串在里面String java代码我没有找到这个运算符的任何实现这个概念违反了面向对象吗我们看一下Java中的以下简单表达式 int x 15 Strin
Python 多处理安装：命令“python setup.py Egg_info”失败，错误代码为 1

尝试安装 pip install multiprocessing 出现错误 Collecting multiprocessing Using cached multiprocessing 2 6 2 1 tar gz Complete ou
PHP 方法调用报告错误，该错误是未定义的方法

我相信我的类是正确的但是当我尝试回显类的输出时我在第 28 行收到错误 echo 你的全名行是第 28 行任何帮助都会很好这是我创建函数的地方检索全名 public function retrieve full name ful
复制 Photoshop sRGB 到 LAB 转换

我想要实现的任务是复制 Photoshop RGB 到 LAB 的转换为简单起见我将描述我如何仅提取 L 通道提取 Photoshop 的 L 通道这是 RGB 图像其中包括所有 RGB 颜色请点击下载为了提取 Photosh
以声明方式从 Postgres 字符串中获取最后一个单词

编辑这个问题的原始标题是以声明方式获取 Postgres 数组的最后一个元素 Postgres中如何获取数组的最后一个元素我需要以声明方式执行此操作因为我想将其用作 ORDER BY 标准我不想为它创建一个特殊的 PGSQL 函数
解决实现 ISerialized 的对象的循环引用

我正在编写自己的 IFormatter 实现但我想不出一种方法来解决两个都实现 ISerialized 的类型之间的循环引用这是通常的模式 Serializable class Foo ISerializable private Bar
刷新浏览器后 Font Awesome 图标消失

刷新页面 F5 后我的字形从 Internet Explorer 11 网页消失但是当我通过单击其菜单链接打开网页首次刷新后时页面显示正确在 Chrome 中即使按 F5 后也能正常工作我正在运行 Bootstrap v3
Retrofit 2 - 在 api 级别添加标头的优雅方式

我的改装2 2 0 2当前客户端需要向请求添加自定义标头我正在使用一个Interceptor将这些标头添加到所有请求中 OkHttpClient httpClient new OkHttpClient httpClient networ
如何在 Rails 中只显示一次 Flash 消息？

是否可以在 Rails 中只显示一次 Flash 消息我的意思是当我删除某些内容时闪光灯会显示已删除撤消然后如果我单击一下然后单击浏览器的后退按钮该消息仍然存在你可以使用 flash now 这是一个经验法则 In y
LinearLayout@422725b0 不是滑动抽屉

嗨我对此快疯了有几个问题但似乎没有一个能解决我的问题当我尝试设置抽屉布局样式时我收到错误
来自守护程序的错误响应：getsockopt：连接被拒绝

当我尝试从私有 Docker 注册表中提取映像时出现错误 Error response from daemon Get https XX XX XX XXX 5000 v1 ping dial tcp XX XX XX XXX 5000
使用 < 有什么区别？ java 泛型中的 extends SomeAbstract> 与 SomeAbstract

我将从 DotNet 转向 java 这种扩展的想法是新的我看过一些帖子充分解释了使用List
在 Python 的 for 循环中使用 next 安全吗？

考虑以下 Python 代码 b 1 2 3 4 5 6 7 a iter b for x in a if x 2 0 print next a 这将打印 3 5 和 7 是使用next在可靠构造上迭代的变量上您可以假设 StopIter
为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？

我正在尝试将 CUDA 添加到 90 年代末编写的现有单线程 C 程序中为此我需要混合两种语言 C 和 C nvcc 是 c 编译器问题在于 C 编译器将结构视为特定大小而 C 编译器将相同的结构视为略有不同的大小那很糟我对此感

为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？

为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？ 的相关文章

随机推荐

热门标签

为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？的相关文章