我可以让我的编译器在每个函数的基础上使用快速数学吗？

2023-11-27

假设我有

template <bool UsesFastMath> void foo(float* data, size_t length);

我想编译一个实例-ffast-math (--use-fast-math对于 nvcc），以及没有它的另一个实例化。

这可以通过在单独的翻译单元中实例化每个变体并使用不同的命令行（带或不带开关）编译每个变体来实现。

我的问题是是否可以向流行的编译器（*）指示应用或不应用-ffast-math对于单个函数 - 这样我就能够在同一个翻译单元中进行实例化。

Notes:

如果答案是“否”，解释原因的奖励分。
这与以下问题不同this one，这是关于在运行时打开和关闭快速数学。我比较谦虚...

(*) 流行的编译器是指您拥有相关信息的 gcc、clang、msvc icc、nvcc（用于 GPU 内核代码）中的任何一个。

在 GCC 中，您可以声明如下函数：

__attribute__((optimize("-ffast-math")))
double
myfunc(double val)
{
    return val / 2;
}

这是 GCC 特有的功能。

请参阅此处的工作示例 ->https://gcc.gnu.org/ml/gcc/2009-10/msg00385.html

看来 GCC 没有验证 optimize() 参数。因此，像“-ffast-match”这样的拼写错误将被默默地忽略。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

gcc

floatingpoint

nvcc

fastmath

templateinstantiation

我可以让我的编译器在每个函数的基础上使用快速数学吗？的相关文章

为什么 GCC 不将这个“printf”优化为“puts”？

这是我的测试代码 include
#pragma init 和 #pragma fini 在 Linux 上使用 gcc 编译器

我想构建一些代码在加载共享库时调用一些代码我想我会这样做 pragma init my init static void my init do something int add int a int b return a b 所以当我用
通过 VLA 数组跳转到 goto 时出现分段错误

以下示例演示了该问题 include
在标准库中静态链接时如何支持动态插件？

假设一个应用程序myapp exe是使用构建的g 它使用标志 static libstdc 这样就可以安装在没有环境的情况下libstdc so myapp exe还添加了对某些功能的插件支持plugf可以通过动态加载dlopen来自共享库
解析 std::type_info::name 的结果

我目前正在编写一些日志记录代码这些代码应该除其他外打印有关调用函数的信息这应该是比较容易的标准C 有一个type info班级这包含 typeid 类函数等的名称但它已经损坏了这不是很有用 IE typeid std v
如何让 gcc 生成合适的代码来检查缓冲区是否充满 NUL 字节？

我正在实现一个解析磁带档案的程序解析器逻辑的一部分是检查存档结束标记该标记是一个充满 NUL 字节的 512 字节块我为此编写了以下代码希望 gcc 能对此进行很好的优化 int is eof block const char us
安装 python-dev 和链接库后，Cython 中的 Hello World 程序因 gcc 失败

我创建了一个简单的 hello world 程序并尝试使用 gcc 执行生成的 C 程序但无论我做什么我都会得到大量未定义的引用 SO 有很多类似的问题但他们都说安装 python dev 或其某些变体或添加用于链接和加载库的标志
如何为 iPhone 构建静态库？

我想我已经到处寻找问题的答案但没有运气我正在尝试创建一个简单的静态库来在 iPhone 设备上运行但我总是以 XCode 结束说文件不属于必需的架构并且我已经尝试了我发现的每个构建标志但没有任何运气我已经让它在模拟器上工作了
隐式转换和编译器的不同行为

Motivated by this question https stackoverflow com q 51972738 5800831 I created the following code struct X X int struct
GCC编译非常慢（文件大）

我正在尝试编译一个大的 C 文件专门用于 MATLAB mexing C 文件大约 20 MB 可用来自 GCC 错误跟踪器 https gcc gnu org bugzilla attachment cgi id 36632如果你想玩一
./configure 使用指定版本的 g++

如何告诉配置文件使用指定版本的 g 进行编译 Thanks 在 bash shell 中您可以执行以下操作 configure CC gcc 2 95 其他 shell 也会有类似的技术但我无法帮助您了解具体细节如果您的项目是 C
GCC 从 C++ 程序生成的汇编代码中的 .cfi 和 .LFE 是什么？

我有以下 C 代码 int factorial int n if n 0 return 1 return n factorial n 1 int main void factorial 5 return 0 当我使用 g S Factori
由于符号链接错误，无法在 Mac OSX 10.8.1 中安装 ruby-1.9.2

首先我尝试了常见的rvm安装 rvm安装1 9 2 但是显示了以下错误 The provided compiler usr bin gcc is LLVM based it is not yet fully supported by r
如何手动（按位）执行（浮动）x？

现在这是我应该实现的函数的函数头 float from int Return bit level equivalent of expression float x Result is returned as unsigned int bu
使用 GNU C 内联汇编在 VGA 内存中绘制字符

我正在学习使用 C 和内联汇编在 DOS 中进行一些低级 VGA 编程现在我正在尝试创建一个在屏幕上打印出字符的函数这是我的代码 This is the characters BITMAPS uint8 t characters 464
与 glib-2.0 链接时，cygwin gcc 4.3 中的参数顺序很重要

我正在尝试使用 cygwin 编译适用于 os x 和 linux 的代码然而我发现 gcc 的参数顺序给出了意想不到的结果例如以下情况会失败 gcc std gnu99 I usr include glib 2 0 I usr l
为什么 Go 中只有 int 而没有 float？

在 Go 中有这样的类型int这可能相当于int32 or int64取决于系统架构我可以声明一个整数变量而不用担心它的大小 var x int 为什么没有这个类型float 这相当于float32 or float64取决于我的系统架
如何转储所有 NVCC 预处理器定义？

我想达到同样的效果 gcc dM E lt dev null 如所描述的here https stackoverflow com q 2224334 1593077 但对于 nvcc 也就是说我想转储所有 nvcc 的预处理器定义唉 n
gcc，我可以将 offsetof() 与指向成员的模板化指针一起使用吗？

下面的代码在这里 https ideone com XnxAyw https ideone com XnxAyw 我得到的编译器错误是 prog cpp In member function size t list base
C++ 标准是否指定了编译器的 STL 实现细节？

在写答案时this https stackoverflow com questions 30909296 can you put a pimpl class inside a vector我遇到了一个有趣的情况这个问题演示了这样一种情况

随机推荐

在 C++11 中使用静态变量是否有惩罚

在 C 11 中这样 const std vector
防止网页“过度滚动”

在 Mac 版 Chrome 中人们可以过度滚动页面因为没有更好的词了如下面的屏幕截图所示以查看后面有什么类似于 iPad 或 iPhone 我注意到有些页面已禁用它例如 Gmail 和新选项卡页面如何禁用过度滚动
让java和flash互相对话

我有一个用java编写的应用程序我想为其添加一个flash前端 Flash 前端将与独立 Flash 播放器中的 Java 应用程序在同一台计算机上运行我需要两个部分之间的双向通信并且不知道如何开始解决这个问题我想我可以在两个程序之
如何在 AX 2012 中设置单个维度值？

我的问题是设置从外部源读取的一些尺寸值鉴于 AX 2009 声明 ledgerJournalTrans Dimension ledgerTable Dimension ledgerJournalTrans Dimension 1 abc
如何在 JNI 中访问从 C++ 返回 java.lang.String 的 Java 方法的返回值？

我试图从 C 调用的 Java 方法传回一个字符串我无法找出应该调用哪个 JNI 函数来访问该方法并返回 jstring 值我的代码如下 C part main jclass cls jmethodID mid jstring rv o
用 mutate 替换部分字符串（在管道中）

我想替换字符串的一部分在前两个下划线之间第一组始终为 i 如下面的基本 R 示例所示 library dplyr library stringr d lt tibble txt c i 0000 GES i 0000 OISO i 00
Scrapy - 从表中提取项目

试图了解 Scrapy 但遇到了一些死胡同我在一页上有 2 个表想从每个表中提取数据然后移至下一页表看起来像这样第一个称为 Y1 第二个称为 Y2 并且结构相同 div style margin bottom 0px margin
ios - 使用新的 instagram graph api 登录 instagram？

Instagram 贬值了旧的 Instagram 平台 API 提出了 facebook 广泛涉及的 Graph API 但据我了解它并不是替代品我只打算在我的应用程序中使用 Instagram 进行登录例如 Facebook 登录
C++：将容器转换为不同但兼容类型的容器

我经常遇到有一个容器C 或任何类型的包装类甚至智能指针的类型T1 并想要转换这样的C
有没有办法记住 python 迭代器中的位置？

我想迭代一个可迭代对象比方说一个列表并在某个时刻记住我离开的位置以便下次调用该对象的迭代器时继续就像是 for val in list do stuff val if some condition break do stuff f
如何生成两个已知点之间的坐标

背景我正在研究交通路线 Google 提供了足够远的路线点来创建形状这些是您在 Google 地图中看到的巴士火车路线我的要求谷歌的点足够远来创建直线然而我想要每 5 米一个点 Problem 所以假设我有两点 lat lo
ListView.DataSource 中 rowHasChanged 的确切输入是什么

在 React Native 示例中他们给了我们这段代码 getInitialState function return dataSource new ListView DataSource rowHasChanged row1 row2
AppDomain.CurrentDomain.DomainUnload 不会在控制台应用程序中引发

我有一个程序集当访问时它会启动一个线程来处理放置在队列中的项目在该程序集中我将一个处理程序附加到 DomainUnload 事件 AppDomain CurrentDomain DomainUnload new EventHandl
\r\n、\r 和 \n 之间有什么区别？ [复制]

这个问题在这里已经有答案了字符串之间有什么区别 r n r and n 字符串如何受到每个因素的影响我必须替换出现的情况 r n and r with n 但我不明白它们在字符串中有何不同我知道 r就像按回车键一样 n是为了一条新线
android.permission.WRITE_SECURE_SETTINGS 错误

您好我的问题是当我尝试更改天气或未启用 GPS 设置时出现以下错误10 20 05 44 31 890 E AndroidRuntime 889 java lang SecurityException Permission denia
CSS 垂直旋转文本 - 两侧有额外空间

当我使用文本旋转和内联图层时它会在旋转上添加额外的空间大文本的宽度我不想修复使用 CSS 旋转时避免两侧出现额外空间元素宽度的最佳方法是什么下面是我的代码 rotate display inline block white s
为什么 grails 中的转发和重定向不会停止初始操作的执行？

我读到forward and redirect在 Grails 中不明白为什么下面的代码打印 foo See def bar redirect controller public action index same happens wit
iOS 确定 VoiceOver 是否仍在说话

有没有办法确定 VoiceOver 当前是否正在播报以及何时停止我尝试过 UIAccessibilityVoiceOverStatusChanged 但我的理解是只有当您打开或关闭 VoiceOver 时才会出现这种情况任何帮助将不胜
控制不透明度

是否可以使控件半透明你的问题的直接答案是不 WinForms 支持表单级别的半透明形状不透明度但不是控件如果这很重要我会使用分层形式如果此功能很重要并且可以选择更改框架那么 WPF 确实支持半透明控件
我可以让我的编译器在每个函数的基础上使用快速数学吗？

假设我有 template

我可以让我的编译器在每个函数的基础上使用快速数学吗？

我可以让我的编译器在每个函数的基础上使用快速数学吗？ 的相关文章

随机推荐

热门标签

我可以让我的编译器在每个函数的基础上使用快速数学吗？的相关文章