compileroptimization

clang 是否提供类似于 GCC 6.x 的函数多版本控制 (target_clones) 的功能？

我读了这篇 LWN 文章 https lwn net Articles 691932 饶有兴趣执行摘要 GCC 6 x 支持所谓的函数多版本控制它可以构建同一函数的多个版本并针对不同的指令集进行优化假设您有一台支持 AVX2 的机器

gcc Clang compileroptimization

为什么 clang 使用 -O0 生成低效的 asm（对于这个简单的浮点和）？

我正在 llvm clang Apple LLVM 版本 8 0 0 clang 800 0 42 1 上反汇编此代码 int main float a 0 151234 float b 0 2 float c a b printf f c

c Assembly x8664 compileroptimization llvmcodegen

在 VC++ 中，#pragma 相当于 /O2 编译器选项（优化速度）

根据msdn http msdn microsoft com en us library 8f8h5cxt aspx O2 最大速度相当于 Og Oi Ot Oy Ob2 Gs GF Gy 并根据msdn http msdn micros

visualc compileroptimization

为什么这个未使用的变量没有被优化掉？

我使用了 Godbolt 的 CompilerExplorer 我想看看某些优化有多好我的最小工作示例是 include

c gcc Clang compileroptimization

为什么 -march=native 很少使用？

对于大多数 C C 编译器有一个可传递给编译器的标志 march native 它告诉编译器调整为主机 CPU 的微架构和 ISA 扩展生成的代码即使它的名称不同基于 LLVM 的编译器通常也有一个等效的选项例如rustc or s

gcc Clang compileroptimization

C++ while 循环优化无法正常工作

我有这个代码段 include

c gcc compileroptimization integeroverflow

为什么 GCC 不将 aaaaaa 优化为 (aaa)(aaa)？

我正在对科学应用程序进行一些数值优化我注意到的一件事是 GCC 会优化调用pow a 2 通过将其编译成a a 但是调用pow a 6 没有优化实际会调用库函数pow 这大大降低了性能相比之下英特尔 C 编译器 http en wi

gcc Assembly floatingpoint compileroptimization fastmath

除非链接到 pthreads，否则不会出现死锁？

为什么创建 std mutex 死锁实际上不会导致死锁除非程序链接到 pthreads 以下内容在与 pthreads 库链接时会死锁如果未链接 pthreads 则不会死锁在 gcc 和 clang 上测试 clang main c

c Linker pthreads mutex compileroptimization

如何为单个函数设置 ICC 属性“fp-model precision”，以防止关联优化？

我正在实施卡汉求和 http en wikipedia org wiki Kahan summation algorithm 在支持 gcc47 gcc48 clang33 icc13 和 icc14 编译的项目中作为该算法的一部分我想

c gcc Clang compileroptimization ICC

switch 在 Visual C++ 中如何编译？它的优化程度和速度如何？

我发现我只能在 C 中使用数值switch陈述我认为它和一堆更深层的区别if else s 因此我问自己如何switch与不同if elseif elseif在运行速度编译时优化和一般编译方面我这里主要说的是MSVC 开关通常被编

c visualc switchstatement compileroptimization visualc2010

编译器优化导致性能下降

我有一个奇怪的问题我有以下代码 template

c visualc visualc6 compileroptimization

C++ 中的编译器指令重新排序优化（以及阻碍它们的因素）

我已将代码缩减为以下内容这在保留我感兴趣的编译器输出的同时尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa

c visualc Optimization compileroptimization

编译器处理包含保护头的开销有多大？

为了加速大型源文件的编译修剪翻译单元中使用的标头数量是否更有意义或者编译代码的成本是否远远超过处理包含保护的时间标头如果后者是真的那么工程工作最好花在创建更多轻量级的标头上而不是更少那么现代编译器需要多长时间才能处理有效包含

performance include preprocessor compileroptimization

C++ 编译器会优化重复的函数调用吗？

编译器通常或特别是否优化重复的函数调用例如考虑这种情况 struct foo member type m return type f const returns by value 函数定义在一个翻译单元中 return type f

c compileroptimization

编译器是否优化了净零位移？

我有一些代码如下面的代码块我不允许发布原始代码 cpp我认为正在编译的文件clang Ubuntu clang version 3 5 2 3ubuntu1 tags RELEASE 352 final based on LLVM 3

c Compilation compileroptimization Clang

如何正确确定Intel处理器的-march和-mtune？

我目前正在从源代码构建一个对我来说性能至关重要的软件因此我想对其进行优化以便在我的特定 Intel CPU 上运行构建过程要求我设置 march 和 mtune 标志如果在我的处理器节点上我使用 gcc march native

performance gcc x86 intel compileroptimization

如何加快这段 Java 代码的速度？

我正在尝试测试 Java 执行一项简单任务的速度有多快将一个大文件读入内存然后对数据执行一些无意义的计算所有类型的优化都很重要无论是以不同的方式重写代码还是使用不同的 JVM 欺骗 JIT 输入文件是一个由逗号分隔的 5 亿长的 3

为什么允许 gcc 从结构推测加载？

显示 gcc 优化和可能出现故障的用户代码的示例下面代码片段中的函数 foo 将仅加载结构成员 A 或 B 之一至少这是未优化代码的意图 typedef struct int A int B Pair int foo const Pai

c gcc Assembly x86 compileroptimization

对于采用 const 结构的函数，编译器不会优化函数体吗？

我有以下代码 include

c gcc compileroptimization

为什么编译器会生成这个程序集？

在逐步执行一些 Qt 代码时我遇到了以下情况功能QMainWindowLayout invalidate 有以下实现 void QMainWindowLayout invalidate QLayout invalidate minSiz

c gcc Assembly compileroptimization