Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
clang 是否提供类似于 GCC 6.x 的函数多版本控制 (target_clones) 的功能?
我读了这篇 LWN 文章 https lwn net Articles 691932 饶有兴趣 执行摘要 GCC 6 x 支持所谓的函数多版本控制 它可以构建同一函数的多个版本 并针对不同的指令集进行优化 假设您有一台支持 AVX2 的机器
gcc
Clang
compileroptimization
为什么 clang 使用 -O0 生成低效的 asm(对于这个简单的浮点和)?
我正在 llvm clang Apple LLVM 版本 8 0 0 clang 800 0 42 1 上反汇编此代码 int main float a 0 151234 float b 0 2 float c a b printf f c
c
Assembly
x8664
compileroptimization
llvmcodegen
在 VC++ 中,#pragma 相当于 /O2 编译器选项(优化速度)
根据msdn http msdn microsoft com en us library 8f8h5cxt aspx O2 最大速度 相当于 Og Oi Ot Oy Ob2 Gs GF Gy 并根据msdn http msdn micros
visualc
compileroptimization
为什么这个未使用的变量没有被优化掉?
我使用了 Godbolt 的 CompilerExplorer 我想看看某些优化有多好 我的最小工作示例是 include
c
gcc
Clang
compileroptimization
为什么 -march=native 很少使用?
对于大多数 C C 编译器 有一个可传递给编译器的标志 march native 它告诉编译器调整为主机 CPU 的微架构和 ISA 扩展生成的代码 即使它的名称不同 基于 LLVM 的编译器通常也有一个等效的选项 例如rustc or s
gcc
Clang
compileroptimization
C++ while 循环优化无法正常工作
我有这个代码段 include
c
gcc
compileroptimization
integeroverflow
为什么 GCC 不将 a*a*a*a*a*a 优化为 (a*a*a)*(a*a*a)?
我正在对科学应用程序进行一些数值优化 我注意到的一件事是 GCC 会优化调用pow a 2 通过将其编译成a a 但是调用pow a 6 没有优化 实际会调用库函数pow 这大大降低了性能 相比之下 英特尔 C 编译器 http en wi
gcc
Assembly
floatingpoint
compileroptimization
fastmath
除非链接到 pthreads,否则不会出现死锁?
为什么创建 std mutex 死锁实际上不会导致死锁 除非程序链接到 pthreads 以下内容在与 pthreads 库链接时会死锁 如果未链接 pthreads 则不会死锁 在 gcc 和 clang 上测试 clang main c
c
Linker
pthreads
mutex
compileroptimization
如何为单个函数设置 ICC 属性“fp-model precision”,以防止关联优化?
我正在实施卡汉求和 http en wikipedia org wiki Kahan summation algorithm 在支持 gcc47 gcc48 clang33 icc13 和 icc14 编译的项目中 作为该算法的一部分 我想
c
gcc
Clang
compileroptimization
ICC
switch 在 Visual C++ 中如何编译?它的优化程度和速度如何?
我发现我只能在 C 中使用数值switch陈述 我认为它和一堆更深层的区别if else s 因此我问自己 如何switch与 不同if elseif elseif在运行速度 编译时优化和一般编译方面 我这里主要说的是MSVC 开关通常被编
c
visualc
switchstatement
compileroptimization
visualc2010
编译器优化导致性能下降
我有一个奇怪的问题 我有以下代码 template
c
visualc
visualc6
compileroptimization
C++ 中的编译器指令重新排序优化(以及阻碍它们的因素)
我已将代码缩减为以下内容 这在保留我感兴趣的编译器输出的同时 尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa
c
visualc
Optimization
compileroptimization
编译器处理包含保护头的开销有多大?
为了加速大型源文件的编译 修剪翻译单元中使用的标头数量是否更有意义 或者编译代码的成本是否远远超过处理包含保护的时间标头 如果后者是真的 那么工程工作最好花在创建更多 轻量级的标头上 而不是更少 那么 现代编译器需要多长时间才能处理有效包含
performance
include
preprocessor
compileroptimization
C++ 编译器会优化重复的函数调用吗?
编译器 通常或特别 是否优化重复的函数调用 例如 考虑这种情况 struct foo member type m return type f const returns by value 函数定义在一个翻译单元中 return type f
c
compileroptimization
编译器是否优化了净零位移?
我有一些代码 如下面的代码块 我不允许发布原始代码 cpp我认为正在编译的文件clang Ubuntu clang version 3 5 2 3ubuntu1 tags RELEASE 352 final based on LLVM 3
c
Compilation
compileroptimization
Clang
如何正确确定Intel处理器的-march和-mtune?
我目前正在从源代码构建一个对我来说性能至关重要的软件 因此 我想对其进行优化 以便在我的特定 Intel CPU 上运行 构建过程要求我设置 march 和 mtune 标志 如果在我的处理器节点上我使用 gcc march native
performance
gcc
x86
intel
compileroptimization
如何加快这段 Java 代码的速度?
我正在尝试测试 Java 执行一项简单任务的速度有多快 将一个大文件读入内存 然后对数据执行一些无意义的计算 所有类型的优化都很重要 无论是以不同的方式重写代码还是使用不同的 JVM 欺骗 JIT 输入文件是一个由逗号分隔的 5 亿长的 3
为什么允许 gcc 从结构推测加载?
显示 gcc 优化和可能出现故障的用户代码的示例 下面代码片段中的函数 foo 将仅加载结构成员 A 或 B 之一 至少这是未优化代码的意图 typedef struct int A int B Pair int foo const Pai
c
gcc
Assembly
x86
compileroptimization
对于采用 const 结构的函数,编译器不会优化函数体吗?
我有以下代码 include
c
gcc
compileroptimization
为什么编译器会生成这个程序集?
在逐步执行一些 Qt 代码时 我遇到了以下情况 功能QMainWindowLayout invalidate 有以下实现 void QMainWindowLayout invalidate QLayout invalidate minSiz
c
gcc
Assembly
compileroptimization
1
2
3
4
5
6
...8
»