是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？

2024-03-13

我有两个双打a and b，都在 [0,1] 内。我想要的最小值/最大值a and b出于性能原因而无需分支。

鉴于a and b都是正数，并且都低于 1，有没有一种有效的方法来获取两者的最小值/最大值？理想情况下，我不希望有分支。

是的，有一种方法可以计算两个的最大值或最小值doubles 没有任何分支。执行此操作的 C++ 代码如下所示：

#include <algorithm>

double FindMinimum(double a, double b)
{
    return std::min(a, b);
}

double FindMaximum(double a, double b)
{
    return std::max(a, b);
}

我打赌你以前见过这个。免得你不相信这是无分支的，查看拆解 https://gcc.godbolt.org/#g:!((g:!((g:!((h:codeEditor,i:(fontScale:0.8957951999999999,j:1,lang:c%2B%2B,source:%27++++%23include+%3Calgorithm%3E%0A%0A++++double+FindMinimum(double+a,+double+b)%0A++++%7B%0A++++++++return+std::min(a,+b)%3B%0A++++%7D%0A%0A++++double+FindMaximum(double+a,+double+b)%0A++++%7B%0A++++++++return+std::max(a,+b)%3B%0A++++%7D%27),l:%275%27,n:%270%27,o:%27C%2B%2B+source+%231%27,t:%270%27)),k:31.467710371819962,l:%274%27,m:100,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((g:!((h:compiler,i:(compiler:clang700,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),fontScale:0.8957951999999999,lang:c%2B%2B,libs:!(),options:%27-O2+-fverbose-asm%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+clang+7.0.0+(Editor+%231,+Compiler+%231)+C%2B%2B%27,t:%270%27)),header:(),k:64.41182865840402,l:%274%27,m:22.5,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:g83,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!(),options:%27-O2+-fverbose-asm%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+gcc+8.3+(Editor+%231,+Compiler+%232)+C%2B%2B%27,t:%270%27)),header:(),l:%274%27,m:25.963673057517656,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:vcpp_v19_16_x64,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!(),options:/O2,source:1),l:%275%27,n:%270%27,o:%27x64+msvc+v19.16+(Editor+%231,+Compiler+%233)+C%2B%2B%27,t:%270%27)),header:(),l:%274%27,m:51.53632694248234,n:%270%27,o:%27%27,s:0,t:%270%27)),k:68.53228962818004,l:%273%27,n:%270%27,o:%27%27,t:%270%27)),l:%272%27,n:%270%27,o:%27%27,t:%270%27)),version:4:

FindMinimum(double, double):
    minsd   xmm1, xmm0
    movapd  xmm0, xmm1
    ret

FindMaximum(double, double):
    maxsd   xmm1, xmm0
    movapd  xmm0, xmm1
    ret

这就是您从所有针对 x86 的流行编译器获得的结果。使用的是SSE2指令集，具体是minsd/maxsd指令，无分支地计算两个双精度浮点值的最小值/最大值。

所有 64 位 x86 处理器均支持SSE2 https://en.wikipedia.org/wiki/SSE2; AMD64 扩展需要它。即使大多数不带 64 位的 x86 处理器也支持 SSE2。它于 2000 年发布。您必须走很长的路才能找到不支持 SSE2 的处理器。但如果你这样做了呢？好吧，即使在那里，您可以在最流行的编译器上获得无分支代码 https://gcc.godbolt.org/#g:!((g:!((g:!((h:codeEditor,i:(fontScale:0.8957951999999999,j:1,lang:c%2B%2B,source:%27++++%23include+%3Calgorithm%3E%0A%0A++++double+FindMinimum(double+a,+double+b)%0A++++%7B%0A++++++++return+std::min(a,+b)%3B%0A++++%7D%0A%0A++++double+FindMaximum(double+a,+double+b)%0A++++%7B%0A++++++++return+std::max(a,+b)%3B%0A++++%7D%27),l:%275%27,n:%270%27,o:%27C%2B%2B+source+%231%27,t:%270%27)),k:31.467710371819962,l:%274%27,m:100,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((g:!((h:compiler,i:(compiler:clang700,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),fontScale:0.8957951999999999,lang:c%2B%2B,libs:!(),options:%27-O2+-fverbose-asm+-mno-sse+-m32%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+clang+7.0.0+(Editor+%231,+Compiler+%231)+C%2B%2B%27,t:%270%27)),header:(),k:64.41182865840402,l:%274%27,m:22.5,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:g83,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!(),options:%27-O2+-fverbose-asm+-mno-sse+-m32%27,source:1),l:%275%27,n:%270%27,o:%27x86-64+gcc+8.3+(Editor+%231,+Compiler+%232)+C%2B%2B%27,t:%270%27)),header:(),l:%274%27,m:25.963673057517656,n:%270%27,o:%27%27,s:0,t:%270%27),(g:!((h:compiler,i:(compiler:vcpp_v19_16_x86,filters:(b:%270%27,binary:%271%27,commentOnly:%270%27,demangle:%270%27,directives:%270%27,execute:%271%27,intel:%270%27,libraryCode:%271%27,trim:%271%27),lang:c%2B%2B,libs:!(),options:%27/O2+/arch:IA32%27,source:1),l:%275%27,n:%270%27,o:%27x86+msvc+v19.16+(Editor+%231,+Compiler+%233)+C%2B%2B%27,t:%270%27)),header:(),l:%274%27,m:51.53632694248234,n:%270%27,o:%27%27,s:0,t:%270%27)),k:68.53228962818004,l:%273%27,n:%270%27,o:%27%27,t:%270%27)),l:%272%27,n:%270%27,o:%27%27,t:%270%27)),version:4:

FindMinimum(double, double):
    fld      QWORD PTR [esp + 12]
    fld      QWORD PTR [esp + 4]
    fucomi   st(1)
    fcmovnbe st(0), st(1)
    fstp     st(1)
    ret

FindMaximum(double, double):
    fld      QWORD PTR [esp + 4]
    fld      QWORD PTR [esp + 12]
    fucomi   st(1)
    fxch     st(1)
    fcmovnbe st(0), st(1)
    fstp     st(1)
    ret

The fucomi指令执行比较，设置标志，然后fcmovnbe指令根据这些标志的值执行条件移动。这完全是无分支的，并且依赖于 1995 年 Pentium Pro 引入 x86 ISA 的指令，自 Pentium II 以来所有 x86 芯片都支持该指令。

唯一的编译器won't这里生成无分支代码是MSVC，因为它没有利用FCMOVxx操作说明 https://stackoverflow.com/questions/13661285/generating-cmov-instructions-using-microsoft-compilers/41144749#41144749。相反，你会得到：

double FindMinimum(double, double) PROC
    fld     QWORD PTR [a]
    fld     QWORD PTR [b]
    fcom    st(1)            ; compare "b" to "a"
    fnstsw  ax               ; transfer FPU status word to AX register
    test    ah, 5            ; check C0 and C2 flags
    jp      Alt
    fstp    st(1)            ; return "b"
    ret
Alt:
    fstp    st(0)            ; return "a"
    ret
double FindMinimum(double, double) ENDP

double FindMaximum(double, double) PROC
    fld     QWORD PTR [b]
    fld     QWORD PTR [a]
    fcom    st(1)            ; compare "b" to "a"
    fnstsw  ax               ; transfer FPU status word to AX register
    test    ah, 5            ; check C0 and C2 flags
    jp      Alt
    fstp    st(0)            ; return "b"
    ret
Alt:
    fstp    st(1)            ; return "a"
    ret
double FindMaximum(double, double) ENDP

注意分支JP指令（如果奇偶校验位设置则跳转）。这FCOM指令用于进行比较，它是基本 x87 FPU 指令集的一部分。不幸的是，这会在 FPU 状态字中设置标志，因此为了在这些标志上进行分支，需要提取它们。这就是该项目的目的FNSTSW指令，它将 x87 FPU 状态字存储到通用AX寄存器（它也可以存储到内存中，但是......为什么？）。那么代码TESTs 适当的位，并相应地分支以确保返回正确的值。除了分支之外，检索 FPU 状态字也会相对较慢。这就是 Pentium Pro 推出FCOM指示。

然而，它是unlikely您可以通过使用位旋转操作来确定最小值/最大值来提高任何代码的速度。有两个基本原因：

唯一生成低效代码的编译器是 MSVC，并且没有好方法强制它生成您想要的指令。尽管 MSVC 中支持 32 位 x86 目标的内联汇编，当寻求性能改进时，这是一个愚蠢的差事 https://stackoverflow.com/questions/3323445/what-is-the-difference-between-asm-asm-and-asm/35959859#35959859。我也引用一下我自己的话：

内联汇编以相当显着的方式破坏优化器，所以除非你正在编写重要的在内联汇编中使用大量代码，不太可能获得实质性的净性能提升。此外，微软的内联汇编语法极其有限。它在很大程度上牺牲了灵活性以换取简单性。特别是，没有办法指定input值，因此您必须将输入从内存加载到寄存器中，并且调用者被迫将输入从寄存器溢出到内存中以进行准备。这创造了一种现象，我喜欢称之为“一大堆乱七八糟的事情”，或者简称为“缓慢的代码”。在可以接受慢速代码的情况下，您不会放弃内联汇编。因此，最好（至少在 MSVC 上）弄清楚如何编写 C/C++ 源代码来说服编译器发出您想要的目标代码。即使你只能得到close对于理想的输出，这仍然比使用内联汇编所付出的代价要好得多。
为了访问浮点值的原始位，您必须进行域转换，从浮点到整数，然后再返回到浮点。那很慢，尤其没有 SSE2，因为从 x87 FPU 获取值到 ALU 中通用整数寄存器的唯一方法是通过内存间接获取。

如果您无论如何都想采用这种策略（例如，对其进行基准测试），您可以利用浮点值按照其字典顺序排序的事实IEEE 754 https://en.wikipedia.org/wiki/IEEE_754表示，符号位除外。因此，既然您假设两个值都是正数：

FindMinimumOfTwoPositiveDoubles(double a, double b):
    mov   rax, QWORD PTR [a]
    mov   rdx, QWORD PTR [b]
    sub   rax, rdx              ; subtract bitwise representation of the two values
    shr   rax, 63               ; isolate the sign bit to see if the result was negative
    ret

FindMaximumOfTwoPositiveDoubles(double a, double b):
    mov   rax, QWORD PTR [b]    ; \ reverse order of parameters
    mov   rdx, QWORD PTR [a]    ; /  for the SUB operation
    sub   rax, rdx
    shr   rax, 63
    ret

或者，为了避免内联汇编：

bool FindMinimumOfTwoPositiveDoubles(double a, double b)
{
    static_assert(sizeof(a) == sizeof(uint64_t),
                  "A double must be the same size as a uint64_t for this bit manipulation to work.");
    const uint64_t aBits = *(reinterpret_cast<uint64_t*>(&a));
    const uint64_t bBits = *(reinterpret_cast<uint64_t*>(&b));
    return ((aBits - bBits) >> ((sizeof(uint64_t) * CHAR_BIT) - 1));
}

bool FindMaximumOfTwoPositiveDoubles(double a, double b)
{
    static_assert(sizeof(a) == sizeof(uint64_t),
                  "A double must be the same size as a uint64_t for this bit manipulation to work.");
    const uint64_t aBits = *(reinterpret_cast<uint64_t*>(&a));
    const uint64_t bBits = *(reinterpret_cast<uint64_t*>(&b));
    return ((bBits - aBits) >> ((sizeof(uint64_t) * CHAR_BIT) - 1));
}

请注意，有severe此实施的注意事项。特别是，如果两个浮点值具有不同的符号，或者两个值都是负数，它将中断。如果两个值都是负数，则可以修改代码以翻转它们的符号，进行比较，然后返回相反的值。为了处理两个值具有不同符号的情况，可以添加代码来检查符号位。

    // ...

    // Enforce two's-complement lexicographic ordering.
    if (aBits < 0)
    {
        aBits = ((1 << ((sizeof(uint64_t) * CHAR_BIT) - 1)) - aBits);
    }
    if (bBits < 0)
    {
        bBits = ((1 << ((sizeof(uint64_t) * CHAR_BIT) - 1)) - bBits);
    }

    // ...

处理负零也会是一个问题。 IEEE 754 规定 +0.0 等于 −0.0，因此您的比较函数必须决定是否要将这些值视为不同的值，或者向比较例程添加特殊代码，以确保负零和正零被视为等效。

添加所有这些特殊情况代码将当然将性能降低到我们将通过简单的浮点比较收支平衡的程度，并且很可能最终会变慢。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？的相关文章

编译时运算符

有人可以列出 C 中可用的所有编译时运算符吗 C 中有两个运算符无论操作数如何它们的结果始终可以在编译时确定它们是sizeof 1 and 2 当然其他运算符的许多特殊用途可以在编译时解决例如标准中列出的那些整数常量表达式 1 与
如何使用 C# 中的参数将用户重定向到 paypal

如果我有像下面这样的简单表格我可以用它来将用户重定向到 PayPal 以完成付款
我如何才能等待多个事情

我正在使用 C 11 和 stl 线程编写一个线程安全队列 WaitAndPop 方法当前如下所示我希望能够将一些内容传递给 WaitAndPop 来指示调用线程是否已被要求停止如果 WaitAndPop 等待并返回队列的元素则应返回
WCF RIA 服务 - 加载多个实体

我正在寻找一种模式来解决以下问题我认为这很常见我正在使用 WCF RIA 服务在初始加载时将多个实体返回给客户端我希望两个实体异步加载以免锁定 UI 并且我想利用 RIA 服务来执行此操作我的解决方案如下似乎有效这种方法会遇到
使用实体框架模型输入安全密钥

这是我今天的完美想法 Entity Framework 中的强类型 ID 动机比较 ModelTypeA ID 和 ModelTypeB ID 总是至少几乎错误为什么编译时不处理它如果您使用每个请求示例 DbContext 那么很
用于登录 .NET 的堆栈跟踪

我编写了一个 logger exceptionfactory 模块它使用 System Diagnostics StackTrace 从调用方法及其声明类型中获取属性但我注意到如果我在 Visual Studio 之外以发布模式运行代
在 Windows 窗体中保存带有 Alpha 通道的单色位图会保存不同（错误）的颜色

在 C NET 2 0 Windows 窗体 Visual Studio Express 2010 中我保存由相同颜色组成的图像 Bitmap bitmap new Bitmap width height PixelFormat Form
如何从 appsettings.json 文件中的对象数组读取值

我的 appsettings json 文件 StudentBirthdays Anne 01 11 2000 Peter 29 07 2001 Jane 15 10 2001 John Not Mentioned 我有一个单独的配置类 p
使用 WebClient 时出现 System.Net.WebException：无法创建 SSL/TLS 安全通道

当我执行以下代码时 System Net ServicePointManager ServerCertificateValidationCallback sender certificate chain errors gt return t
带动态元素的 WPF 启动屏幕。如何？

我是 WPF 新手我需要一些帮助我有一个加载缓慢的 WPF 应用程序因此我显示启动屏幕作为权宜之计但是我希望能够在每次运行时更改屏幕并在文本区域中显示不同的引言这是一个生产力应用程序所以我将使用非愚蠢但激励性的引言当然如
重载<<的返回值

include
WCF 中 SOAP 消息的数字签名

我在 4 0 中有一个 WCF 服务我需要向 SOAP 响应添加数字签名我不太确定实际上应该如何完成我相信响应应该类似于下面的链接中显示的内容 https spaces internet2 edu display ISWG Signe
什么时候虚拟继承是一个好的设计？ [复制]

这个问题在这里已经有答案了 EDIT3 请务必在回答之前清楚地了解我要问的内容有 EDIT2 和很多评论有或曾经有很多答案清楚地表明了对问题的误解我知道这也是我的错对此感到抱歉嗨我查看了有关虚拟继承的问题 class B p
对现有视频添加水印

我正在寻找一种用 C 在视频上加水印的方法就像在上面写文字一样图片或文字标签我该怎么做谢谢您可以使用 Nreco 视频转换器代码看起来像 NReco VideoConverter FFMpegConverter wrap new
WPF/C# 将自定义对象列表数据绑定到列表框？

我在将自定义对象列表的数据绑定到ListBox in WPF 这是自定义对象 public class FileItem public string Name get set public string Path get set 这是列表
通过指向其基址的指针删除 POD 对象是否安全？

事实上我正在考虑那些微不足道的可破坏物体而不仅仅是POD http en wikipedia org wiki Plain old data structure 我不确定 POD 是否可以有基类当我读到这个解释时is triviall
是否可以在 .NET Core 中将 gRPC 与 HTTP/1.1 结合使用？

我有两个网络服务 gRPC 客户端和 gRPC 服务器服务器是用 NET Core编写的然而客户端是托管在 IIS 8 5 上的 NET Framework 4 7 2 Web 应用程序所以它只支持HTTP 1 1 https le
C# 模拟VolumeMute按下

我得到以下代码来模拟音量静音按键 DllImport coredll dll SetLastError true static extern void keybd event byte bVk byte bScan int dwFlags
哪种 C 数据类型可以表示 40 位二进制数？

我需要表示一个40位的二进制数应该使用哪种 C 数据类型来处理这个问题如果您使用的是 C99 或 C11 兼容编译器则使用int least64 t以获得最大的兼容性或者如果您想要无符号类型 uint least64 t 这些都定
如何在文本框中插入图像

有没有办法在文本框中插入图像我正在开发一个聊天应用程序我想用图标图像更改值等但我找不到如何在文本框中插入图像 Thanks 如果您使用 RichTextBox 进行聊天请查看Paste http msdn microsoft co

随机推荐

在大型文本文件中搜索字符串 - 分析 python 中的各种方法

这个问题已经被问过很多次了花了一些时间阅读答案后我做了一些快速分析来尝试前面提到的各种方法我有一个600 MB文件与600万字符串行 DMOZ 项目的类别路径每行的条目都是唯一的我想要load文件once 不停寻找用于数据中的匹配
如何撤消 SQL Server UPDATE 查询？

在 SQL Server Management Studio 中我执行了以下查询不幸的是我忘记取消注释WHERE clause 更新了 1647 行而不是 4 行如何撤消最后一条语句 Unfortunately I ve only
完成活动后如何取下键盘？

我有一个用户在其中输入的活动然后单击确定按钮完成后活动关闭并返回到旧活动但软键盘仍然在屏幕上我试过了android windowSoftInputMode stateHidden and getWindow setSoftIn
阻止直接 URL 访问返回部分视图的控制器？

如果有一个名为 UsersController 的控制器其操作如下 public ActionResult ActiveUsers IQueryable
如何获取数组值作为curl php请求的返回值？

由于我是 PHP 新手所以我很难使用 PHP 问题是我没有从curl 请求中获得任何返回值我正在访问一个远程文件其中包含以下代码测试 php test gt getCall public function getCall var a
为什么 easy_install 适用于某些 Windows 二进制文件？

背景 Windows 默认情况下不包含编译器安装编译器或许还需要配置 Python 来使用它是一项足够复杂的任务许多开发人员都避免这样做为此许多具有二进制依赖项的包可以作为包含二进制文件的预编译 Windows 可执行文件提供
如果未找到元素，C# 中的 XmlSerializer 反序列化是否会失败？

我正在使用 XmlSerializer 在 C 中将对象写入和读取到 xml 我目前使用的属性XmlElement and XmlIgnore操纵对象的序列化如果我的 xml 文件缺少我需要的 xml 元素我的对象仍然可以很好地反序列化
Python 中的方法参数[重复]

这个问题在这里已经有答案了假设我有这样的代码 class Num def init self num self n num def getn self return self n def getone return 1 myObj Num
将特定线程绑定到特定处理器核心

我在大学里谈过一些关于并行处理的内容现在我正在努力提高它我可以编写可以并行运行的代码然后启动线程但之后我就失去了对线程执行操作的控制我想知道如何控制线程例如将特定线程绑定到特定处理器核心我对 C 最感兴趣但我已经用 Java
BigQuery 重复数据删除和分区表

我想在 BigQuery 中创建一个允许执行以下操作的视图重复记录删除将 PARTITIONTIME 公开为用于过滤的列以允许分区修剪我知道执行重复数据删除的建议查询是 SELECT EXCEPT row number FROM S
创建指向向量中元素的指针>

如果我想要一个指向 int 向量向量中的元素的指针我会写 vector
org.apache.hadoop.mapred.FileAlreadyExistsException

我试图在 Hadoop 中运行示例程序here http hadoop apache org common docs r0 20 2 mapred tutorial html Example 3A WordCount v1 0 当我尝试运行
深度复制嵌套可迭代（或改进的 itertools.tee 用于可迭代的可迭代）

Preface 我有一个测试我正在使用嵌套迭代通过嵌套迭代我的意思是仅可迭代作为元素作为测试级联考虑 from itertools import tee from typing import Any Iterable def foo
如何实现Android Open Accessory模式即服务？

我一直在研究 Android 开放配件开发套件依照指示Google 提供的 DemoKit 示例 http developer android com guide topics usb accessory html 我在使解决方案适应我的
ASP.net MVC DropDownList 预选项目被忽略

我面临着问题中概述的类似问题 ASP NET MVC RC 刷新中的 Html DropDownList 未预选择项目 https stackoverflow com questions 589935 html dropdownlist
Pandas 使用 XLSX Writer - 恒定内存/内存中表现出色

我正在使用熊猫和xlsxwriter在 AWS lambda 中创建 Excel 报告我遇到了一个问题创建 60MB 区域内相当大的 Excel 文件时磁盘空间已满但还有 512MB 的可用磁盘空间我一直在试图弄清楚发生这种情况的
有eot字体编辑器吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有eot字体编辑器吗已知的编辑器如 Font Forge Font Creator 和 Font
列出 PostgreSQL 中物化视图的授予和权限

我需要确定当前为数据库中的某些物化视图授予了哪些权限对表或标准视图执行此操作的查询非常简单 SELECT grantee string agg privilege type AS privileges FROM information s
您上传了可调试的 APK。出于安全原因，您需要先禁用调试，然后才能在 Google Play 中发布 - 将 apk 上传到 google play

我想将我的 apk 上传到 google play store 但它显示这样的错误 You uploaded a debuggable APK For security reasons you need to disable debuggi
是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？

我有两个双打a and b 都在 0 1 内我想要的最小值最大值a and b出于性能原因而无需分支鉴于a and b都是正数并且都低于 1 有没有一种有效的方法来获取两者的最小值最大值理想情况下我不希望有分支是的有一种方

是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？

是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？ 的相关文章

随机推荐

热门标签

是否有一种无分支方法可以快速找到两个双精度浮点值的最小值/最大值？的相关文章