Java 中的“快速”整数幂

2024-01-07

[简短回答：糟糕的基准测试方法。你可能认为我现在已经明白了。]

该问题被表述为“找到一种快速计算x^y的方法，其中x和y是正整数”。典型的“快速”算法如下所示：

public long fastPower(int x, int y) {
  // Replaced my code with the "better" version described below,
  // but this version isn't measurably faster than what I had before
  long base = x; // otherwise, we may overflow at x *= x.
  long result = y % 2 == 1 ? x : 1;
  while (y > 1) {
    base *= base;
    y >>= 1;
    if (y % 2 == 1) result *= base;
  }

  return result;
}

我想看看这比调用 Math.pow() 或使用简单的方法（例如将 x 乘以 y 次）快多少，如下所示：

public long naivePower(int x, int y) {
  long result = 1;
  for (int i = 0; i < y; i++) {
    result *= x;
  }
  return result;
}

编辑：好的，有人（正确地）向我指出我的基准测试代码没有消耗结果，这完全让一切都失败了。一旦我开始使用结果，我仍然发现简单方法比“快速”方法快约 25%。

原文：

I was very surprised to find that the naive approach was 4x faster than the "fast" version, which was itself about 3x faster than the Math.pow() version.

我的测试使用 10,000,000 次试验（然后是 1 亿次，只是为了绝对确保 JIT 有时间预热），每个试验都使用随机值（以防止调用被优化掉）2

据我所知，对于小指数，天真的版本预计会更快。 “快速”版本有两个分支而不是一个，并且通常会执行两倍于天真的分支的算术/存储操作 - 但我预计对于大指数，这仍然会导致快速方法节省一半的操作最好的情况和最坏的情况大致相同。

任何人都知道为什么简单的方法会比“快速”版本快得多，即使数据偏向“快速”版本（即更大的指数）？该代码中的额外分支是否会在运行时造成如此大的差异？

基准测试代码（是的，我知道我应该使用一些框架来进行“官方”基准测试，但这是一个玩具问题）-更新以热身并使用结果：

PowerIf[] powers = new PowerIf[] {
  new EasyPower(), // just calls Math.pow() and cast to int
  new NaivePower(),
  new FastPower()
};

Random rand = new Random(0); // same seed for each run
int randCount = 10000;
int[] bases = new int[randCount];
int[] exponents = new int[randCount];
for (int i = 0; i < randCount; i++) {
  bases[i] = 2 + rand.nextInt(2);
  exponents[i] = 25 + rand.nextInt(5);
}

int count = 1000000000;

for (int trial = 0; trial < powers.length; trial++) {
  long total = 0;
  for (int i = 0; i < count; i++) { // warm up
    final int x = bases[i % randCount];
    final int y = exponents[i % randCount];
    total += powers[trial].power(x, y);
  }
  long start = System.currentTimeMillis();
  for (int i = 0; i < count; i++) {
    final int x = bases[i % randCount];
    final int y = exponents[i % randCount];
    total += powers[trial].power(x, y);
  }
  long end = System.currentTimeMillis();
  System.out.printf("%25s: %d ms%n", powers[trial].toString(), (end - start)); 
  System.out.println(total);
}

产生输出：



                EasyPower: 7908 ms
-407261252961037760
               NaivePower: 1993 ms
-407261252961037760
                FastPower: 2394 ms
-407261252961037760

使用随机数和试验的参数确实会改变输出特性，但测试之间的比率始终与所示的相同。

你的问题有两个fastPower:

最好更换y % 2 == 0 with (y & 1) == 0;按位运算速度更快。
你的代码总是递减y并执行额外的乘法，包括以下情况y甚至。最好将这部分放入else clause.

不管怎样，我猜你的基准测试方法并不完美。 4 倍的性能差异听起来很奇怪，在没有看到完整代码的情况下无法解释。

应用上述改进后，我已经验证使用JMH http://openjdk.java.net/projects/code-tools/jmh/基准测试fastPower确实比naivePower系数为 1.3 倍至 2 倍。

package bench;

import org.openjdk.jmh.annotations.*;

@State(Scope.Benchmark)
public class FastPow {
    @Param("3")
    int x;
    @Param({"25", "28", "31", "32"})
    int y;

    @Benchmark
    public long fast() {
        return fastPower(x, y);
    }

    @Benchmark
    public long naive() {
        return naivePower(x, y);
    }

    public static long fastPower(long x, int y) {
        long result = 1;
        while (y > 0) {
            if ((y & 1) == 0) {
                x *= x;
                y >>>= 1;
            } else {
                result *= x;
                y--;
            }
        }
        return result;
    }

    public static long naivePower(long x, int y) {
        long result = 1;
        for (int i = 0; i < y; i++) {
            result *= x;
        }
        return result;
    }
}

Results:

Benchmark      (x)  (y)   Mode  Cnt    Score   Error   Units
FastPow.fast     3   25  thrpt   10  103,406 ± 0,664  ops/us
FastPow.fast     3   28  thrpt   10  103,520 ± 0,351  ops/us
FastPow.fast     3   31  thrpt   10   85,390 ± 0,286  ops/us
FastPow.fast     3   32  thrpt   10  115,868 ± 0,294  ops/us
FastPow.naive    3   25  thrpt   10   76,331 ± 0,660  ops/us
FastPow.naive    3   28  thrpt   10   69,527 ± 0,464  ops/us
FastPow.naive    3   31  thrpt   10   54,407 ± 0,231  ops/us
FastPow.naive    3   32  thrpt   10   56,127 ± 0,207  ops/us

Note:整数乘法是相当快的运算，有时甚至比额外的比较更快 https://stackoverflow.com/questions/35531369/why-is-ab-0-faster-than-a-0-b-0-in-java。不要期望通过适合的值带来巨大的性能改进long。快速功率算法的优势将在BigInteger具有更大的指数。

Update

自从作者发布了基准测试以来，我必须承认令人惊讶的性能结果来自常见的基准测试陷阱。我在保留原始方法的同时改进了基准测试，现在它表明FastPower确实比NaivePower, see here https://gist.github.com/apangin/91c07684635893e3f1d5.

改进版主要有哪些变化？

不同的算法应在不同的 JVM 实例中单独测试，以防止配置文件污染。
必须多次调用基准测试才能进行正确的编译/重新编译，直到达到稳定状态。
应将一个基准测试放在单独的方法中，以避免堆栈替换问题。
y % 2被替换为y & 1因为 HotSpot 不会自动执行此优化。
最小化主基准测试循环中不相关操作的影响。

手动编写微基准是一项艰巨的任务。这就是为什么强烈建议使用适当的基准测试框架，例如JMH http://openjdk.java.net/projects/code-tools/jmh/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java 中的“快速”整数幂的相关文章

Java EE：如何获取我的应用程序的 URL？

在 Java EE 中如何动态检索应用程序的完整 URL 例如如果 URL 是 localhost 8080 myapplication 我想要一个可以简单地将其作为字符串或其他形式返回给我的方法我正在运行 GlassFish 作为应
如何在 Play java 中创建数据库线程池并使用该池进行数据库查询

我目前正在使用 play java 并使用默认线程池进行数据库查询但了解使用数据库线程池进行数据库查询可以使我的系统更加高效目前我的代码是 import play libs Akka import scala concurrent Ex
在 java 类和 android 活动之间传输时音频不清晰

我有一个android活动它连接到一个java类并以套接字的形式向它发送数据包该类接收声音数据包并将它们扔到 PC 扬声器该代码运行良好但在 PC 扬声器中播放声音时会出现持续的抖动中断安卓活动 public class Sen
制作一个交互式Windows服务

我希望我的 Java 应用程序成为交互式 Windows 服务用户登录时具有 GUI 的 Windows 服务我搜索了这个我发现这样做的方法是有两个程序第一个是服务第二个是 GUI 程序并使它们进行通信服务将从 GUI 程序获取
控制Android的前置LED灯

我试图在用户按下某个按钮时在前面的 LED 上实现 1 秒红色闪烁但我很难找到有关如何访问和使用前置 LED 的文档教程甚至代码示例我的意思是位于自拍相机和触摸屏附近的 LED 我已经看到了使用手电筒和相机类已弃用的示例但我
Spring Data JPA 应用排序、分页以及 where 子句

我目前正在使用 Spring JPA 并利用此处所述的排序和分页如何通过Spring data JPA通过排序和可分页查询数据 https stackoverflow com questions 10527124 how to query
磁模拟

假设我在 n m 像素的 2D 表面上有 p 个节点我希望这些节点相互吸引使得它们相距越远吸引力就越强但是如果两个节点之间的距离比如 d A B 小于某个阈值比如 k 那么它们就会开始排斥谁能让我开始编写一些关于如何随时间更新
Draggable JS Bootstrap 模式 - 性能问题

对于工作中的项目我们在 JavaScript 中使用 Bootstrap Modal 窗口我们想让一些窗口可移动但我们遇到了 JQuery 的性能问题 myModal draggable handle modal header Exa
Spring @RequestMapping 带有可选参数

我的控制器在请求映射中存在可选参数的问题请查看下面的控制器 GetMapping produces MediaType APPLICATION JSON VALUE public ResponseEntity
无法解析插件 Java Spring

我正在使用 IntelliJ IDEA 并且我尝试通过 maven 安装依赖项但它给了我这些错误 Cannot resolve plugin org apache maven plugins maven clean plugin 3 0
禁止的软件包名称：java

我尝试从数据库名称为 jaane 用户名 Hello 和密码 hello 获取数据错误 java lang SecurityException Prohibited package name java at java lang Class
如何在 javadoc 中使用“<”和“>”而不进行格式化？

如果我写
仅将 char[] 的一部分复制到 String 中

我有一个数组 char ch 我的问题如下如何将 ch 2 到 ch 7 的值合并到字符串中我想在不循环 char 数组的情况下实现这一点有什么建议么感谢您花时间回答我的问题 Use new String value offset
无法捆绑适用于 Mac 的 Java 应用程序 1.8

我正在尝试将我的 Java 应用程序导出到 Mac 该应用程序基于编译器合规级别 1 7 我尝试了不同的方法来捆绑应用程序 1 日食我可以用来在 Eclipse 上导出的最新 JVM 版本是 1 6 2 马文看来Maven上也存在同样的
在mockito中使用when进行模拟ContextLoader.getCurrentWebApplicationContext()调用。我该怎么做？

我试图在使用 mockito 时模拟 ContextLoader getCurrentWebApplicationContext 调用但它无法模拟 here is my source code Mock org springframewo
如何从泛型类调用静态方法？

我有一个包含静态创建方法的类 public class TestClass public static
获取 JVM 上所有引导类的列表？

有一种方法叫做findBootstrapClass对于一个类加载器如果它是引导的则返回一个类有没有办法找到类已经加载了您可以尝试首先通过例如获取引导类加载器呼叫 ClassLoader bootstrapLoader ClassLo
捕获的图像分辨率太大

我在做什么我允许用户捕获图像将其存储到 SD 卡中并上传到服务器但捕获图像的分辨率为宽度 4608 像素和高度 2592 像素现在我想要什么如何在不影响质量的情况下获得小分辨率图像例如我可以获取或设置捕获的图像分辨率为原始图像分
java.lang.IllegalStateException：驱动程序可执行文件的路径必须由 webdriver.chrome.driver 系统属性设置 - Similiar 不回答

尝试学习 Selenium 我打开了类似的问题但似乎没有任何帮助我的代码 package seleniumPractice import org openqa selenium WebDriver import org openqa s
将 List 转换为 JSON

Hi guys 有人可以帮助我如何将我的 HQL 查询结果转换为带有对象列表的 JSON 并通过休息服务获取它这是我的服务方法它返回查询结果列表 Override public List

随机推荐

使用 ExoPlayer 将 YouTube 直播视频 (DASH) 流式传输到 Android 应用程序

我正在制作一个可以将实时 YouTube 视频流式传输到我的应用程序的应用程序我想使用 ExoPlayer 我浏览了 ExoPlayer 的演示应用程序他们在 DASH 流中使用的 URL 是这样的 uri http www youtu
如何在 Python / Matplotlib 中根据特征值和特征向量绘制椭圆？

给定一个二维数据集我想在数据周围绘制一个椭圆为此我首先计算了协方差矩阵及其相关的特征值 cov np cov X T eigenvalues eigenvectors np linalg eig cov 我现在想使用 matplotl
Django REST Framework 序列化器 - 访问现有外键

我在用Django 休息框架 http www django rest framework org api guide serializers在我的应用程序中我需要创建包含外键的新模型实例这些引用另一个表中的现有对象因此我不希望创建这
将参数传递给 NSTimer 调用的方法

如何将参数传递给 NSTimer 调用的方法我的计时器看起来像这样 NSTimer scheduledTimerWithTimeInterval 4 target self selector selector updateBusLocat
Cx 冻结错误 - Python 34

我有一个 Cx Freeze 安装文件我正在尝试使其工作令人非常沮丧的是used适当冷冻但是现在我收到以下错误编辑显示的错误不是通过控制台的 Python 异常而是尝试启动通过冻结生成的结果 exe 文件时的崩溃报告文件 no
为什么在 while 循环中使用 itrerator 对象时需要进行类型转换？ [复制]

这个问题在这里已经有答案了我现在正在学习java 在编写遍历代码时ArrayList using Iterator在使用迭代器的对象之前我必须使用类名next 功能有人能帮我解决这个问题吗 import java util publi
使用“在模型中保存起始值”选项来帮助 Dymola 中的收敛

I build a model in dymola Even though there are some errors during the initialization process but the calculation succee
Python 文档字符串模板化

为什么动态格式化文档字符串不起作用是否有可接受的解决方法来执行此操作在函数定义时 gt gt gt DEFAULT BAR moe s tavern gt gt gt def foo bar DEFAULT BAR hello this
IONIC 键盘隐藏在输入焦点上

我正在编写一个 Ionic 应用程序该应用程序将用于医疗保健领域的物流目的用于此应用程序的设备具有内置条形码扫描仪并在 android 4 1 1 上运行该扫描仪在输入字段中输入数据并通过按输入键提交数据由于扫描仪在某些情况下
将本地存储从 Cordova 应用迁移到 Android 应用

我们在 Playstore 中有一个使用 Cordova 开发的应用程序现在我们已经在原生 Android 中重建了整个应用程序现在我们希望在不注销的情况下将用户从以前的应用程序升级到新应用程序为此如何将Cordova window
根据累计和和组创建新组

我希望根据两个条件创建一个新组我希望在 Value 的累计总和达到 10 之前将所有案例分组在一起并且我希望在每个人中完成此操作我已经设法让它分别适用于每个条件但不能同时使用 for 循环和 dplyr 但是我需要同时应用这两个条
如何使用 IntelliJ 将外部库的源代码和 javadoc 添加到 gradle？

我已经使用 IntelliJ 和 Gradle 建立了一个 Java 项目我的根项目中有一个 build gradle 文件我可以编译并运行我的应用程序然而我正在使用一个Java 库它附带了源代码和javadoc zip 文件如
如何删除 div 和页面顶部之间的空间？

这可能已经被问过一百万零一次了但如果有人能向我解释 div 的行为我将不胜感激我有一个容器 div 我将其对齐在页面的中心页面的顶部和顶部之间有一个间隙我希望它与页面顶部齐平我假设有某种我需要删除的边距或填充但我无法想象它可能
OSX Mac App Store：如何安装守护进程 shell 脚本

我想为 Mac App Store 编写一个涉及安装守护程序的应用程序守护进程可以是一个非常简单的 Hello World shell 脚本可以是 Bourne shell 或 Python 它应该在每次机器启动时自动运行我尝试使用安
如何在谷歌应用程序引擎中的留言簿中的每个帖子下添加日期和时间

这是代码 import cgi import datetime import wsgiref handlers from google appengine ext import db from google appengine api im
单击按钮时一个片段到另一个片段

我已经学会了如何在单击按钮时将片段活动从一个更改为另一个所有都是片段活动但现在我遇到了同一片段上多个按钮的问题只有第一个按钮 id 有效我有多个按钮每个按钮都有不同的片段活动需要帮忙 package com test fragm
将特定标头添加到 bitbake wget fetcher

我需要设置一个特定的标头以使用以下命令从资源中获取存档wgetfetcher 类似于 wget header PRIVATE ACCESS TOKEN blablablablabla https some resource 如何使用该获取器
如何在 iOS Swift 中将数据数组回调到另一个 viewController

在createCardVC中我使用carbonKit库来显示标签栏最初使用静态数据加载的数据数组但现在我尝试使用来自 webView javascript postMessage 的数据数组当 createCardVC 加载时第
C++11 递归可变参数模板

我想了解递归可变参数模板是如何工作的 include
Java 中的“快速”整数幂

简短回答糟糕的基准测试方法你可能认为我现在已经明白了该问题被表述为找到一种快速计算x y的方法其中x和y是正整数典型的快速算法如下所示 public long fastPower int x int y Replaced m

Java 中的“快速”整数幂

Update

Java 中的“快速”整数幂 的相关文章

随机推荐

热门标签

Java 中的“快速”整数幂的相关文章