性能说明：预热后代码运行速度变慢

2024-03-31

下面的代码运行完全相同的计算 3 次（它没有做太多事情：基本上将 1 到 100m 之间的所有数字相加）。前 2 个块的运行速度大约是第三个块的 10 倍。我已经运行这个测试程序超过 10 次，结果显示差异很小。

如果有的话，我希望第三个块运行得更快（JIT 编译），但典型的输出是：

35974537
36368455
296471550

有人可以解释发生了什么事吗？（需要明确的是，我并不是想解决这里的任何问题，只是想更好地理解发生了什么）

Note:

程序期间没有运行 GC（用-XX:+PrintGC)
使用 Oracle JDK 版本 1.6.0_30、1.7.0_02 和 1.7.0_05 进行测试
还使用以下参数进行了测试：-XX:+PrintGC -Xms1000m -Xmx1000m -XX:NewSize=900m=>相同的结果
如果将块放入循环中，则所有运行都会很快
如果该块被提取到一个方法中，则所有运行都很快（无论该方法被调用 3 次还是在循环中调用都没有区别）

public static void main(String... args) {
    //three identical blocks
    {
        long start = System.nanoTime();
        CountByOne c = new CountByOne();
        int sum = 0;
        for (int i = 0; i < 100000000; i++) {
            sum += c.getNext();
        }
        if (sum != c.getSum()) throw new IllegalStateException(); //use sum
        long end = System.nanoTime();
        System.out.println((end - start));
    }
    {
        long start = System.nanoTime();
        CountByOne c = new CountByOne();
        int sum = 0;
        for (int i = 0; i < 100000000; i++) {
            sum += c.getNext();
        }
        if (sum != c.getSum()) throw new IllegalStateException(); //use sum
        long end = System.nanoTime();
        System.out.println((end - start));
    }
    {
        long start = System.nanoTime();
        CountByOne c = new CountByOne();
        int sum = 0;
        for (int i = 0; i < 100000000; i++) {
            sum += c.getNext();
        }
        if (sum != c.getSum()) throw new IllegalStateException(); //use sum
        long end = System.nanoTime();
        System.out.println((end - start));
    }
}

public static class CountByOne {

    private int i = 0;
    private int sum = 0;

    public int getSum() {
        return sum;
    }

    public int getNext() {
        i += 1;
        sum += i;
        return i;
    }
}

简而言之：即时编译器很愚蠢。

首先，您可以使用该选项-XX:+PrintCompilation查看 JIT 何时正在做某事。然后你会看到类似这样的东西：

$ java -XX:+PrintCompilation weird
    168    1             weird$CountByOne::getNext (28 bytes)
    174    1 %           weird::main @ 18 (220 bytes)
    279    1 %           weird::main @ -2 (220 bytes)   made not entrant
113727636
    280    2 %           weird::main @ 91 (220 bytes)
106265475
427228826

所以你会看到方法 main 有时在第一个和第二个块期间被编译。

添加选项-XX:+PrintCompilation -XX:+UnlockDiagnosticVMOption将为您提供有关 JIT 正在做什么的更多信息。注意，需要hsdis-amd64.so这在常见的 Linux 发行版上似乎不太可用。您可能需要自己从 OpenJDK 编译它。

您得到的是 getNext 和 main 的大量汇编代码。

对我来说，在第一次编译中，似乎只有 main 中的第一个块实际上被编译了，您可以通过行号来判断。它包含这样有趣的事情：

  0x00007fa35505fc5b: add    $0x1,%r8           ;*ladd
                                                ; - weird$CountByOne::getNext@6 (line 12)
                                                ; - weird::main@28 (line 31)
  0x00007fa35505fc5f: mov    %r8,0x10(%rbx)     ;*putfield i
                                                ; - weird$CountByOne::getNext@7 (line 12)
                                                ; - weird::main@28 (line 31)
  0x00007fa35505fc63: add    $0x1,%r14          ;*ladd
                                                ; - weird::main@31 (line 31)

（事实上，由于循环的展开和内联，它很长）

显然，在重新编译 main 期间，编译了第二个和第三个块。第二个块看起来与第一个版本非常相似。（再次只是摘录）

 0x00007fa35505f05d: add    $0x1,%r8           ;*ladd
                                                ; - weird$CountByOne::getNext@6 (line 12)
                                                ; - weird::main@101 (line 42)
  0x00007fa35505f061: mov    %r8,0x10(%rbx)     ;*putfield i
                                                ; - weird$CountByOne::getNext@7 (line 12)
                                                ; - weird::main@101 (line 42)
  0x00007fa35505f065: add    $0x1,%r13          ;*ladd

然而，第三个块的编译方式不同。没有内联和展开

这次整个循环如下所示：

  0x00007fa35505f20c: xor    %r10d,%r10d
  0x00007fa35505f20f: xor    %r8d,%r8d          ;*lload
                                                ; - weird::main@171 (line 53)
  0x00007fa35505f212: mov    %r8d,0x10(%rsp)
  0x00007fa35505f217: mov    %r10,0x8(%rsp)
  0x00007fa35505f21c: mov    %rbp,%rsi
  0x00007fa35505f21f: callq  0x00007fa355037c60  ; OopMap{rbp=Oop off=580}
                                                ;*invokevirtual getNext
                                                ; - weird::main@174 (line 53)
                                                ;   {optimized virtual_call}
  0x00007fa35505f224: mov    0x8(%rsp),%r10
  0x00007fa35505f229: add    %rax,%r10          ;*ladd
                                                ; - weird::main@177 (line 53)
  0x00007fa35505f22c: mov    0x10(%rsp),%r8d
  0x00007fa35505f231: inc    %r8d               ;*iinc
                                                ; - weird::main@180 (line 52)
  0x00007fa35505f234: cmp    $0x5f5e100,%r8d
  0x00007fa35505f23b: jl     0x00007fa35505f212  ;*if_icmpge
                                                ; - weird::main@168 (line 52)

我的猜测是，JIT 发现这部分代码没有被大量使用，因为它使用的是第二个块执行中的分析信息，因此没有对其进行大量优化。此外，从某种意义上说，JIT 似乎很懒，在编译所有相关部分后不重新编译一个方法。请记住，第一个编译结果根本不包含第二个/第三个块的源代码，因此 JIT 必须重新编译它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

性能说明：预热后代码运行速度变慢的相关文章

如何使用 Java 中的 Web 服务（例如 Axis2）发送复杂对象的数组或集合？

我对 SOAP Web 服务还比较陌生虽然我完成了一些较小的 Web 服务项目但我偶然从来不需要返回或用作参数复杂对象的数组或集合当我尝试这样做时根据我的 SOAP 绑定风格我会得到不同的奇怪行为当我使用RPC 文字我可
Hibernate注解放置问题

我有一个我认为很简单的问题我见过两种方式的例子问题是为什么我不能将注释放在字段上让我举一个例子 Entity Table name widget public class Widget private Integer id Id G
OSGi：如果不取消服务会发生什么

这是我获取 OSGi 服务的方式 ServiceReference reference bundleContext getServiceReference Foo class getName Foo foo Foo bundleContex
如何在不超过最大值的情况下增加变量？

我正在为学校开发一个简单的视频游戏程序我创建了一个方法如果调用该方法玩家将获得 15 点生命值我必须将生命值保持在最大值 100 并且由于我目前的编程能力有限我正在做这样的事情 public void getHealed if h
Cassandra java驱动程序协议版本和连接限制不匹配

我使用的java驱动程序版本 2 1 4卡桑德拉版本 dsc cassandra 2 1 10cql 的输出给出以下内容 cqlsh 5 0 1 Cassandra 2 1 10 CQL spec 3 2 1 Native protocol
Hibernate.createBlob() 方法从 Hibernate 4.0.1 开始已弃用，并移至 Hibernate.getLobCreator(Session session).createBlob()

Method Hibernate createBlob 已弃用自休眠4 0 1并搬到Hibernate getLobCreator Session session createBlob 任何解决方案我应该在方法内传递什么getLobCrea
画透明圆，外面填充

我有一个地图视图我想在其上画一个圆圈以聚焦于给定区域但我希望圆圈倒转也就是说圆的内部不是被填充而是透明的其他所有部分都被填充请参阅这张图片了解我的意思 http i imgur com zxIMZ png 上半部分显示了我可以
在 Netbeans 8 上配置 JBoss EAP 的问题

我已经下载了 JBoss EAP 7 并正在 Netbeans 8 上配置它我已经到达向导实例属性其中要求从选择框中选择域当我打开选择框时它是空的没有什么可以选择的因此完成按钮也处于非活动状态这使得无法完成配置我通过
Calendar.getInstance(TimeZone.getTimeZone("UTC")) 不返回 UTC 时间

我对得到的结果真的很困惑Calendar getInstance TimeZone getTimeZone UTC 方法调用它返回 IST 时间这是我使用的代码 Calendar cal Two Calendar getInstance
Java 中的“Lambdifying”scala 函数

使用Java和Apache Spark 已用Scala重写面对旧的API方法 org apache spark rdd JdbcRDD构造函数其参数为 AbstractFunction1 abstract class AbstractF
编辑文件名在 JComboBox 中的显示方式，同时保持对文件的访问

我对 Java 很陌生对堆栈溢出也很陌生我正在尝试利用 JMF API 创建一个用 Java 编码的简单媒体播放器到目前为止我已经能够设置一个简单的队列播放列表来使用JComboBox called playListHolder
如何在selenium服务器上提供自定义功能？

我知道可以通过某种方法获得一些硒功能其中之一如下 driver getCapabilities getBrowserName 它返回浏览器名称的值但如果它指的是一个可用的方法如果我没有误解的话这似乎与自定义功能有关就像我的意思是
有没有一种快速方法可以从 Jar/war 中删除文件，而无需提取 jar 并重新创建它？

所以我需要从 jar war 文件中删除一个文件我希望有类似 jar d myjar jar file I donot need txt 的内容但现在我能看到从 Linux 命令行执行此操作的唯一方法不使用 WinRAR Winzip
用于选择特定 div 中具有特定类的锚元素的 jQuery 选择器是什么

我有一些这样的代码我想选择每个 a 带有类的标签status在 div 中foo div a class status a div 你可以这样做 foo find status a
Netty：阻止调用以获取连接的服务器通道？

呼吁ServerBootstrap bind 返回一个Channel但这不是在Connected状态因此不能用于写入客户端 Netty 文档中的所有示例都显示写入Channel从它的ChannelHandler的事件如channelCon
游戏内的java.awt.Robot？

我正在尝试使用下面的代码来模拟击键当我打开记事本时它工作正常但当我打开我想使用它的游戏时它没有执行任何操作所以按键似乎不起作用我尝试模拟鼠标移动和点击这些动作确实有效有谁知道如何解决这个问题我发现这个问题如何在游戏中使用
替换后增量

我自己已经有一个问题了但我想扩展它后增量示例 https stackoverflow com questions 51308967 post increment with example char a D int b 5 System o
将 Azure AD 高级自定义角色与 Spring Security 结合使用以进行基于角色的访问

我创建了一个演示 Spring Boot 应用程序我想在其中使用 AD 身份验证和授权并使用 AD 和 Spring Security 查看 Azure 文档我执行了以下操作 package com myapp contactdb c
Eclipse 中 Spring MVC 模型对象的 (jsp /jstl) 视图中的代码辅助

在 Spring MVC 中当将对象放置在视图模型中时如下所示 public String getUser Model model fetch user model addAttribute user user return viewN
FileOutputStream.close() 中的设备 ioctl 不合适

我有一些代码可以使用以下命令将一些首选项保存到文件中FileOutputStream 这是我已经写了一千遍的标准代码 FileOutputStream out new FileOutputStream file try BufferedOu

随机推荐

忽略拼写检查中的文本框

我正在尝试创建一个仅对特定单元格进行拼写检查的宏我已成功对单元格进行拼写检查但由于某种原因拼写检查向导随后继续运行并尝试检查电子表格上的任何文本框下面是代码 Range C8 Select Selection CheckSpell
如何限制 .net / mono 进程的内存大小

假设您有一个用 C 编写的应用程序单进程默认情况下应用程序分配巨大的虚拟内存远远超过其需要例如驻留内存约为 10mb 而虚拟内存约为几 GB 在 Java 中可以使用一个选项来限制这一点 java mx128m 如何对 net
截断 MD5 的 ECDF 图

在这个link https stackoverflow com questions 8184941 uniform distribution of truncated md5 它表示截断的 MD5 是均匀分布的我想使用 PySpark 检
在 Python 中迭代并从多维数组中选择特定数组

想象一下我有这样的东西 import numpy as np arra np arange 16 reshape 2 2 4 这使 array 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 我想创建一个沿着特定
JavaFX TextArea如何设置带有自动换行符的文本

在我的应用程序中我使用了两个Tabs 在第一个中我放置了一个HtmlEditor在第二个中我放置了一个TextArea HTML 选项卡是默认的当用户创建 HTML 输入时他可以切换到TextArea以便直接查看或更改 HTML 源代
Webpack 未加载 Vue 的单文件组件 CSS

Webpack 正在编译单个文件组件但不加载 CSS HTML 和 Vue 已正确呈现但没有 CSS 看来是webpack配置的问题知道出了什么问题吗我在用着webpack dev server加载开发服务器 src index h
是否有可能 - 在 Flutter Web 应用程序中插入 google AdSense？

我尝试在我的网站上插入下一个代码 Google AdSense 但目前尚未成功代码是 1 有一段时间我尝试了带有类似句子的 dart js js context callMethod 但是认为它不起作用因为我们需要展
Ocaml，用列表中的给定元素替换所有指定元素

我正在编写一个 ocaml 项目其中我有一个函数可以替换所有在字符列表中 E 这是我的建议代码 let rec string lst change E lst match lst with gt let a E a h t if h g
在 PAdES 第 4 部分的情况下，带有文档锁定的签名无效

我遇到一个问题我在 PAdES 第 4 部分的情况下设置了文档锁定功能执行文档时间戳签名后签名无效文档锁定功能的代码片段如下 PdfSigFieldLock pdfSigFieldLock new PdfSigFieldLock pd
使用 PHP 发送带有 WSDL Soap 请求的 Soap 标头

我对 SOAP 非常陌生我正在尝试用 PHP 实现一个使用 ASP NET Web 服务的快速测试客户端 Web 服务依赖于包含授权参数的 Soap 标头使用 WSDL 时是否可以将 auth 标头与肥皂请求一起发送 My code p
拖动左上角时如何调整div大小？

In CSS3 resize http www w3schools com cssref css3 pr resize asp 要调整大小的图标位于右下角如何使其显示在左上角并使用户能够相应地调整大小我发现了here http dev
如何设置 AntiForgeryToken cookie 路径

前者HtmlHelper AntiForgeryToken https msdn microsoft com en us library dd492243 28v vs 118 29 aspx方法允许人们重写string path已弃用 O
Android 列表视图中的卡片翻转

我需要创建一个列表视图的视图这应该是一个自定义列表因为我希望列表中的每个项目都是一个图像视图触摸时会翻转以显示详细信息我正在根据 android 参考资料查看 Card Filp 视图使用片段但我觉得我错过了一些非常重要的东西
Python：点击字符串时从文本文件打印接下来的x行

情况如下我有一个 txt 文件其中包含多次 nslookups 的结果我想循环 tru 文件每次遇到字符串非权威答案时脚本都必须打印以下 8 行from那个位置如果它有效我应该在屏幕上得到所有积极的结果首先我有以下代码
获取当前日期（以毫秒为单位）（UTC）（不使用字符串）

好吧你可能认为这个问题已经被问过但我认为还没有我读过的解决方案都有这种拼图游戏技术比如getUTCMonth getUTCMinutes 但由于我只想比较两个 UTC 日期之间经过的秒数因此这不适用众所周知您可以通过以下方
AngularJs 无法在 module.run 中注入 $provide 和 $injector 服务

我正在尝试在 angularjs 中动态定义服务正如文档所说 provide https docs angularjs org api auto service 24provide and injector https docs angu
Java整数等于字符？

如果这个问题有点简单我很抱歉但我有点困惑为什么我的教授会做出以下声明请注意 read 返回一个整数值使用 int 作为返回类型允许 read 使用 1 来指示它已到达流的末尾您会记得在 Java 简介中 int 等于 char 这
使用 ng-class 添加多个类

警告此线程适用于旧的 AngularJS 我们可以有多个表达式来添加多个 ng class 吗 for eg div div 如果是的话任何人都可以举个例子来这样做当不同的表达式求值时应用不同的类true div Hello Worl
Javafx 实时线程更新

我同时使用 Javafx 和线程我经常遇到这个问题我制作一个按钮然后当单击该按钮时使用事件处理程序我制作一个 for 循环将按钮更改为 1 2 3 4 5 然后在每个中间延迟一秒钟就像倒计时一样但发生的情况是它延迟了 5 秒
性能说明：预热后代码运行速度变慢

下面的代码运行完全相同的计算 3 次它没有做太多事情基本上将 1 到 100m 之间的所有数字相加前 2 个块的运行速度大约是第三个块的 10 倍我已经运行这个测试程序超过 10 次结果显示差异很小如果有的话我希望第三个块运行

性能说明：预热后代码运行速度变慢

性能说明：预热后代码运行速度变慢 的相关文章

随机推荐

热门标签

性能说明：预热后代码运行速度变慢的相关文章