Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？

2024-03-29

在运行 GHC 编译的程序时，我经常看到 GC 上花费了大量的周期。

这些数字往往比我的 JVM 经验所建议的要高出一个数量级。特别是，GC“复制”的字节数似乎比我正在计算的数据量大得多。

非语言和严格语言之间的这种差异是根本性的吗？

tl;dr:JVM 在堆栈帧中执行的大部分操作，GHC 在堆上执行。如果您想将 GHC 堆/GC 统计信息与 JVM 等效项进行比较，您确实需要考虑someJVM 用于将参数压入堆栈或在堆栈帧之间复制返回值的字节/周期的一部分。

长版：

针对 JVM 的语言通常会利用其调用堆栈。每个调用的方法都有一个活动堆栈帧，其中包括传递给它的参数的存储、附加局部变量和临时结果，以及用于将参数传递给它调用的其他方法并从其调用的其他方法接收结果的“操作数堆栈”的空间。

举个简单的例子，如果 Haskell 代码：

bar :: Int -> Int -> Int
bar a b = a * b
foo :: Int -> Int -> Int -> Int
foo x y z = let u = bar y z in x + u

被编译到 JVM，字节码可能看起来像这样：

public static int bar(int, int);
  Code:
    stack=2, locals=2, args_size=2
       0: iload_0   // push a
       1: iload_1   // push b
       2: imul      // multiply and push result
       3: ireturn   // pop result and return it

public static int foo(int, int, int);
  Code:
    stack=2, locals=4, args_size=3
       0: iload_1   // push y
       1: iload_2   // push z
       2: invokestatic bar   // call bar, pushing result
       5: istore_3  // pop and save to "u"
       6: iload_0   // push x
       7: iload_3   // push u
       8: iadd      // add and push result
       9: ireturn   // pop result and return it

请注意，对内置原语的调用如imul和用户定义的方法，例如bar涉及将参数值从本地存储复制/推送到操作数堆栈（使用iload指令），然后调用原语或方法。然后需要将返回值保存/弹出到本地存储（使用istore）或返回给调用者ireturn;有时，返回值可以留在堆栈上作为另一个方法调用的操作数。另外，虽然字节码中没有明确说明，ireturn指令涉及从被调用者的操作数堆栈到调用者的操作数堆栈的复制。当然，在实际的 JVM 实现中，想必可以进行各种优化来减少复制。

当其他东西最终调用时foo产生计算，例如：

some_caller t = foo (1+3) (2+4) t + 1

（未优化的）代码可能如下所示：

       iconst_1
       iconst_3
       iadd      // put 1+3 on the stack
       iconst_2
       iconst_4
       iadd      // put 2+4 on the stack
       iload_0   // put t on the stack
       invokestatic foo
       iconst 1
       iadd
       ireturn

同样，子表达式是通过操作数堆栈上的大量压入和弹出来计算的。最终，foo调用时将其参数压入堆栈，并将其结果弹出以供进一步处理。

所有这些分配和复制都发生在该堆栈上，因此本示例中不涉及堆分配。

现在，如果使用 GHC 8.6.4 编译相同的代码（为了具体起见，没有进行优化，并且在 x86_64 架构上），会发生什么？嗯，生成的程序集的伪代码类似于：

foo [x, y, z] =
    u = new THUNK(sat_u)                   // thunk, 32 bytes on heap
    jump: (+) x u

sat_u [] =                                 // saturated closure for "bar y z"
    push UPDATE(sat_u)                     // update frame, 16 bytes on stack
    jump: bar y z

bar [a, b] =
    jump: (*) a b

调用/跳转到(+) and (*)由于涉及到类型类，“基元”实际上比我想象的更复杂。例如，跳转到(+)看起来更像是：

    push CONTINUATION(\f -> f x u)         // continuation, 24 bytes on stack
    jump: (+) dNumInt                      // get the right (+) from typeclass instance

如果你打开-O2，GHC 优化了这个更复杂的调用，但它也优化了这个示例中有趣的所有其他内容，因此为了论证，让我们假设上面的伪代码是准确的。

Again, foo在有人调用它之前没有多大用处。为了some_caller上面的例子，调用的代码部分foo看起来像：

some_caller [t] =
    ...
    foocall = new THUNK(sat_foocall)       // thunk, 24 bytes on heap
    ...

sat_foocall [] =                           // saturated closure for "foo (1+3) (2+4) t"
    ...
    v = new THUNK(sat_v)                   // thunk "1+3", 16 bytes on heap
    w = new THUNK(sat_w)                   // thunk "2+4", 16 bytes on heap
    push UPDATE(sat_foocall)               // update frame, 16 bytes on stack
    jump: foo sat_v sat_w t

sat_v [] = ...
sat_w [] = ...

请注意，几乎所有分配和复制都发生在堆上，而不是堆栈上。

现在，让我们比较这两种方法。乍一看，罪魁祸首确实是懒惰的评估。我们在各处创建这些重击，如果评估严格的话就没有必要，对吧？但让我们更仔细地看看其中一个重击声。考虑 thunk 为sat_u在定义中foo。它的大小为 32 字节/4 个字，内容如下：

// THUNK(sat_u)
word 0:  ptr to sat_u info table/code
     1:  space for return value
     // variables we closed over:
     2:  ptr to "y"
     3:  ptr to "z"

这个 thunk 的创建与 JVM 代码没有本质上的不同：

       0: iload_1   // push y
       1: iload_2   // push z
       2: invokestatic bar   // call bar, pushing result
       5: istore_3  // pop and save to "u"

而不是推y and z到操作数堆栈上，我们将它们加载到堆分配的 thunk 中。我们没有将结果从操作数堆栈弹出到堆栈帧的本地存储中并管理堆栈帧和返回地址，而是在 thunk 中为结果留出空间，并在将控制权转移到堆栈之前将 16 字节更新帧推送到堆栈上。bar.

同样，在调用foo in some_caller，我们没有通过将常量压入堆栈并调用原语将结果压入堆栈来评估参数子表达式，而是在堆上创建了 thunk，每个 thunk 都包含一个指向信息表/代码的指针，用于调用这些参数上的原语和空间返回值；更新框架取代了 JVM 版本中隐含的堆栈簿记和结果复制。

最终，thunk 和更新帧是 GHC 对基于堆栈的参数和结果传递、局部变量和临时工作空间的替代品。 JVM 堆栈帧中发生的许多活动都发生在 GHC 堆中。

现在，JVM 堆栈帧和 GHC 堆中的大部分内容很快就会变成垃圾。主要区别在于，在 JVM 中，在运行时复制出重要内容（例如返回值）后，当函数返回时，堆栈帧会自动丢弃。在GHC中，堆需要进行垃圾收集。正如其他人所指出的，GHC 运行时是围绕绝大多数堆对象将立即变成垃圾的想法构建的：快速碰撞分配器用于初始堆对象分配，而不是每次函数返回时都复制出重要的内容（对于 JVM），当凹凸堆变满时，垃圾收集器会将其复制出来。

显然，上面的玩具例子是荒谬的。特别是，当我们开始谈论在 Java 对象和 Haskell ADT 上运行的代码时，事情会变得更加复杂，而不是Ints。然而，它说明了一点：直接比较 GHC 和 JVM 之间的堆使用情况和 GC 周期并没有多大意义。当然，精确的计算似乎不太可能，因为 JVM 和 GHC 方法根本不同，并且证据将在现实世界的性能中。至少，GHC 堆使用情况和 GC 统计数据的逐一比较需要考虑 JVM 在操作数堆栈之间推入、弹出和复制值所花费的周期的一部分。特别是，至少 JVM 的一部分return指令应计入 GHC 的“复制字节数”。

至于“惰性”对堆使用（尤其是堆“垃圾”）的贡献，似乎很难隔离。 Thunk 确实扮演着双重角色，既可以替代基于堆栈的操作数传递，又可以作为延迟求值的机制。当然，从惰性到严格的转变可以减少垃圾——而不是首先创建一个 thunk 然后最终将其评估为另一个闭包（例如，构造函数），您可以直接创建评估的闭包——但这只是意味着而不是您的简单程序在堆上分配了令人兴奋的 172 GB，也许严格版本“仅”分配了适度的 84 GB。

据我所知，惰性求值对“复制字节”的具体贡献应该是最小的——如果闭包在 GC 时很重要，则需要复制它。如果它仍然是一个未评估的 thunk，则该 thunk 将被复制。如果它已被评估，则只需复制最终的闭包。如果有的话，由于复杂结构的 thunk 比它们的评估版本小得多，所以惰性通常应该reduce复制的字节数。相反，严格的通常的巨大胜利是它允许某些堆对象（或堆栈对象）更快地变成垃圾，这样我们就不会导致空间泄漏。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？的相关文章

我们不应该使用单子绑定来使用循环写下 mfix 的情况

我一直在尝试写mfix向下使用Control Arrow loop https hackage haskell org package base 4 14 0 0 docs src Control Arrow html loop 我想出了不
计算/获取分层数据的“级别”

好吧我真的不知道这是否是正确的标题但我不知道如何称呼它我的问题是关于我的作业我现在已经工作了几个小时主题是函数式数据结构我有点陷入困境我不知道如何继续所以我需要编写一个具有以下签名的函数 data Heap e t Hea
Haskell 真的是纯粹的吗（有任何语言可以处理系统外的输入和输出）吗？

在谈到函数式编程中的 Monad 后该功能是否真的使语言变得纯粹或者它只是黑板数学之外的现实世界中计算机系统推理的另一张免狱卡 EDIT 这不是有人在这篇文章中所说的火焰诱饵而是一个真正的问题我希望有人能用它来击倒我并说证明它
表达式“ap zip tail”如何工作

我想知道怎么写f x zip x tail x 点免费所以我使用了pointfree程序结果是f ap zip tail ap作为 Control Monad 的函数我不明白点自由定义是如何工作的如果我能从类型的角度去理解的话希望
不同 hs 文件中的函数分离时堆栈空间溢出

我有一个巨大的 haskell 文件它编译和运行没有任何问题我想将一些函数和类型定义放在通用 hs 文件中的单独模块中然后将其导入我的主模块中虽然主程序编译时没有任何错误它还编译导入的模块但当我尝试运行它时出现堆栈空间溢出 I
可以通过Data.Function.fix来表达变形吗？

我有这个可爱的fixana这里的函数执行速度比她的姐妹快 5 倍左右ana 我有一个criterion报告支持我这一点 ana alg Fix fmap ana alg alg fixana alg fix f gt Fix fmap f
Haskell printf 转字符串

Haskell 中有等效的 sprintf 吗我需要将双精度值转换并格式化为字符串有没有其他方法而不使用printf什么样的功能主要问题是要避免 Prelude gt putStrLn myDoubleVal 1 7944444444
'lens' 的阴谋集团依赖性解析失败

我刚刚做了一个阴谋更新并尝试从 hackage 安装 lens 这给了我以下错误 cabal install j lens Resolving dependencies Configuring dlist 0 7 0 1
如果我再次使其可用，“最终确定”的对象会发生什么情况？

好吧我尝试制作一个最终确定的 object 再次可用我知道从甲骨文文档 http docs oracle com javase 7 docs api java lang Object html finalize that finali
“反向”使用 Maybe Monad

假设我有很多功能 f a gt Maybe a g a gt Maybe a h a gt Maybe a 我想按以下方式组合它们如果 f 返回 Nothing 则计算 g 如果 g 返回 Nothing 则计算 h 如果其中任何一个计算
将 Either 列表转换为其中包含列表的 Either 列表

我是 Haskell 的初学者我正在编写一些使用 Haskell 的代码Either https hackage haskell org package base 4 9 0 0 docs Data Either html用于错误处理 E
GHC 是否使用存在类型的动态调度？

下面的代码是否使用了 C 或 Java 中所理解的动态调度据我了解在最后一行编译器不可能在编译时知道要调用哪个实现但代码会编译并产生正确的结果有人可以解释一下这背后有什么样的实现例如 vptr 吗 LANGUAGE Exis
Haskell 中的相互递归求值器

Update 我已经添加一个答案 https stackoverflow com questions 3524485 mutually recursive evaluator in haskell 4504200 4504200这描述了我的
在 haskell 中处理 IO 与纯代码

我正在编写一个shell脚本我在haskell中的第一个非示例它应该列出一个目录获取每个文件大小进行一些字符串操作纯代码然后重命名一些文件我不确定我做错了什么所以有两个问题我应该如何安排这样的程序中的代码我有一个具体问题
即使在 GC Collect 和 WaitForPendingFinalizers 之后，窗口对象在关闭后也未释放？

这是一个简单的测试应用程序可帮助了解 WPF 内存使用情况我想了解的关键是为什么MainWindow即使在关闭并等待 GC 完成之后仍然被引用并且它的内存没有被释放参见下面的代码清单文本 MainWindow Finalizer
有什么方法可以在 do / while / let 块中打印出变量的类型吗？

有没有办法打印出嵌套变量的推断类型ghci 考虑代码 let f g where g x Int x 那么最好查询一下类型g e g t f g会打印出Int gt Int 您可以通过给出适当的错误类型注释并检查错误消息来诱骗此信息 Ma
管道中缺少 ResourceT 实例

我在尝试使用时遇到奇怪的错误ResourceT http hackage haskell org package conduit 1 0 9 1 docs Data Conduit html t 3aResourceT来自管道 1 0 9
为什么解析器组合器“seq”用“bind”和“return”定义？

我正在读这个article http eprints nottingham ac uk 237 1 monparsing pdf关于解析器组合器并且不理解以下内容他们说使用seq 见下文导致解析器将嵌套元组作为结果操作起来很混乱 se
为什么以下内容会并行运行而不是顺序运行？

给定以下函数evalPair parPair and deepSeq分别 evalPair Strategy a gt Strategy b gt Strategy a b evalPair sa sb a b do a lt sa a b
垃圾收集器是否在单独的进程中运行？

垃圾收集器是否在单独的进程中启动例如如果我们尝试测量某段代码所花费的进程时间并且在此期间垃圾收集器开始收集它会在新进程上启动还是在同一进程中启动它的工作原理如下吗 Code Process 1 gt Garbage Collect

随机推荐

如何通过 ID 以外的其他方式获取 Backbone.js 模型？

Backbone js 通过 ID 获取模型的默认 RESTful 方法非常简单且直接但是我似乎找不到任何通过不同属性获取模型的示例如何通过不同的属性获取 Backbone js 模型 var Widget Backbone Mode
单个文件中的多个类：此处不允许修饰符 private

我无法理解为什么这段代码不能编译 class A public static void main String args System out println hi private class B int a 我将内容保存在名为的文件中A
Azure ARM 模板嵌套模板部署不会更新资源\无法启动

我有以下 ARM 模板结构 Parent Template Nested Template 1 Nested Template 6 所以我只有 2 层模板父级模板和嵌套模板假设我将父级部署到一个空资源组一切正常之后我删除其中一项资
iOS - 通过区域设置更改 UIDatePicker 的语言

我正在用 Herbrew 语言创建应用程序 iPhone 的语言可以是任何语言但我的应用程序只能在 Herbrew 中运行在 iOS 的 UIDatePicker 中我们有一个属性 locale 它将更改它显示的语言但在 iOS5
Java Swing 保存和加载工作区/设置

我有一个 Java Swing 应用程序其中包含一堆框架而这些框架又主要包含显示大量数据的表格由于在启动时安排所有窗口和表格总是很麻烦且耗时因此我想实现工作区功能以便用户可以保存首选项设置并在启动时选择自动将存储的工作区加载到
找到未合并的 Git 分支？

我有一个包含许多分支的 Git 存储库其中一些已经合并一些还没有由于分支数量相当多如何判断哪些分支尚未合并我想避免必须进行章鱼合并和重新合并已经合并的分支尝试这个 git branch merged master 它按照锡上
为什么我的标签栏按钮无法在 iPad 上自动调整大小？

我正在构建一个通用的 iOS 应用程序 iPad 版本使用 SplitViewController 在弹出视图中我有一个带有两个按钮的 UITabBarController 当它在 iPhone 上运行时 TabBar 按钮正确拉伸以填充
MVC 3 中如何处理会话超时

我遇到了频繁的会话超时问题我想编写一个可以在每个控制器上使用的通用过滤器过滤器应该重定向用户登录并在登录后返回到用户发送最后一个请求的位置你可以尝试这样的事情 public class SessionExpireAttribute
错误 (407)“需要代理身份验证。”

我有一个要求比如我想从 winforms 访问一个 url 登录页面即 Web 我必须将凭据传递给该网址并且响应应该是经过身份验证的网页标记的内容我已经编写了一个函数它将请求 url 并返回响应但我收到错误代码 407 需
git Reset 文件和 git checkout 文件有什么区别？

为什么 git 允许我重置文件我以为我明白了reset 从某种意义上说它正在移动头部显然我错了 So git reset sha file似乎做同样的事情git checkout sha file 除了我看到的file在索引和工作目录
Kestrel 错误：地址已在使用中（dotnet 核心）

摘要它的工作原理是dotnet run 但它不起作用dotnet myappname dll 我的 Linux 技能有限但我正在尝试按照书本进行操作这样我就不会混淆事情以下本教程 http www hanselman com blo
在 iOS 14 中，Interface Builder 中设置的 UITextField backgroundColor 在运行时为零

我有一个应用程序可以在 iOS 11 13 上正常运行但是当我在 iOS 14 中运行它时有几个其中的文本字段用零渲染因此透明背景颜色即使背景颜色在 Interface Builder 中明确设置为白色我在代码中看不到任何使用可能
如何在 PySide2 应用程序中嵌入 matplotlib 画布

我正在尝试将 matplotlib 画布嵌入到 PySide2 应用程序中我尝试使用这个例子 https matplotlib org examples user interfaces embedding in qt5 html http
使用 bash 计算文件中每个单词的出现次数

我想计算文件中每个单词的出现次数但结果是错误的 bin bash usage count sh file declare a dict for word in cat 1 do if dict word then dict word 0
在 Google 表格中两个数字之间的列中填写数字

所以我试图填写 Google 表格中两个单元格之间的数字我从 270 开始在列中出现几个不确定且变化的空单元格后我需要达到 180 我需要均匀地填充它们之间的单元格但如何呢如果您想将这些值粘贴到同一列中您需要执行以下操作那么公
Prolog - 递归列表构建

对于我正在编写的程序我需要创建一个列表列表其中包含代表乘积的数字对和两个给定数字的总和现在我有一个函数我可以指定将列表添加到列表中的次数稍后将使用完整功能进行扩展这是我所拥有的 s1 0 X s1 Q X N is Q 1 mu
NFC 广播接收器问题

我希望我的应用程序仅在激活时侦听 nfc 标签为此我尝试如下注册一个 nfc 侦听器但没有成功 IntentFilter filter new IntentFilter android nfc action TECH DISCOVER
使用查询生成器或 Eloquent 进行带有附加条件的 JOIN

我正在尝试使用 Laravel 查询生成器的 JOIN 查询添加条件
Android 上的 Libgdx app.exit() 未关闭应用程序

在我用 libGDX 开发的 Android 应用程序中我使用Gdx app exit 当用户尝试退出游戏时这会关闭游戏但是当用户重新启动应用程序时所有Textures被扰乱超出了使用该应用程序的范围我注意到如果我从任务管理器
Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？

在运行 GHC 编译的程序时我经常看到 GC 上花费了大量的周期这些数字往往比我的 JVM 经验所建议的要高出一个数量级特别是 GC 复制的字节数似乎比我正在计算的数据量大得多非语言和严格语言之间的这种差异是根本性的吗 tl dr

Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？

长版：

Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？ 的相关文章

随机推荐

热门标签

Haskell 中的垃圾 thunk 是否存在固有的“携带成本”？的相关文章