在编译过程中如何查看解析树、中间代码、优化代码和汇编代码?

2024-01-19

我正在学习编译器课程,程序的编译遵循以下步骤

  1. 词法分析
  2. 语法分析
  3. 语义分析
  4. 中间代码生成
  5. 代码优化
  6. 目标代码生成。

如何查看每个步骤的输出,例如我想在语法分析后查看解析树。

我正在使用 GCC 编译器在 Linux 机器上编译程序。

我们可以使用 gcc 中的 -Wa 编译器选项来查看程序的汇编代码,同样还有查看 Tokens、Parse tree 和 Inetmediate code 的选项。


虽然您可以使用-fdump-tree-all and -fdump-rtl-allgcc 中的选项,我认为它们的输出对于编译器学生来说不是很有用。 FWIW,我开始研究 gcc 作为我博士研究的一部分,已经完成了两门本科课程,我发现gcc其调试文件不透明且难以理解。

另外,gcc并没有真正遵循编译器的教科书设计。确实,没有人这样做,因为那样做效果不好。我很确定 gcc 不会生成解析树或抽象语法树。它确实构建了一个 IR(称为 gimple)来执行其高级优化。

我建议尝试 LLVM,它以设计精良且易于遵循而闻名。另一种选择是从教科书下载代码,尤其是 Appel 书中(假设有)。

另一个建议(如果我可以暂时推荐我自己的建议的话)是使用phc https://github.com/pbiggar/phc。 使用 phc,您可以将解析树视为图像,并在编译器中每次通过后查看 AST 和源代码。这是 AST 和解析树部分的比较 https://github.com/pbiggar/phc/blob/master/doc/manual/representingphp.rst。它们是使用 phc 简单生成的。您可以看到编译器 IR、CFG、SSA 形式以及类型推断和别名分析的调试输出。您还可以打开和关闭优化和传递以查看它们的效果。

我认为这对你可能有用。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在编译过程中如何查看解析树、中间代码、优化代码和汇编代码? 的相关文章

随机推荐