为什么我可以使用 ret 退出 main？

2024-05-01

我即将弄清楚程序堆栈到底是如何设置的。我了解到用以下方式调用该函数

call pointer;

实际上等同于：

mov register, pc ;programcounter
add register, 1 ; where 1 is one instruction not 1 byte ...
push register
jump pointer

然而，这意味着当 Unix 内核调用 main 函数时，堆栈基址应该指向调用 main 的内核函数的重入。

因此，在 C 代码中跳转“*rbp-1”应该重新进入主函数。

然而，这并不是以下代码中发生的情况：

#include <stdlib.h>
#include <unistd.h>

extern void ** rbp(); //pointer to stack pointing to function
int main() {
   void ** p = rbp();
   printf("Main: %p\n", main);
   printf("&Main: %p\n", &main); //WTF
   printf("*Main: %p\n", *main); //WTF
   printf("Stackbasepointer: %p\n", p);
   int (*c)(void) = (*p)-4;
   asm("movq %rax, 0");
   c();

   return 0;        //should never be executed...

}

汇编文件：rsp.asm

...

.intel_syntax

.text:

.global _rbp

_rbp:
  mov rax, rbp
  ret;

不出所料，这是不允许的，也许是因为此时的指令不完全是 64 位，也许是因为 UNIX 不允许这样做......

But also不允许此调用：

   void (*c)(void) = (*p);
   asm("movq %rax, 0"); //Exit code is 11, so now it should be 0
   c(); //this comes with stack corruption, when successful

这意味着我没有义务退出主调用函数。

我的问题是：为什么当我在每个 GCC 主函数末尾使用 ret 时，它的作用应该与上面的代码相同。 UNIX 系统如何有效地检查此类尝试...... 我希望我的问题很清楚......

谢谢。 P.S.：代码仅在 macOS 上编译，请更改 Linux 的程序集

C main从 CRT 启动代码（间接）调用，而不是直接从内核调用。

After main返回，该代码调用atexit函数执行诸如刷新 stdio 缓冲区之类的操作，然后将 main 的返回值传递给原始值_exit系统调用。或者exit_group它退出所有线程。

您做出了几个错误的假设，我认为这些假设都是基于对内核工作原理的误解。

内核以与用户空间不同的权限级别运行（x86 上的环 0 与环 3）。即使用户空间知道要跳转到的正确地址，它也无法跳转到内核代码。（即使可以，它也不会与内核一起运行特权级别).

ret isn't magic, it's basically just pop %rip and doesn't let you jump anywhere you couldn't jump to with other instructions. Also doesn't change privilege level¹.
当用户空间代码运行时，内核地址无法映射/访问；这些页表条目被标记为仅限主管。（或者它们根本没有映射到缓解 Meltdown 漏洞的内核中，因此进入内核会经过一个更改 CR3 的“包装”代码块。）

虚拟内存是内核保护自身免受用户空间影响的方式。用户空间不能直接修改页表，只能通过请求内核来完成mmap and mprotect系统调用。（并且用户空间无法执行特权指令，例如mov cr3, rax安装新的页表。这就是设置环 0（内核模式）与环 3（用户模式）的目的。）
对于进程来说，内核堆栈与用户空间堆栈是分开的。（在内核中，每个任务（也称为线程）还有一个小的内核堆栈，在用户空间线程运行时在系统调用/中断期间使用。至少 Linux 是这样做的，不知道其他的。）
内核并不是字面上的意思call用户空间代码；用户空间堆栈不会将任何返回地址保留回内核。内核->用户转换涉及交换堆栈指针以及更改特权级别。例如用类似的指令iret https://www.felixcloutier.com/x86/iret:iretd（中断返回）。

另外，将内核代码地址留在用户空间可以看到的任何地方都会破坏内核 ASLR。

脚注 1：（编译器生成的ret永远是正常的附近ret, not a retf可以通过调用门或其他方式返回给特权者cs价值。 x86 通过 CS 的低 2 位处理权限级别，但没关系。 MacOS / Linuxdon't设置用户空间可以用来调用内核的调用门；完成了syscall or int 0x80指示。）

在一个新鲜的过程中（经过execve系统调用用新的 PID 替换了前一个进程），执行从进程入口点开始（通常标记为_start), not在Cmain直接运行。

C 实现附带 CRT（C 运行时）启动代码，该代码（除其他外）有一个手写的 asm 实现_start（间接）调用main，根据调用约定将 args 传递给 main。

_start本身不是一个函数。在流程输入时，RSP 指向argc，上面的用户空间堆栈上是argv[0], argv[1]等（即char *argv[]数组按值就在那里，上面是envp大批。）_start loads argc放入寄存器并将指向 argv 和 envp 的指针放入寄存器中。（MacOS 和 Linux 都使用的 x86-64 System V ABI 记录了所有这些，包括进程启动环境和调用约定。)

If you try to ret from _start，你就会弹出argc进入RIP，然后从绝对地址取码1 or 2（或其他少量）将出现段错误。例如，_start 中 RET 上的 Nasm 分段错误 https://stackoverflow.com/questions/19760002/nasm-segmentation-fault-on-ret-in-start表明尝试ret从进程入口点（链接withoutCRT 启动代码）。它有一个手写的_start刚刚落入main.

当你跑步时gcc main.c, the gcc前端运行多个其他程序（使用gcc -v以显示详细信息）。这就是 CRT 启动代码链接到您的进程的方式：

gcc 预处理器 (CPP) 和编译+程序集main.c to main.o（或临时文件）。在 MacOS 上，gcc命令实际上是 clang，它有一个内置的汇编器，但是真实的gcc确实编译成asm然后运行as关于这一点。（不过，C 预处理器内置于编译器中。）
gcc 运行类似的东西ld -dynamic-linker /lib64/ld-linux-x86-64.so.2 -pie /usr/lib/Scrt1.o /usr/lib/gcc/x86_64-pc-linux-gnu/9.1.0/crtbeginS.o main.o -lc -lgcc /usr/lib/gcc/x86_64-pc-linux-gnu/9.1.0/crtendS.o。这实际上是简化的a lot，省略了一些 CRT 文件，并对路径进行了规范化以删除../../lib部分。另外，它不运行ld直接运行collect2这是一个包装器ld。但无论如何，静态链接在那些.oCRT 文件包含_start和其他一些东西，并动态链接 libc (-lc）和 libgcc （用于 GCC 辅助函数，例如实现__int128使用 64 位寄存器进行乘法和除法（如果您的程序使用这些寄存器）。

.intel_syntax

.text:

.global _rbp

_rbp:
  mov rax, rbp
  ret;

这是不允许的，...

不组装的唯一原因是因为你试图声明.text:作为标签，而不是使用.text 指示。如果删除尾随:它确实用 clang 进行组装（它对待.intel_syntax与.intel_syntax noprefix).

对于 GCC / GAS 来组装它，您还需要noprefix告诉它寄存器名称没有前缀%。（是的，就是你can有 Intel op dst、src 顺序，但仍然有%rsp注册名称。没有你不应该这样做！）当然，GNU/Linux 不使用前导下划线。

不过，如果你调用它，它并不总是会做你想做的事！如果你编译了main没有优化（所以-fno-omit-frame-pointer有效），那么是的，您会得到一个指向返回地址下方堆栈槽的指针。

而且你肯定错误地使用了该值. (*p)-4;加载保存的 RBP 值（*p)，然后偏移四个 8 字节空指针。（因为这就是 C 指针数学的工作原理；*p有类型void*因为p有类型void **).

我认为您正在尝试获取自己的返回地址并重新运行call指令（在 main 的调用者中）到达 main，最终因推送更多返回地址而导致堆栈溢出。在 GNU C 中，使用void * __builtin_return_address (0) 获取您自己的退货地址 https://gcc.gnu.org/onlinedocs/gcc/Return-Address.html.

x86 call rel32指令是5个字节，但是call调用 main 可能是间接调用，使用寄存器中的指针。所以它可能是一个2字节call *%rax或 3 字节call *%r12，除非你反汇编你的调用者，否则你不知道。（我建议按指令单步执行（GDB / LLDBstepi）结束main在反汇编模式下使用调试器。如果它有 main 调用者的任何符号信息，您将能够向后滚动并查看上一条指令是什么。

如果没有，你可能必须尝试看看什么看起来是正常的； x86 机器代码无法明确地向后解码，因为它是可变长度的。您无法区分指令中的字节（例如立即数或 ModRM）与指令的开头之间的区别。这完全取决于你在哪里start拆解自.如果您尝试几个字节偏移，通常只有一个会产生看起来正常的结果。

   asm("movq %rax, 0"); //Exit code is 11, so now it should be 0

这是 RAX 到绝对地址的存储0, 在 AT&T 语法中。这当然会出现段错误。退出代码 11 来自 SIGSEGV，即信号 11。（使用kill -l查看信号编号）。

也许你想要mov $0, %eax。尽管这在这里仍然毫无意义，但您将通过函数指针进行调用。在调试模式下，编译器可能会将其加载到 RAX 中并逐步执行您的值。

另外，在一个寄存器中写入一个asm当您不告诉编译器您正在修改哪些寄存器（使用约束）时，语句永远不会安全。

   printf("Main: %p\n", main);
   printf("&Main: %p\n", &main); //WTF

main and &main是同一件事，因为main是一个函数。这就是 C 语法对函数名称的作用。main不是一个可以获取其地址的对象。

数组的情况类似：数组的裸名称可以分配给指针或作为指针 arg 传递给函数。但&array也是同一个指针，同&array[0]。这仅适用于arrays like int array[10]，不适用于像这样的指针int *ptr;在后一种情况下，指针对象本身具有存储空间并且可以获取其自己的地址。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我可以使用 ret 退出 main？的相关文章

C++ - 错误 C3646：未知的覆盖说明符

我修改了我的项目编译后弹出一些奇怪的错误 ifndef BART RAY TRACER MESH H define BART RAY TRACER MESH H include
为什么这些冲突出现在以下 XML 的 yacc 语法中

我有以下 XML 语法效果很好 program lt ID attribute list gt root root lt ID attribute list gt node list lt ID gt node list node s n
通过指向基址的指针删除对象而不使用虚拟析构函数

我有代码 class A1 public A1 cout lt lt A1 virtual A1 cout lt lt A1 class A2 public A2 cout lt lt A2 A2 cout lt lt A2 class B
将 AT&T 语法转换为 INTEL 语法

我发现这个 GAS 文件包含一些可以从 CD 启动的引导加载程序代码我想研究它并尝试制作我自己的一个但唯一的问题是它采用 AT T 语法而不是 Intel 语法我对 AT T 语法一无所知我尝试过使用 Intel2gas 转换器但
如何在提升日期时间中忽略周末和节假日？

第一个问题我有一个提升日期对象如下所示 boost gregorian date 今天 2012 02 13 我从今天减去日期部分如下所示今天月 240 或今天天 X 等我想在进行上述减法时是否有办法排除周末和特殊假期我的意
Web API 2 中的方法名称约定 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是否有 Web API 2 中使用的约定的列表以这两种方法为例两者都可以工作但都没有用属性来装饰 IHttpActionResu
DirectX Vertex 中的 THE 是什么

我知道 RHW 是倒数同质 W 但有人可以解释一下它的使用方法和作用吗 gamedev论坛上的说明post http www gamedev net topic 440283 reciprocal of homogeneous w and
为什么 RFC 6797 禁止通过纯 HTTP 响应发送 Strict-Transport-Security 标头？

在阅读 HSTS 严格传输安全规范时我看到了一条禁令第 7 2 节 https www rfc editor org rfc rfc6797 section 7 2禁止在通过 http 而不是 https 访问时发送标头 HSTS 主机
如何防止打印屏幕

我有一个要求我正在开发的应用程序阻止用户轻松捕获屏幕内容我已经表示没有可行的方法可以完全防止这种情况发生但我正在寻找方法来为这一过程引入一些障碍我正在使用 C NET 2 0 和 WinForms 你不能您能做的最好的事情就是在
使用 C 通过引用传递数组

是的我已经阅读了这个问题和答案在 C 中通过引用传递数组 https stackoverflow com questions 1106957 pass array by reference in c 我有一个类似的问题并从该问题中实现
将图像添加到 ASP.Net 中的单选按钮列表

我正在尝试将图像添加到单选按钮列表控件但它不起作用我试过这个 RadioButtonList2 Items Add new ListItem String Format src Colors Dallas 625527 1 1 png
if(pointerVar) 与 if(pointerVar!=NULL) 相同吗？

简单的问题 Is if pointerVar 与if pointerVar NULL 也是if pointerVar 与if pointerVar NULL 给我你在技术上最正确迂腐的答案这两种说法看起来和操作起来都是一样的前者有什么
将 LPTSTR 转换为要写入文件的字符串或 char *

我想将 LPTSTR 转换为字符串或 char 以便能够使用 ofstream 将其写入文件有任何想法吗 Use T2A http msdn microsoft com en us library 87zae4a3 VS 80 aspx宏
C# 从字符串变量中获取类型并在泛型方法中使用它

我希望能够通过某种方式即从数据库获取我收到的字符串值的实际类型这样我就可以在通用方法中使用该类型例如DoSomething
如果未先将 lambda 表达式强制转换为委托或表达式树类型，则无法将其用作动态分派操作的参数

我正在使用 NET4 5 和 VS2013 我有这个查询dynamic来自数据库的结果 dynamic topAgents this dataContext Sql select t create user id as User sum t
Windows 中的蓝牙 AVRCP 命令会触发哪些事件

可以这么说只是在做一些高级侦察对于我的潘多拉客户 Elpis http elpis adamhaile net 我支持全局媒体键键盘上的 MediaPlayPause MediaNext 等并且我希望能够支持AVRCP http e
Linq 表达式树 Any() 问题

您好我在使用 Any 扩展方法的表达式树时遇到问题这是我的代码 IQueryable
如何获取 (Linux) 机器的 IP 地址？

这个问题和之前问的几乎一样如何获取本地计算机的IP地址 https stackoverflow com questions 122208 get the ip address of local computer 问题但是我需要找到一个的I
如何将curlpp 添加到我的项目中？

我正在尝试从 vb net 过渡到 C 但我陷入了困境我从下载了curpp这给了我一个 dll exp 和 lib 文件我将包含这 3 个文件的目录添加到项目属性中的附加库目录链接器 gt 常规接下来我将 ws2 32 lib
printf 右对齐括号内的数字

我正在编写一个程序显示数组中的所有信息它必须以括号中的数组索引开头例如 2 并且它们必须彼此正确对齐如果只是数字我知道你可以这样做 printf 10d index 但是用括号括起来会得到以下输出 1 2 10 11 当我真正希望

随机推荐

自定义 web.config 部分处理程序

我之前设计过一个自定义部分处理程序但我遇到了一个我似乎无法想到的问题我有一个像这样的配置部分
什么时候使用 IoC 合适？

我了解 IoC 容器是什么并且一直在阅读结构图这项技术似乎很容易使用我的问题是使用 IoC 容器的适当粒度级别是多少我认为 IoC 的应用可能有以下级别打破所有对象之间的所有依赖关系当然有点过分了打破所有主要对象例如域对象
MongoDB：在没有并行性的情况下使用 MapReduce 有什么意义？

Quoting http www mongodb org display DOCS MapReduce MapReduce Parallelism http www mongodb org display DOCS MapReduce Ma
无法在 Docker 下运行 AWS SAM CLI

我正在尝试创建一个 Docker 镜像AWS SAM CLI https github com awslabs aws sam cli 但调用任何函数都会出现错误无法导入模块 index 我可以在 Docker 之外成功运行相同的测试用例
如何在Android应用程序中添加g729编解码器？

我正在开发一个用于拨打和接听电话的 SIP 应用程序我想在我的应用程序中添加 G729 编解码器目前我正在对开源项目进行分析SipDroid http code google com p sipdroid 如果我想让该应用程序支持 G7
ggplot2 每个方面的不同因子顺序

我正在尝试创建一个克利夫兰点图在本例中为 J 和 K 给出两个类别问题是元素 A B C 都在这两个类别中所以 R 一直放屁我做了一个简单的例子 x lt c LETTERS 1 10 LETTERS 1 3 LETTERS 11
如何以编程方式停止/退出/终止 dotnet core HostBuilder 控制台应用程序？

我正在尝试创建一个 dotnet 核心控制台应用程序该应用程序是一个简单的实用程序应用程序应该启动执行其操作并退出使用 Visual Studio 生成的标准控制台应用程序模板可以轻松实现但现在我们有了 HostBuilder 它
提取字符串中最后一个句点后的文本[重复]

这个问题在这里已经有答案了我意识到这个问题对于大多数正则表达式大师来说可能看起来非常简单但是回顾类似的问题并没有得出解决方案我有一个电子邮件地址向量称为email并希望在每个最后一个句点之后提取文本举例来说 email lt c
[BotFramework]：如何修复：在 V4 中开发的 C# WebChatBot 中，欢迎消息未向用户显示，但在模拟器中显示？
数组中 2 个百分位之间的平均元素

我有 2 个长度为 200 的向量例如 A 和 B 然后我使用以下方法找到数组 A 的每第二个百分位数 A1 prctile A 1 2 100 1 这样A1是一个长度为50的数组现在我想找到A1中每两个元素内的A元素的平均值即A的第
强制 Access 忘记链接表的用户名和密码

我有一个通过链接服务器连接到 SQL Server 的 MS Access 数据库链接表是使用修改后的添加的AttachDSNLessTable程序 stConnect ODBC DRIVER stDriverName SERVER st
Slick中的动态查询参数（排序）

我正在尝试将异常查询转换为平滑查询Play 2 3 示例之一 https github com playframework playframework tree 2 3 x samples scala computer database 但
Pyspark 可为空的 uuid 类型 uuid 但表达式的类型为字符变化

给定一个表格设计不可为 null 的 uuid列和a可为空的 uuid列如何使用 python 3 7 9 与 Pyspark 2 4 3 数据帧和 postgresql 42 2 18 jar 驱动程序进行插入 table df spa
验证错误消息中不包含字段名称

如果我有以下验证 validates inclusion of dob in gt Date new 1900 Time now years ago 18 to date message gt You must be 18 or older
从 Linux 内核模块的文件描述符获取文件名/路径？

在Linux内核模块中有没有一种方法可以从文件名路径中获取文件名路径 unsigned int fd 我知道这个答案如何从内核模块内的文件描述符获取文件名 https stackoverflow com questions 8250
抑制SQL Server SSDT中的一些警告

In SQL Server 数据工具 http msdn microsoft com en us library hh272686 我想抑制某些但不是全部 SQL71502 的出现具有对对象的未解析引用我知道我可以通过项目属性构建抑
为什么组合器输入记录的数量比映射的输出数量多？

Combiner 在 Mapper 之后 Reducer 之前运行它将接收给定节点上的 Mapper 实例发出的所有数据作为输入然后它将输出发送到Reducers 因此组合器输入的记录应小于映射输出的记录 12 08 29 13 38
使用 Powershell 按列拆分 csv 文件

我是 powershell 的新手但这看起来是完成此任务的最佳工具有一个如下所示的 csv 文件 Date mary1 mary2 maryr3 mary4 9 01 2011 1 00 1 39 3 43 3 29 1 83 9 01
定制 odoo 中的会计和财务模块？

我正在研究会计和财务模块我想做一些修改例如隐藏字段和隐藏税收图表有人能帮我吗请告诉我隐藏左侧菜单项税表的程序我也想知道view id隐藏发票表中的税费和底部税费更新请让我知道隐藏它们的外部 ID 我无法找到它们因为它们链
为什么我可以使用 ret 退出 main？

我即将弄清楚程序堆栈到底是如何设置的我了解到用以下方式调用该函数 call pointer 实际上等同于 mov register pc programcounter add register 1 where 1 is one instr

为什么我可以使用 ret 退出 main？

为什么我可以使用 ret 退出 main？ 的相关文章

随机推荐

热门标签

为什么我可以使用 ret 退出 main？的相关文章