我很难理解由简单C程序的gcc创建的汇编语言输出。
这是该计划的C代码:
#include <stdio.h>
#include <stdlib.h>
int sum1=1;
int sum2=1;
int add(int s1, int s2){
return s1+s2;
}
int main(int argc,char** agrv){
int res=sum1+sum2;
return 0;
}
这是gcc创建的汇编代码:
.file "main.c"
.globl sum1
.data
.align 4
sum1:
.long 1
.globl sum2
.align 4
sum2:
.long 1
.text
.globl add
.def add; .scl 2; .type 32; .endef
.seh_proc add
add:
pushq %rbp
.seh_pushreg %rbp
movq %rsp, %rbp
.seh_setframe %rbp, 0
.seh_endprologue
movl %ecx, 16(%rbp)
movl %edx, 24(%rbp)
movl 16(%rbp), %edx
movl 24(%rbp), %eax
addl %edx, %eax
popq %rbp
ret
.seh_endproc
.def __main; .scl 2; .type 32; .endef
.globl main
.def main; .scl 2; .type 32; .endef
.seh_proc main
main:
pushq %rbp
.seh_pushreg %rbp
movq %rsp, %rbp
.seh_setframe %rbp, 0
subq $48, %rsp
.seh_stackalloc 48
.seh_endprologue
movl %ecx, 16(%rbp)
movq %rdx, 24(%rbp)
call __main
movl sum1(%rip), %edx
movl sum2(%rip), %eax
addl %edx, %eax
movl %eax, -4(%rbp)
movl $0, %eax
addq $48, %rsp
popq %rbp
ret
.seh_endproc
.ident "GCC: (x86_64-posix-seh-rev2, Built by MinGW-W64 project) 7.1.0"
我很难理解汇编代码中某些指令的操作数的顺序(另请参阅存储器布局图片以供参考Memory Layout)。首先,有指令
pushq %rbp
它将调用者的基指针推入堆栈。在此指令之后出现以下指令:
movq %rsp, %rbp
该指令应将被调用者的基指针设置为当前堆栈指针的值。但是,不应该两个操作数的顺序相反(例如movq%rbp,%rsp)?
指令中出现类似的“问题”:
addl %edx, %eax
这里,操作的结果存储在寄存器%edx而不是%eax(用于返回函数参数)中。
到目前为止我在互联网上咨询过的几乎所有来源都声称指令的结果存储在指令的第一个参数中?
GNU编译器使用“AT&T语法”生成汇编,而不是按照here的说明生成Intel语法:
GNU汇编程序gas使用与您在任何x86参考手册中可能找到的语法不同的语法,而双操作数指令的源和目标顺序相反。以下是燃气说明的类型:
opcode (e.g., pushal) opcode operand (e.g., pushl %edx) opcode source,dest (e.g., movl %edx,%eax) (e.g., addl %edx,%eax)
哪里有两个操作数,最右边的一个是目的地。最左边的是源。