如何在GNU汇编器中使用字符串文字作为直接操作数(并将其移动到一个地址)?

问题描述 投票:1回答:1

我的意思是在NASM中写这样的东西。

mov dword [0xA0BF17C], ' : )'

我已经在GNU汇编器中尝试过这样的东西:

movd " : )", 0xB8000

movd $" : )", 0xB8000

movd ' : )', 0xB8000

movd " : )", $0xB8000

但是... 他们都导致了这个错误。

Error: unbalanced parenthesis in operand 1.
assembly x86 gas att
1个回答
4
投票

GAS只支持单字符字符作为数字。 UTF-8多字节的单字符是可以的,但是......。 多个独立字符。 你可以做 movb $' ', 0xB8000但你不想为4个字节使用4条指令。

你有两个真正的选择:将单个字符的字元移到一起变成一个数字,或者用十六进制写出来。 (这两种方式都考虑到了x86是小字型的)

# NASM   mov eax, "abcd"
movl  $'a' + ('b'<<8) + ('c'<<16) + ('d'<<24),  0xB8000
movl  $0x64636261,  0xB8000         # or manual ASCII -> hex, little-endian

shiftadd技巧适用于任何任意的字节;你甚至可以做个 #define CPP宏来做(取4个args)。

用EAX目的地址代替内存(为了简化机器代码),拆解回GAS英特尔语法(objdump -drwC -Mintel),我们可以看到它们都是完全一样的组装(以 as --32):

   0:   b8 61 62 63 64          mov    eax,0x64636261
   5:   b8 61 62 63 64          mov    eax,0x64636261

或者用你的内存目标。 同样,32位模式,因为这将#GP故障在真实模式下从超过64k DS段限制与该0xb8000偏移。同时注意到机器代码中的直接字节与将作为数据存储到内存目的地的顺序相同。 (如果你使用的是NASM,它们与源码顺序相匹配。mov dst, "abcd".

a:   c7 05 00 80 0b 00 61 62 63 64   mov    DWORD PTR ds:0xb8000,0x64636261

与NASM不同。GAS不支持多字符字符作为数字常量。 它不支持它们,以至于它们甚至混淆了GAS的解析器。1! GAS主要是为汇编编译器输出而设计的,编译器不需要这个。

GAS只支持(双)引号的多字符字符串作为args到 .ascii .asciz .string8/16/32,不要 .byte (与NASM不同) db)或作为指令的直接操作数。

如果它被支持,x86的AT&T语法将是 movl $' : )', 0xB8000. 不 movd,而直接操作数总是需要一个 $.


双引号也不行: mov $"foo", %eax 组装,但它的组装方式同 mov $foo, %eax - 写上符号的地址 foo 变成一个寄存器。 见 当制作PIE对象时,不能使用R_X86_64_8对未定义符号 "ELF "的重定位。 以此为例。


脚注1。 因此出现了 "不平衡括号 "这样的错误,而不是 "字符文字包含多个字符 "这样的合理错误。

mov $'abcd', %eax

是另一个完全迷惑解析器的例子。 它看到的是 "不平衡的小括号",而不是 "字符字面包含多个字符 "这样合理的错误。b 作为本地标签的后向符号引用,如 jmp 1b 提及 1: 标签向后的方向。 但这里它要找的标签号是97,ASCII值为 'a'. 这简直是疯了

foo.s: Assembler messages:
foo.s:4: Error: backward ref to unknown label "97:"
foo.s:4: Error: junk `cd44%eax' after expression
foo.s:4: Error: number of operands mismatch for `mov'

所有这些都是用 as --version = GNU汇编器(GNU Binutils) 2.34.

© www.soinside.com 2019 - 2024. All rights reserved.