7. 生成机器码

完成上一节留空的 compile 方法。

整个 brainfuck 程序将被编译为一个大函数，在上一节的 run 方法中我们已经指定了该函数的签名。

type RawFn = unsafe extern "sysv64" fn(
    this: *mut BfVM<'_>,
    memory_start: *mut u8,
    memory_end: *const u8,
) -> *mut VMError;

在 compile 方法中，首先初始化汇编器，函数起始地址就是最开始的偏移。

loops 作为栈，用来存放动态标签，指引跳转。

impl BfVM<'_> {
    #[allow(clippy::fn_to_numeric_cast)]
    fn compile(code: &[BfIR]) -> Result<(dynasmrt::ExecutableBuffer, dynasmrt::AssemblyOffset)> {
        let mut ops = dynasmrt::x64::Assembler::new()?;
        let start = ops.offset();

        let mut loops = vec![];

sysv64 调用约定规定 rdi, rsi, rdx, rcx 存放前四个整数参数，rax 存放返回值，这些属于易失性寄存器，在调用子函数时其内容可能丢失。

rbp, rbx, r12 ~ r15 是非易失性寄存器，在调用子函数时不会丢失。如果函数中会占用这些寄存器，也要在开头和结尾相应地保存和恢复它们的内容。

我们在注释里记录函数会用到的所有寄存器。rdi, rsi, rdx 对应函数的三个参数，我们将其保存到 r12, r13, r14 寄存器。函数中需要一个 ptr 变量记录 brainfuck 程序的当前指针，我们使用 r15 寄存器。

        // this:         rdi r12
        // memory_start: rsi r13
        // memory_end:   rdx r14
        // ptr:              r15

汇编函数开始，首先把 rax 压栈。x86-64-psABI 规定参数区域的结尾按16字节对齐。函数开始时返回地址压栈，此时栈指针+8 是 16 的倍数，因此再把 rax 压栈，使栈指针对齐，以便之后的函数调用，rax 的内容没有意义。

由于函数中用到 r12 ~ r15 非易失性寄存器，将其压栈保存。注意这里压入 4 个 8 字节寄存器，栈指针仍然对齐。

        dynasm!(ops
            ; push rax
            ; push r12
            ; push r13
            ; push r14
            ; push r15
            ; mov r12, rdi   // save this
            ; mov r13, rsi   // save memory_start
            ; mov r14, rdx   // save memory_end
            ; mov r15, rsi   // ptr = memory_start
        );

每个 IR 依次映射到汇编。

指针移动，需要检查算术溢出和数组边界溢出，出错即跳转到全局标签所指的错误处理区域。

        use BfIR::*;
        for &ir in code {
            match ir {
                AddPtr(x) => dynasm!(ops
                    ; add r15, x as i32     // ptr += x
                    ; jc  ->overflow        // jmp if overflow
                    ; cmp r15, r14          // ptr - memory_end
                    ; jnb ->overflow        // jmp if ptr >= memory_end
                ),
                SubPtr(x) => dynasm!(ops
                    ; sub r15, x as i32     // ptr -= x
                    ; jc  ->overflow        // jmp if overflow
                    ; cmp r15, r13          // ptr - memory_start
                    ; jb  ->overflow        // jmp if ptr < memory_start
                ),

单个字节的算术加减，允许溢出。

                AddVal(x) => dynasm!(ops
                    ; add BYTE [r15], x as i8    // *ptr += x
                ),
                SubVal(x) => dynasm!(ops
                    ; sub BYTE [r15], x as i8    // *ptr -= x
                ),

IO 操作。首先保存当前数据指针寄存器，将虚拟机函数所需的各参数和函数地址放入寄存器，调用函数。

如果函数返回的不是空指针，说明出错，应该跳转到IO错误处理区域。

最后恢复数据指针寄存器。

                GetByte => dynasm!(ops
                    ; mov  rdi, r12         // arg0: this
                    ; mov  rsi, r15         // arg1: ptr
                    ; mov  rax, QWORD BfVM::getbyte as _
                    ; call rax              // getbyte(this, ptr)
                    ; test rax, rax
                    ; jnz  ->io_error       // jmp if rax != 0
                ),
                PutByte => dynasm!(ops
                    ; mov  rdi, r12         // arg0: this
                    ; mov  rsi, r15         // arg1: ptr
                    ; mov  rax, QWORD BfVM::putbyte as _
                    ; call rax              // putbyte(this, ptr)
                    ; test rax, rax
                    ; jnz  ->io_error       // jmp if rax != 0
                ),

跳转指令。利用 dynasm 提供的 api，创建两个动态标签，分别生成跳转汇编。由于编译到 IR 时已经验证过跳转指令的对应关系，这里的栈可以直接弹出。

                Jz => {
                    let left = ops.new_dynamic_label();
                    let right = ops.new_dynamic_label();
                    loops.push((left, right));

                    dynasm!(ops
                        ; cmp BYTE [r15], 0
                        ; jz => right       // jmp if *ptr == 0
                        ; => left
                    )
                }
                Jnz => {
                    let (left, right) = loops.pop().unwrap();
                    dynasm!(ops
                        ; cmp BYTE [r15], 0
                        ; jnz => left       // jmp if *ptr != 0
                        ; => right
                    )
                }
            }
        }

正常退出函数时应该返回空指针，表示没有错误。

溢出时生成一个溢出错误，IO错误时错误指针已经存入 rax，无需处理。

最后退栈，与函数开始时的压栈对应，维持栈平衡。注意退栈时不能破坏 rax 中的返回值。

        dynasm!(ops
            ; xor rax, rax
            ; jmp >exit
            ; -> overflow:
            ; mov rax, QWORD BfVM::overflow_error as _
            ; call rax
            ; jmp >exit
            ; -> io_error:
            ; exit:
            ; pop r15
            ; pop r14
            ; pop r13
            ; pop r12
            ; pop rdx
            ; ret
        );

完成汇编，取出可执行缓冲区，返回。

        let code = ops.finalize().unwrap();

        Ok((code, start))
    }
}

Keyboard shortcuts

Brainfuck JIT 虚拟机教程

7. 生成机器码