x86汇编中jmp指令底层执行解析
今天在学习汇编的时候遇到一个程序,如下:
assume cs:codesg
codesg segment
mov ax,4c00h
int 21h
start: mov ax,0
s: nop
nop
mov di,offset s
mov si,offset s2
mov ax,cs:[si]
mov cs:[di],ax
s0: jmp short s
s1: mov ax,0
int 21h
mov ax,0
s2: jmp short s1
nop
codesg ends
end start
问执行这段汇编代码后程序可以正常返回么?
乍看下,寄存器di和si中分别存储标号s和s2的偏移地址,然后把代码 jmp short s1
拷贝到标号s处,然后程序跳转到s1处执行,很明显,这样执行,是无法执行到 mov
ax,4c00h处的,也就无法正常返回,但是在debug后,发现竟然可以正常返回,执行结果见下图:
可以看到代码 jmp short s1 被编译器解析成了 jmp
0000,也就是跳转到 mov
ax,4c00h处执行,程序最终正常返回,首先来看编译之后的代码:
从上图发现 jmp short s1 被解析为 jmp
0018 ,
为什么同样一句代码有两种不同的解析结果呢?查阅书籍后,找到了前后不同解析的原因,都是因为jmp执行跳转的时候行为方式决定的。
从上面的debug程序中,可以看到 jmp short s1 解析之后的机器码为
EBF6,而它跳转至的偏移地址为
0018h,可以发现机器码中并没有包含跳转后的内存地址,jmp指令为了方便程序在内存中的浮动装配,是根据转移目的地址和转移起始地址之间的相对位移来进行转移的。即:
IP = IP + 位移长度,位移长度 = 跳转目的地址 - 短跳转指令的下一条指令地址,位移范围在 -128~127 之间。
来看 jmp short s1 的机器码:
EBF6
这里的EB是jmp编译之后得到的机器码,F6则是-10的补码,IP向前移动10个字节的长度,第二张图片红框部分即从0b3b:0022跳转到0b3b:0018的位置。在将
jmp short s1
拷贝到标号s处的时候,拷贝的是机器码,即将EBF6拷贝到了标号s处,而机器码EBF6的含义就是将IP向前移动10个字节的位置,而向前移动10个字节后这时IP又恰好指向了代码
mov ax,4c00h,所以代码就顺利退出了。
总结发现,这个程序的关键在于指令 jmp short
标号 不是根据绝对地址进行转移而是通过相对位移进行转移的,这样也使得程序在不同内存段中可以正常执行。