getfield指令表示获取指定类的实例域,并将其值压入栈顶。其格式如下:
getstatic indexbyte1 indexbyte2
无符号数indexbyte1和indexbyte2构建为(indexbyte1<<8)|indexbyte2,这个值指明了一个当前类的运行时常量池索引值,指向的运行时常量池项为一个字段的符号引用。
getfield字节码指令的生成函数为TemplateTable::getfield(),这些生成函数如下:
void TemplateTable::getfield(int byte_no) {
getfield_or_static(byte_no, false); // getfield的byte_no值为1
}
最终会调用getfield_or_static()函数生成机器指令片段。此函数生成的机器指令片段对应的汇编代码如下:
0x00007fffe10202d0: movzwl 0x1(%r13),%edx
0x00007fffe10202d5: mov -0x28(%rbp),%rcx
0x00007fffe10202d9: shl $0x2,%edx
0x00007fffe10202dc: mov 0x10(%rcx,%rdx,8),%ebx
0x00007fffe10202e0: shr $0x10,%ebx
0x00007fffe10202e3: and $0xff,%ebx
// 0xb4是getfield指令的Opcode,如果相等,则说明已经连接,直接跳转到resolved
0x00007fffe10202e9: cmp $0xb4,%ebx
0x00007fffe10202ef: je 0x00007fffe102038e
0x00007fffe10202f5: mov $0xb4,%ebx
// 省略通过调用MacroAssembler::call_VM()函数来执行
// InterpreterRuntime::resolve_get_put()函数的汇编代码
// …
调用MacroAssembler::call_VM()函数生成如下代码,通过这些代码来执行InterpreterRuntime::resolve_get_put()函数。MacroAssembler::call_VM()函数的汇编在之前已经详细介绍过,这里不再介绍,直接给出汇编代码,如下:
0x00007fffe10202fa: callq 0x00007fffe1020304
0x00007fffe10202ff: jmpq 0x00007fffe1020382
0x00007fffe1020304: mov %rbx,%rsi
0x00007fffe1020307: lea 0x8(%rsp),%rax
0x00007fffe102030c: mov %r13,-0x38(%rbp)
0x00007fffe1020310: mov %r15,%rdi
0x00007fffe1020313: mov %rbp,0x200(%r15)
0x00007fffe102031a: mov %rax,0x1f0(%r15)
0x00007fffe1020321: test $0xf,%esp
0x00007fffe1020327: je 0x00007fffe102033f
0x00007fffe102032d: sub $0x8,%rsp
0x00007fffe1020331: callq 0x00007ffff66b567c
0x00007fffe1020336: add $0x8,%rsp
0x00007fffe102033a: jmpq 0x00007fffe1020344
0x00007fffe102033f: callq 0x00007ffff66b567c
0x00007fffe1020344: movabs $0x0,%r10
0x00007fffe102034e: mov %r10,0x1f0(%r15)
0x00007fffe1020355: movabs $0x0,%r10
0x00007fffe102035f: mov %r10,0x200(%r15)
0x00007fffe1020366: cmpq $0x0,0x8(%r15)
0x00007fffe102036e: je 0x00007fffe1020379
0x00007fffe1020374: jmpq 0x00007fffe1000420
0x00007fffe1020379: mov -0x38(%rbp),%r13
0x00007fffe102037d: mov -0x30(%rbp),%r14
0x00007fffe1020381: retq
如上代码完成的事情很简单,就是调用C++函数编写的InterpreterRuntime::resolve_get_put()函数,此函数会填充常量池缓存中ConstantPoolCacheEntry信息,关于ConstantPoolCache以及ConstantPoolCacheEntry,还有ConstantPoolCacheEntry中各个字段的含义在《深入剖析Java虚拟机:源码剖析与实例详解(基础卷)》中已经详细介绍过,这里不再介绍。
0x00007fffe1020382: movzwl 0x1(%r13),%edx
0x00007fffe1020387: mov -0x28(%rbp),%rcx
0x00007fffe102038b: shl $0x2,%edx
---- resolved ----
// 获取[_indices,_f1,_f2,_flags]中的_f2,由于ConstantPoolCache占用16字节,而_indices
// 和_f2各占用8字节,所以_f2的偏移为32字节,也就是0x32
// _f2中保存的是字段在oop实例中的字节偏移,通过此偏移就可获取此字段存储在
// oop中的值
0x00007fffe102038e: mov 0x20(%rcx,%rdx,8),%rbx
// 获取[_indices,_f1,_f2,_flags]中的_flags
0x00007fffe1020393: mov 0x28(%rcx,%rdx,8),%eax
// 将栈中的objectref对象弹出到%rcx中
0x00007fffe1020397: pop %rcx
// provoke(激起; 引起; 引发) OS NULL exception if reg = NULL by
// accessing M[reg] w/o changing any (non-CC) registers
// NOTE: cmpl is plenty(足够) here to provoke a segv
0x00007fffe1020398: cmp (%rcx),%rax
// 将_flags向右移动28位,剩下TosState
0x00007fffe102039b: shr $0x1c,%eax
0x00007fffe102039e: and $0xf,%eax
// 如果不相等,说明TosState的值不为0,则跳转到notByte
0x00007fffe10203a1: jne 0x00007fffe10203ba
// btos
// btos的编号为0,代码执行到这里时,可能栈顶缓存要求是btos
// %rcx中存储的是objectref,%rbx中存储的是_f2,获取字段对应的值存储到%rax中
0x00007fffe10203a7: movsbl (%rcx,%rbx,1),%eax
0x00007fffe10203ab: push %rax
// 对字节码指令进行重写,将Bytecodes::_fast_bgetfield的Opcode存储到%ecx中
0x00007fffe10203ac: mov $0xcc,%ecx
// 将Bytecodes::_fast_bgetfield的Opcode更新到字节码指令的操作码
0x00007fffe10203b1: mov %cl,0x0(%r13)
// 跳转到---- Done ----
0x00007fffe10203b5: jmpq 0x00007fffe102050f
---- notByte ----
0x00007fffe10203ba: cmp $0x7,%eax
0x00007fffe10203bd: jne 0x00007fffe102045d // 跳转到notObj
// atos
// 调用MacroAssembler::load_heap_oop()函数生成如下代码
0x00007fffe10203c3: mov (%rcx,%rbx,1),%eax
// … 省略部分代码
// 结束MacroAssembler::load_heap_oop()函数的调用
0x00007fffe102044e: push %rax
// 重写字节码指令为Bytecodes::_fast_agetfield
0x00007fffe102044f: mov $0xcb,%ecx
0x00007fffe1020454: mov %cl,0x0(%r13)
0x00007fffe1020458: jmpq 0x00007fffe102050f
// -- notObj --
0x00007fffe102045d: cmp $0x3,%eax
0x00007fffe1020460: jne 0x00007fffe1020478 // 跳转到notInt
// itos
0x00007fffe1020466: mov (%rcx,%rbx,1),%eax
0x00007fffe1020469: push %rax
// 重写字节码指令o Bytecodes::_fast_igetfield
0x00007fffe102046a: mov $0xd0,%ecx
0x00007fffe102046f: mov %cl,0x0(%r13)
0x00007fffe1020473: jmpq 0x00007fffe102050f
// --- notInt ----
0x00007fffe1020478: cmp $0x1,%eax
0x00007fffe102047b: jne 0x00007fffe1020494 // 跳转到notChar
// ctos
0x00007fffe1020481: movzwl (%rcx,%rbx,1),%eax
0x00007fffe1020485: push %rax
// 重写字节码指令为Bytecodes::_fast_cgetfield
0x00007fffe1020486: mov $0xcd,%ecx
0x00007fffe102048b: mov %cl,0x0(%r13)
0x00007fffe102048f: jmpq 0x00007fffe102050f
// ---- notChar ----
0x00007fffe1020494: cmp $0x2,%eax
0x00007fffe1020497: jne 0x00007fffe10204b0 // 跳转到notShort
// stos
0x00007fffe102049d: movswl (%rcx,%rbx,1),%eax
0x00007fffe10204a1: push %rax
// 重写字节码指令为Bytecodes::_fast_sgetfield
0x00007fffe10204a2: mov $0xd2,%ecx
0x00007fffe10204a7: mov %cl,0x0(%r13)
0x00007fffe10204ab: jmpq 0x00007fffe102050f
// ---- notShort ----
0x00007fffe10204b0: cmp $0x4,%eax
0x00007fffe10204b3: jne 0x00007fffe10204d3 // 跳转到notLong
// ltos
0x00007fffe10204b9: mov (%rcx,%rbx,1),%rax
0x00007fffe10204bd: sub $0x10,%rsp
0x00007fffe10204c1: mov %rax,(%rsp)
// 重写字节码指令为Bytecodes::_fast_lgetfield,
0x00007fffe10204c5: mov $0xd1,%ecx
0x00007fffe10204ca: mov %cl,0x0(%r13)
0x00007fffe10204ce: jmpq 0x00007fffe102050f
// ---- notLong ----
0x00007fffe10204d3: cmp $0x5,%eax
0x00007fffe10204d6: jne 0x00007fffe10204f8 // 跳转到notFloat
// ftos
0x00007fffe10204dc: vmovss (%rcx,%rbx,1),%xmm0
0x00007fffe10204e1: sub $0x8,%rsp
0x00007fffe10204e5: vmovss %xmm0,(%rsp)
// 重写字节码指令为Bytecodes::_fast_fgetfield
0x00007fffe10204ea: mov $0xcf,%ecx
0x00007fffe10204ef: mov %cl,0x0(%r13)
0x00007fffe10204f3: jmpq 0x00007fffe102050f
// ---- notFloat ----
0x00007fffe10204f8: vmovsd (%rcx,%rbx,1),%xmm0
0x00007fffe10204fd: sub $0x10,%rsp
0x00007fffe1020501: vmovsd %xmm0,(%rsp)
0x00007fffe1020506: mov $0xce,%ecx
0x00007fffe102050b: mov %cl,0x0(%r13)
// -- Done --
我们需要介绍一下虚拟机内部的一些自定义指令,这些自定义指令的模板如下:
// JVM bytecodes
def(Bytecodes::_fast_agetfield , ubcp|____|____|____, atos, atos, fast_accessfield , atos );
def(Bytecodes::_fast_bgetfield , ubcp|____|____|____, atos, itos, fast_accessfield , itos );
def(Bytecodes::_fast_cgetfield , ubcp|____|____|____, atos, itos, fast_accessfield , itos );
def(Bytecodes::_fast_dgetfield , ubcp|____|____|____, atos, dtos, fast_accessfield , dtos );
def(Bytecodes::_fast_fgetfield , ubcp|____|____|____, atos, ftos, fast_accessfield , ftos );
def(Bytecodes::_fast_igetfield , ubcp|____|____|____, atos, itos, fast_accessfield , itos );
def(Bytecodes::_fast_lgetfield , ubcp|____|____|____, atos, ltos, fast_accessfield , ltos );
def(Bytecodes::_fast_sgetfield , ubcp|____|____|____, atos, itos, fast_accessfield , itos );
以_fast_agetfield内部定义的字节码指令为例为来,生成函数为TemplateTable::fast_accessfield()函数,汇编代码如下:
0x00007fffe101e4e1: movzwl 0x1(%r13),%ebx
0x00007fffe101e4e6: mov -0x28(%rbp),%rcx
0x00007fffe101e4ea: shl $0x2,%ebx
// 计算%rcx+%rdx*8+0x20,获取ConstantPoolCacheEntry[_indices,_f1,_f2,_flags]中的_f2
// 因为ConstantPoolCache的大小为0x16字节,%rcx+0x20定位到第一个ConstantPoolCacheEntry的开始位置
// %rdx*8算出来的是相对于第一个ConstantPoolCacheEntry的字节偏移
0x00007fffe101e4ed: mov 0x20(%rcx,%rbx,8),%rbx
// 检查空异常
0x00007fffe101e4f2: cmp (%rax),%rax
// %rax中存储的是objectref,也就是要从这个实例中获取字段的值,通过偏移%rbx后就
// 能获取到偏移的值,然后加载到%eax
0x00007fffe101e4f5: mov (%rax,%rbx,1),%eax
其它的字节码指令类似,这里不再过多介绍。从这里可以看出,我们不需要再执行getfield对应的那些汇编指令,只执行_fast开头的指令即可,这些指令比起getfield指令来说简化了很多,大大提高了解释执行的速度。
推荐阅读:
第2篇-JVM虚拟机这样来调用Java主类的main()方法
第13篇-通过InterpreterCodelet存储机器指令片段
第20篇-加载与存储指令之ldc与_fast_aldc指令(2)
如果有问题可直接评论留言或加作者微信mazhimazh
关注公众号,有HotSpot VM源码剖析系列文章!
手机扫一扫
移动阅读更方便
你可能感兴趣的文章