Java程序执行过程及内存机制详解
作者:说人话
本讲将介绍Java代码是如何一步步运行起来的,其中涉及的编译器,类加载器,字节码校验器,解释器和JIT编译器在整个过程中是发挥着怎样的作用。此外还会介绍Java程序所占用的内存是被如何管理的:堆、栈和方法区都各自负责存储哪些内容。最后用一小块代码示例来帮助理解Java程序运行时内存的变化。
Java程序执行过程
- 步骤 1: 写源代码,源代码将以.java的文件格式保存在电脑硬盘中。
- 步骤 2: 编译器(compiler)检查是否存在编译期错误(例如缺少分号,关键字拼写错误等)。若通过检测,编译器就会将源代码翻译成字节码(bytecode),以.class的文件格式保存在电脑硬盘中。
- 步骤 3: 若要运行此Java程序,JVM中会有一个叫类加载器(class loader)的内置程序把字节码从硬盘载入到正位于内存中的JVM里去。
- 步骤 4: JVM中还有一个叫字节码校验器(bytecode verifier)的内置程序检测是否存在运行期错误(例如栈溢出)。若通过检测,字节码校验器就会将字节码传递给解释器(interpreter)。
- 步骤 5: 解释器会对字节码进行逐行翻译,将其翻译成当前所在系统可以理解的机器码(machine code),
- 步骤 6:将机器码交给操作系统,操作系统会以main方法作为入口开始执行程序。至此,一个Java程序就这样运行起来了。
细心的读者可能注意到了,在流程图中还涉及到一个叫JIT的东西在步骤中没有被解释。那么JIT编译器(Just-In-Time Compiler)是如果参与进程序的执行过程中呢?让我们来看以下两个例子。
- 情况 1: 解释器对代码进行逐行解释,正如我们在步骤中所介绍的。
- 情况 2: 这是JIT编译器参与进Java执行过程的情况,JIT编译器会扫描所有代码并对其进行优化。例如此时它发现最后一行代码是重复多余的,就会将其移除,只传递前4行代码给解释器。这样解释器就能运行地更快速高效,毕竟少了一行多余的代码需要翻译。
当然,这只是JIT编译器的优化手段之一,不同公司设计的JIT编译器对Java程序的运行会有不同的优化方式。此外需要知道的是,JIT编译器并不是每次都会参与到执行过程中来。
内存机制
在步骤3中我们谈到字节码会被类加载器载入到内存,那么载入之后JVM是如何对其进行内存管理的呢?
通常,在载入内存后,一个Java程序所占用的内存会被大致分为3块区域:堆(heap),栈(stack)和方法区(method area)。
堆:存放new出来的东西。
栈:存放局部变量。
方法区:类型信息,字段信息,常量池(constant pool),静态变量,方法信息等。
public final class Student extends Object implements Serializable { // 1.类信息 // 2.对象字段信息 private String name; private int score; // 3.常量池 public final int id = 0; public final String gender = "male"; // 4.静态变量 public static int a = 0; // 5.方法信息 public int getid() { return id; }}
PC寄存器:存放将要执行的指令的地址。(因为机器的脑子不灵活,所以需要一块专门的区域帮他记住执行到哪一步,不然它会忘记)
本地方法栈:与JVM栈所发挥的作用是非常相似的,其区别不过是JVM栈为Java方法服务,而本地方法栈则是为使用到的Native方法服务。有的虚拟机(例如Sun HotSpot虚拟机)甚至直接就把本地方法栈和虚拟机栈合二为一。
每个线程拥有各自独立的(虚拟机)栈、PC寄存器和本地方法栈。而堆和方法区则是所有线程共享的。
最后让我们通过一个小例子来理解Java程序执行时内存的变化。
public class Person { int id; int age; Person(int id1, int age1) { id = id1; age = age1; } public static void main(String[] args) { Person Tom = new Person(1, 25); } }
首先,在stack中申请了一块内存,这块内存区域名字叫Tom,此时区域里存储的内容为null。
接着,调用Person的构造方法,方法的参数属于局部变量,因此在stack中有两块区域分别存放id1和age1。
通过构造方法,可以new出来一个Person的对象,这个对象连带着其成员变量会被存放在heap中。成员变量id和age的值由存放在stack中的局部变量id1和age1赋予。
最后,将这个对象的引用值(类似于地址)传递给Tom,通过引用值我们就可以找到这个对象。
(注意:位于stack中的id1和age1会随着构造方法调用的结束而消失,这里为了更好地表现全过程,因此保留在图中。)
关于栈和堆的其他小知识
- 栈和堆的大小都是固定为一个默认值的,它们作为jvm的参数设定好了,不同的jvm设定的参数不同,相应的栈和堆的大小也就不同。
- 栈是运行时的单位:里面存储的信息都是跟当前线程相关的,包括局部变量、程序运行状态、方法返回值等;而堆是存储的单位:它只负责存储对象。
- 当一个方法调用结束后,方法里的局部变量会随之消失,不会在stack中继续占用空间。栈与堆的分离使得不同线程可以访问同一个对象,这是一种有效的数据交互方式(共享内存);此外也节省了空间,因为堆中的共享常量和缓存可以被所有栈访问。
参考https://simplesnippets.tech/execution-process-of-java-program-in-detail-working-of-just-it-time-compiler-jit-in-detail/https://blog.csdn.net/yfqnihao/article/details/8289363https://www.zhihu.com/question/29833675
到此这篇关于Java程序执行过程及内存机制详解的文章就介绍到这了,更多相关Java程序执行过程及内存机制内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
到此这篇关于Java程序执行过程及内存机制详解的文章就介绍到这了,更多相关Java程序执行过程及内存机制内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!