尚硅谷阳哥JVM笔记

V2AS问路

尚硅谷阳哥JVM笔记

阅读原文时间：2023年07月08日阅读：2

类加载器(快递员)：
- 只负责加载java文件，编译后的class文件在文件开头有特定的文件表示，将class文件字节码内容从硬盘加载到JVM内存中并将这些内容转换成方法区的运行时数据结构，至于是否可以正常运行由Execution Engine决定。加载class后为模板Class，该模板存放类的结构信息，一个模板可以实例化多个实例
3个classLoader：启动加载器Bootstrap(C++)，扩展加载器Extension(Java)，应用程序类加载器AppClassLoader, 分别是祖父孙, 他们都是抽象类，需要被继承。还有用户自定义加载器Java.lang.ClassLoader的子类，用户可以定制类的加载方式, 通过继承ClassLoader类
- new Object().getClass().getClassLoader()为Bootstrap，是Java祖宗级，在java里输出为null
- new MyObject().getClass().getClassLoader()，即自己new的类，它的加载器是AppClassLoader , 父加载器为Extension
- classLoader双亲委派机制：当收到某个java文件的类加载请求，即所有请求都会传送到启动加载类，首先从根加载器(Bootstrap)开始向下寻找，找不到抛ClassNotFound异常，保证了沙箱安全
- 沙箱安全机制：由双亲委派机制实现，只加载从Bootstrap向下找到的第一个文件，保证Java的源码不被污染，
- 程序编译时，加载顺序：静态代码块（只加载一次）>构造块>构造方法
本地方法接口：
- Thread线程类中由native修饰的方法，代表这个方法调用的是底层操作系统和第三方C语言函数库方法, 该方法存放在本地方法栈，其他普通方法存放在java栈。new Thread().start() 只是新建完成到就绪状态，是否被运行决定于底层操作系统和CPU的调度
方法区：java8开始叫元空间
- 所有线程共享，存在GC，只是量很少，大部分GC在堆里
- 供各线程共享的运行时内存区域，用于存放每一个类的结构信息，例如运行时常量池、字段和方法数据、构造方法和普通方法的字节码内容、模板Class、static变量。方法区是规范，不同虚拟机实现不同，例如永久代PermGen space 和元空间 Metaspace
- java7之前：方法区 f = new 永久代 java8之后：方法区 f = new 元空间
类的实例方法和实例对象存在堆内存中，和方法区无关
PC寄存器（程序计数器）
- 也叫程序计数器，就是一个指针，存放下一条指令的地址，指向下一条要执行的命令，记录了方法之间的调用和执行情况
- 每个线程都有一个程序计数器，和栈一样都是线程私有的，内存很小几乎不存在GC，不会发生内存溢出
如果执行的是Native方法，那这个计数器为空
栈stack（Java栈）：
- 栈管运行，堆管存储。在Java中，程序 = 框架 + 业务逻辑
- 线程私有，不存在GC问题，8中基本类型变量+对象的引用变量+实例方法都是在函数的栈内存中分配
- Java方法被压到栈中，叫做栈帧， main方法最先被压栈，栈帧是内存区，是有关方法和运行期数据的数据集
- 栈帧中主要保存三类数据：（栈中的数据都是以栈帧的格式存在，在JVM栈里方法叫栈帧，在JVM外叫方法）
  - 本地变量：输入参数和输出参数以及方法内的变量
  - 栈操作：记录出栈、入栈的操作
  - 栈帧数据：包括类文件、方法等
- 栈运行原理：
- 栈溢出错误SOF：StackOverflowError
- A a = new A(); 等号左边是引用，在栈里，等号右边是实例对象，在堆里；
- 栈、堆和方法区的交互关系：
  - HotSpot(JVM名)使用指针的方式来访问对象，Java堆会存放访问类元数据（Class模板）的地址，reference存储对象的地址
堆（heap）(Java7之前)：逻辑上分为以下三部分：
- 1.新生代(PSYoungGen)：
  - 1.伊甸区(Eden Space): new对象存在该区，GC(也叫 YGC 或轻GC 或 MinorGC)在该区产生；在内存超过阈值时开启GC之后，除了正被引用的对象和静态变量被移动到S0区，未存活的对象被 JVM清除
    - 普通MinorGC：复制(GC复制算法复制到To区) → 清空(Eden和from全部清空) → 互换(S0和S1互换，谁空谁是to区)
      - 复制：第一次GC将Eden区存活的对象复制到S0区后清空Eden区，再次GC后会扫描Eden和S0区进行GC，回收存活的对象并复制到to区(如果有对象的年龄到达老年区的标准则复制到老年区)，同时把这些对象年龄+1，以后每次都需要扫描Eden区和S0和S1区，进行MinorGC过程
      - 清空：清空Eden和from区的对象，也即复制之后有交换，谁空谁是to区
      - 交换：To区和From区互换，部分MinorGC存活到15时(由MaxTenuringThreshold决定默认15)后, 存入老年代
  - 2.幸存者0区(Survivor 0 Space, 也叫S0 或 from区)：每次GC也会进行复制清空互换的过程
  - 3.幸存者1区(Survivor 1 Space，也叫S1 或 to区)：与S0区机制相同
- 2.老年代(养老区ParOldGen)：当对象超过内存阈值后，开启Full GC(也叫FGC或重GC或全局GCMajorGC)，多次FGC后无法再腾出空间，将抛出OOM(OutOfMemoryError)堆内存溢出错误，Major GC比 Minor GC慢上十倍左右，每次Major GC经常(不是绝对)伴随一次Minor GC
- 3.元空间Metaspace(Java7叫永久代或持久代)：
  - 用于存放JDK自身携带的Class，Interface的元数据(结构信息)，也就是运行环境必须的类信息。被装载进此区域的数据不会被GC，关闭JVM才会释放此区域所占用的内存
  - 对应方法区，虽然逻辑上JVM规范将方法区描述为堆的一个逻辑部分，但物理上不包含在堆里。元空间是方法区的一个实现，即方法区是接口，元空间是实现。
  - 永久代和元空间最大区别：永久代使用JVM的堆内存，而Java8之后的元空间存在于本机物理内存，字符串常量池也在元空间

元空间存在于本机物理内存，只受本地内存限制，字符串常量池也在元空间，减少了OOM，默认最大JVM Heap堆内存-Xmx只用物理内存的1/4，最小堆内存-Xms为物理内存的1/64
Runtime.getRuntime().totalMemory; // 获取最大堆内存, Runtime.getRuntime()为Runtime Data Area对象
JVM调参：

GC算法（分代收集算法）：只需知道是什么？怎么用？各自的优缺点

1.引用计数法(了解即可)：每次GC一个对象被引用就+1，没被引用-1，当为0时就清除。System.gc 不会立刻开启GC
2.复制算法（Copying）：年轻代中使用的Minor GC采用的主要是复制算法
- 是什么：Minor GC的复制过程用到的算法，复制时内存分为两块，一块移动到to区，另一块被清除
- 优缺点：优点是效率高，不会产生内存碎片，缺点是耗费空间
3.标记清除：老年代一般是由标记清除或者标记清除与标记整理的混合实现
- 是什么：先扫描并标记要回收的对象，接着再扫描一次，然后统一回收这些标记的对象
- 优缺点：优点是不需要额外空间，缺点是两次扫描耗时严重，会产生内存碎片
4.标记压缩（标记整理）：
- 是什么：相当于标记清除，加上移动对象使内存碎片清除
  - 优缺点：优点：标记清除的优点+无内存碎片缺点：耗时最长
标记清除压缩：标记清除和标记压缩的结合，不同的是：进行多次GC后才压缩，不算入四大算法
没有最好的算法，只有根据每一代GC的特性来采用对应的算法，因此叫分代收集算法

JMM（Java内存模型）：可见性、原子性、有序性

JVM是一种抽象概念，描述一组规则或规范，通过这组规范定义了程序中各个变量（包括实例字段、静态字段和守城数组对象的元素）的访问方式

volatile是jVM提供的轻量级同步机制
1.可见性：就是个通知机制，一个线程对共享变量的修改，能及时的被其他线程看到
2.原子性：操作不可拆分，要么全成功，要么就不做
3.有序性：如果在本线程内观察，所有操作都是有序的
JVM运行程序的实体是线程，而每个线程创建时JVM都会为其创建一个工作内存(也叫栈空间)，工作内存是每个线程的私有数据区域
JMM规定所有变量都存储在主内存，主内存是共享内存区域，所有线程都可以访问，但线程对变量的操作必须在工作内存中进行，首先要将变量从主内存拷贝到自己的工作内存空间，再对变量进行操作，完成后再将变量写回主内存。不能直接操作主内存中的变量，各个线程中的工作内存中存储着主内存中的变量副本拷贝，因此不同线程间无法访问对方的工作内存，线程间的通信(传值)必须通过主内存来完成

一般面试提问：面向对象和高级语法、Java集合类、Java多线程、JUC 和高并发、Java IO和 NIO
获取多线程的4种方法：

1.继承Thread类，重写run方法（其实Thread类本身也实现了Runnable接口）

2.实现Runnable接口，重写run方法

3.实现Callable接口，重写call方法（有返回值）

4.使用线程池（有返回值）：通过Executors提供四种线程池
进程：
- 笔试：具有一定独立功能的程序关于某个数据集合的一次运行活动，是操作系统动态执行的基本单位。
- 面试：后台运行的一个程序，进程跟操作系统有关，跟编程语言无关，
线程：
- 笔试：一般一个进程包含多个线程，线程可以利用进程所拥有的资源，在引入线程的操作系统中，把线程作为独立运行和独立调度的基本单位
- 面试：线程是进程的组成部分，一般一个进程包含多个线程，它代表了一条顺序的执行流。
并发：在同一实体上的两个或多个使事件在同一时间段内发生
并行：在不同实体上的两个或多个事件在同一时刻发生
高内聚：类与类、对象与对象、模块与模块之间高度地聚集和关联
低耦合：AB两个对象可以进行数据共享，但是AB两个对象又各自独立
在高内聚低耦合的前提下，线程（thread.start()）操作（对外暴露的调用方法）资源类（操作的对象）：
Thread.currentThread().getName() 获取当前线程名
Thread(Runnable target, String name) // target：Runnable接口的run() 方法的实现， name：线程名