Android内存管理(JVM 、DVM(dalvik) 、ART简单介绍)

本文不对JVM 、DVM(dalvik) 、ART这三者做具体的分析。只是从内存管理的角度来介绍下三者的区别和联系。

Java是一种编译+解释的语言。最主要的目的是跨平台，为了实现跨平台，就决定了不能像 c，c++ 那样直接把源代码编译成可执行文件，因为不同cpu，不同操作系统的指令封装格式是不一样的。java编译成的字节码文件与硬件和操作系统无关，这是跨平台基础，然后具体执行，再用各自平台解释器，解释成本地机器码。

JVM

JVM本质上就是一个软件，是计算机硬件的一层软件抽象，在这之上才能够运行Java程序，JAVA在编译后会生成类似于汇编语言的.class字节码文件，与C语言编译后产生的汇编语言不同的是，C编译成的汇编语言会直接在硬件上跑，但JAVA编译后生成的.class字节码是在JVM上跑，需要由JVM把字节码翻译成机器指令，才能使JAVA程序跑起来。

JVM运行在操作系统上，屏蔽了底层实现的差异，从而有了JAVA吹嘘的平台独立性和Write Once Run Anywhere。根据JVM规范实现的具体虚拟机有几十种，主流的JVM包括Hotspot、Jikes RVM等，都是用C/C++和汇编编写的，每个JRE编译的时候针对每个平台编译，因此下载JRE（JVM、Java核心类库和支持文件）的时候是分平台的，JVM的作用是把平台无关的.class里面的字节码翻译成平台相关的机器码，来实现跨平台。

Java程序执行流程:

从上图可以看到Java虚拟机与java语言没有什么必然联系，它只与特定的二进制文件：Class文件有关。

数据类型

Java虚拟机与Java语言的数据类型相似，可以分为两类：基本类型和引用类型。Java虚拟机希望编译器在编译期间尽可能的完成类型检查，使得虚拟机在运行期间无需进行类型检查操作。

运行时数据区域

Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为不同的数据区域，数据区域分别为

程序计数器
Java虚拟机栈
本地方法栈
Java堆
方法区

1. 程序计数器

程序计数器（Program Counter Register），可以看做当前线程所执行的字节码的行号指示器（其实就是记录代码执行到了哪里）。

特点如下：

线程私有；
占用内存空间较小；
若线程执行的是 Java 方法，记录的是虚拟机字节码指令地址；若执行的是本地（Native）方法，则为空（Undefined）；
该区域是唯一一个在《Java 虚拟机规范》中规定无任何 OutOfMemoryError 的区域。

主要作用：记录线程执行到了哪里。

2. Java 虚拟机栈

Java 虚拟机栈（Java Virtual Machine Stacks）：Java 方法执行的线程内存模型。

每个方法被执行时，虚拟机栈都会创建一个栈帧（Stack Frame）用于存储局部变量表、操作数栈、动态连接、方法出口等信息。每个方法从被调用直至执行完毕的过程，就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。其中局部变量表包括：

Java 虚拟机基本数据类型（8 种）
对象引用（reference 类型，可能是一个指向对象起始地址的指针）
returnAddress

这些数据类型在局部变量表中的存储空间以局部变量槽（Slot）表示，其中 long 和 double 占用两个槽，其他类型占用一个槽。局部变量表所需内存空间在编译期完成分配，当进入一个方法时，该方法需要在栈帧中分配多大的局部变量空间是完全确定的，运行期间不会改变其大小。

虚拟机栈的特点：

线程私有；
生命周期与线程相同；
两类异常
- 线程请求的栈深度大于虚拟机所允许的深度时抛出 StackOverflowError 异常；
- 栈扩展时无法申请到足够的内存时抛出 OutOfMemoryError 异常。

主要目的：Java 方法执行的线程内存模型。

3. 本地方法栈

本地方法栈（Native Method Stacks）与 Java 虚拟机栈作用类似。二者区别：

Java 虚拟机栈为 JVM 执行 Java 方法（字节码）服务；
本地方法栈为 JVM 使用到的本地（Native）方法服务。

异常与 Java 虚拟机栈相同。

主要目的：Native 方法执行的线程内存模型。

4. Java 堆 对多数应用来说，Java 堆（Java Heap）是 JVM 管理的内存中最大的一块。

唯一目的：存放对象实例（【几乎所有】的对象实例都在这里分配内存）。

《Java 虚拟机规范》描述：所有对象实例及数组都应在堆上分配。

而从实现角度看，由于即使编译技术（尤其是逃逸分析技术的日渐强大），"栈上分配"等手段使得对象并非完全在堆上分配。

特点：

线程共享
虚拟机启动时创建

PS: "新生代"、"老年代"、"Eden 区"等一系列对堆的区域划分，只是部分垃圾收集器的一些共性或设计风格，而非虚拟机的固有内存布局，更非《Java 虚拟机规范》的划分。

将 Java 堆细分的目的只是为了更好地回收内存，或者更快地分配内存。

5. 方法区

方法区（Method Area）：用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据，该区域也是线程共享的。又称"非堆"。

与方法区联系密切的一个概念是"永久代"，下面简要介绍。

永久代

"永久代（Permanent Generation）"，可以理解为 JDK 1.8 之前 HotSpot 虚拟机对《Java 虚拟机规范》中"方法区"的实现。从 JDK 1.6、1.7 到 1.8+，HotSpot 虚拟机的运行时数据区变迁示意图如下：

HotSpot VM JDK 1.6 的运行时数据区示意图如下：

JDK 1.7 中，将 1.6 中永久代的字符串常量池和静态变量等移到了堆中，如下（虚线框表示已移除）：

而到了 JDK 1.8，则完全废弃了"永久代"，改用了在本地内存中实现的"元空间（Metaspace）"，将 JDK 1.7 中永久代剩余的部分（主要是类型信息）移到了元空间，如下（虚线框表示已移除）：

从上面几张图可以看出永久代和元空间的主要区别有以下两点：

1. 存储位置不同
  - 永久代是 JVM 内存的一部分，元空间在本地内存中（JVM 内存之外）；
  - 永久代使用不当可能导致 OOM，元空间一般不会。
1. 存储内容不同：元空间存储的是「类型信息」（即类的元信息），而永久代除了类型信息，还包括「字符串常量池」和「静态变量」等（可以理解为元空间是永久代拆分出来的一部分）。

那么问题来了：为什么要把永久代替换为元空间呢？

原因大概有以下几点：

Oracle 收购了两种 JVM：HotSpot VM 和 JRockit VM，并且想要将它们整合，但二者方法区实现差异较大；
字符串存在永久代中，容易出现性能问题和 OOM；
类及方法的信息大小较难确定，永久代大小难以确定：太小易导致永久代溢出，太大则易导致老年代溢出（JVM 内存是有限的，此消彼长）；
永久代会为垃圾回收带来不必要的复杂度，且回收效率较低（"性价比"低）。

以下6 7 不再jvm内存运行模型中，但对内存管理过程中需要注意，因为他们经常导致oom。

6. 运行时常量池 运行时常量池（Runtime Constant Pool）是方法区的一部分。

Class 文件中除了有类的版本、字段、方法、接口等描述外信息，还有一项信息是常量池表（Constant Pool Table），用于存放编译期生成的各种字面量和符号引用，这部分内容将在类加载后进入方法区的运行时常量池中存放。

相比于 Class 文件常量池的一个重要特性是「动态性」，运行期间也可以将新的常量放入池中（例如 String 类的 intern() 方法）。

可能产生的异常：OutOfMemoryError。

7. 直接内存 直接内存（Direct Memory）并非虚拟机运行时数据区的一部分，也非《Java 虚拟机规范》定义的内存区域。但该部分内存被频繁使用（例如 NIO），而且可能导致 OutOfMemoryError。

NIO（New input/output）是JDK1.4中新加入的类，引入了一种基于通道（channel）和缓冲区（buffer）的I/O方式，它可以使用Native函数库直接分配堆外内存，然后通过堆上的DirectByteBuffer对象对这块内存进行引用和操作。

可以看出，直接内存的大小并不受到java堆大小的限制，甚至不受到JVM进程内存大小的限制。它只受限于本机总内存（RAM及SWAP区或者分页文件）大小以及处理器寻址空间的限制（最常见的就是32位/64位CPU的最大寻址空间限制不同）。

直接内存出现OutOfMemoryError的原因是对该区域进行内存分配时，其内存与其他内存加起来超过最大物理内存限制（包括物理的和操作系统级的限制），从而导致OutOfMemoryError。另外，若我们通过参数“-XX:MaxDirectMemorySize”指定了直接内存的最大值，其超过指定的最大值时，也会抛出内存溢出异常。

GC

GC主要做了两个工作，一个是内存的划分和分配，一个是对垃圾进行回收。

垃圾标记算法

关于对垃圾进行回收，被引用的对象是存活的对象，而不被引用的对象是死亡的对象也就是垃圾，GC要区分出存活的对象和死亡的对象，也就是垃圾标记，并对垃圾进行回收。目前有两种垃圾标记算法，分别是引用计数算法和根搜索算法，这两个算法都和引用有些关联。

引用：在JDK1.2之后，Java将引用分为强引用、软引用、弱引用和虚引用。

强引用：当我们new一个对象时就是创建了一个具有强引用的对象，如果一个对象具有强引用，垃圾收集器就绝不会回收它。Java虚拟机宁愿抛出OutOfMemoryError异常，使程序异常终止，也不会回收具有强引用的对象来解决内存不足的问题。

软引用：如果一个对象只具有软引用，当内存不够时，会回收这些对象的内存，回收后如果还是没有足够的内存，就会抛出OutOfMemoryError异常。Java提供了SoftReference类来实现软引用。

弱引用：弱引用比起软引用具有更短的生命周期，垃圾收集器一旦发现了只具有弱引用的对象，不管当前内存是否足够，都会回收它的内存。Java提供了WeakReference类来实现弱引用。

虚引用：虚引用并不会决定对象的生命周期，如果一个对象仅持有虚引用，这就和没有任何引用一样，在任何时候都可能被垃圾收集器回收。一个只具有虚引用的对象，被垃圾收集器回收时会收到一个系统通知，这也是虚引用的主要作用。Java提供了PhantomReference类来实现虚引用。

以上，了解jvm还需要大家了解以下算法：

1. 引用计数算法
1. 根搜索算法
1. 标记-清除算法
1. 复制算法
1. 标记-压缩算法
1. 分代收集算法

如果想象深入了解jvm内存管理建议还是Google下以上算法内容

关于Dalvik和ART虚拟机本片文章只做对jvm的简单对比。具体详细内容请产考老罗具体对其分析：推荐：https://www.kancloud.cn/alex_wsc/androids/401771

Dalvik

Dalvik是Google专门为Android操作系统开发的虚拟机。它支持.dex（即“Dalvik Executable”）格式的Java应用程序的运行。.dex格式是专为Dalvik设计的一种压缩格式，适合内存和处理器速度有限的系统。Dalvik由Dan Bornstein编写，名字来源于他的祖先曾经居住过的小渔村达尔维克（Dalvík），位于冰岛。

Dalvik虚拟机,简称DVM。DVM是Google专门为Android平台开发的虚拟机，它运行在Android运行时库中。需要注意的是DVM并不是一个Java虚拟机。

DVM和JVM的区别 DVM之所以不是一个JVM ，主要原因是DVM并没有遵循JVM规范来实现。DVM与JVM主要有以下区别。

基于的架构不同：JAVA虚拟机基于 栈结构，程序在运行时虚拟机需要频繁的从栈上读取写入数据，这个过程需要更多的指令分派与内存访问次数，会耗费很多CPU时间。Dalvik虚拟机基于 寄存器架构，数据的访问通过寄存器间直接传递，这样的访问方式比基于栈方式要快很多。
- 基于栈的架构具有更好的可移植性，因为其实现不依赖于物理寄存器
- 基于栈的架构通常指令更短，因为其操作不需要指定操作数和结果的地址
- 基于寄存器的架构通常运行速度更快，因为有寄存器的支撑
- 基于寄存器的架构通常需要较少的指令来完成同样的运算，因为不需要进行压栈和出栈

执行的字节码不同：Java运行的是Java字节码,DVM运行的是Dalvik字节码。Java类会被编译成一个或多个.class文件，打包成jar文件,而后JVM会通过相应的.class文件和jar文件获取相应的字节码。而DVM会用dx工具将所有的.class文件转换为一个.dex文件，然后DVM会从该.dex文件读取指令和数据。当JVM加载该.jar文件的时候，会加载里面的所有的.class文件，JVM的这种加载方式很慢，对于内存有限的移动设备并不合适。而在.apk文件中只包含了一个.dex文件，这个.dex文件里面将所有的.class里面所包含的信息全部整合在一起了，这样再加载就提高了速度。.class文件存在很多的冗余信息，dex工具会去除冗余信息，并把所有的.class文件整合到.dex文件中，减少了I/O操作，提高了类的查找速度。

class文件格式：

Dalvik可执行文件体积更小(原因同第二点)

DVM允许在有限的内存中同时运行多个进程：DVM经过优化，允许在有限的内存中同时运行多个进程。在Android中的每一个应用都运行在一个DVM实例中，每一个DVM实例都运行在一个独立的进程空间。独立的进程可以防止在虚拟机崩溃的时候所有程序都被关闭。

ART虚拟机

ART(Android Runtime)是Android 4.4发布的，用来替换Dalvik虚拟，Android 4.4默认采用的还是DVM，系统会提供一个选项来开启ART。在Android 5.0时，默认采用ART，DVM从此退出历史舞台。

DVM中的应用每次运行时，字节码都需要通过即时编译器（JIT，just in time）转换为机器码，这会使得应用的运行效率降低。而在ART中，系统在安装应用时会进行一次预编译（AOT，ahead of time）,将字节码预先编译成机器码并存储在本地，这样应用每次运行时就不需要执行编译了，运行效率也大大提升。

在不同平台DEX转化为ODEX的过程,如下图所示:

从安装过程上来看 Java的代码实际上需要两次“转换”才可以在android设备上运行

一.PC端：.class->.dex->.apk
二.phone:dex->odex

区别在于第二步。

ART : .dex->.odex(机器码)（AOT　　Ahead-Of-Time） Dalvik: .dex->.odex(字节码)（JIT　Just-In-Time）

机器码可直接执行，而字节码每次启动都需要执行将优化过的odex字节码再转换成机器码

ART优点：

应用运行更快，因为 DEX 字节码的翻译在应用安装是就已经完成。

减少应用的启动时间，因为直接执行的是 native 代码。

提高设备的续航能力，因为节约了用于一行一行解释字节码所需要的电池。

支持更低的硬件

ART缺点：

由于在安装时时生成的 native 机器码是存储在内部存储器上，所以需要更多的内部存储空间。(大概多个10%~20%)

应用安装需要更长的时间，因为 DEX 字节码需要在安装时就翻译成机器码。

本篇文章内容较长，主要时便于后期对android内存管理及优化打好基础，感兴趣的童鞋可以收藏慢慢看。

Android内存管理(JVM 、DVM(dalvik) 、ART联系与区别)