Language/Java

JVM

hu6r1s 2023. 12. 21. 15:45

JDK, JRE, JVM

JDK, JRE, JVM에 대한 용어를 정리하자면

JDK, JRE, JVM

  • JDK : Java Development Kit / 자바 개발 도구
  • JRE : Java Runtime Environment / 자바 실행 환경
  • JVM : Java Virtual Machine / 자바 가상 기계

Java의 호환성

Java와 C언어의 차이점은 무엇일까?

  • Java는 Write Once Use Anywhere 이라는 목적을 가지고 있다. 번역하자면, "소스파일을 하나만 작성하면 어디에서든지 사용이 가능하다!" 이다.
  • 반면에 C언어One Source Multi Object Use Anywhere 번역하자면, "하나의 소스파일로 각 기계에 맞는 목적파일로 만들어 어디든 사용 가능하다!" 이다.
  • 정리해 보자면, 하나의 목적파일로 어디든 실행이 가능하냐, 다수의 목적 파일을 만들어서 각 기계에 맞게 사용하냐의 차이라고 할 수 있다.
  • 결론, 우리는 Java를 사용하여 기계의 기종별 즉, 운영체제에 구애받지 않고 개발을 할 수 있게 되었다.
  • 여기서 Java의 목적파일은 반기계어인 바이트코드(.class)인데 이는 운영체제가 아니라 JVM에서 사용된다.
  • 소스코드를 바이트 코드로 컴파일 해주는게 자바 컴파일러(javac)이다.
  • 그럼 다음으로 Java가 어떤 과정을 통해 컴파일되어 실행되는지 보자.

Java의 실행 과정

  1. 개발자는 자바 소스파일(.java)를 작성한다.
  2. JDK가 제공하는 javac를 사용하여 소스파일을 컴파일한다.
  3. JVM의 Class Loader는 컴파일로 생성된 바이트 코드(.class)를 전달 받아 동적 로딩을 통해 실행에 필요한 클래스들을 로딩하여 JVM 내부 Runtime Data Area에 로드한다.
  4. JVM의 Execution에 의해 기계어로 해석되어 실행된다.

Class Loader

  • 프로그램 상의 작성한 모든 클래스, 변수 및 메서드의 정보를 Method Area에 배치한다.
  • JVM 내부에 바이트 코드를 로드하고 링크를 통해 배치하는 작업을 수행하는 모듈이다.
  • 실행될 때 동적으로 클래스를 로드하고 jar 파일 내부에 저장되어 있는 클래스들을 JVM에 로드한다.
  • static(정적)변수와 메서드는 Heap Area에 배치한다.

Execution(실행 엔진)

  • Interpreter는 바이트 코드를 한 줄 씩 읽고 번역해 주는데 느리다는 단점이 존재한다.
  • 그래서 이를 보완하기 위해 나온 것이 JIT 컴파일러이다.
  • JIT 컴파일러는 Interpreter 방식으로 실행을 하다가 적당한 시점에 바이트 코드 전체를 컴파일하여 캐싱한다.
  • 캐싱 즉, 컴파일된 코드를 저장해 두기 때문에 이 코드들은 Interpreter를 통해 실행되는 것이 아니라 바로 실행이 된다 그렇기 때문에 실행 속도가 매우 빨라진다.
  • Garbage Collector는 간단하게 설명하자면 유효하지 않은 즉, 사용되지 않는 메모리를 추적하여 비워주는 기능을 가지고 있다.
  • 추가로 인터프리터 언어와 컴파일 언어에 대해 한번 정리하고 가자.

Compile 언어와 Interpreter 언어

Compile 언어

  • 소스파일 전체를 컴파일 한 후 기계어를 CPU와 메모리를 통해 읽어서 바로 실행하는 방식으로 동작이 되는 언어
  • 종류 : C, C++, Java, C# ...
  • 특징
    • 소스파일의 크기가 크면 컴파일 과정이 오래 걸릴 수 있다.
    • 컴파일이 된 후에 기계어로 바로 실행되기 때문에 실행 속도가 빠르다.
    • Java는 javac에 의해 바이트코드로 컴파일되지만 JVM에서는 인터프리터로 실행된다. 그러므로 Compile 언어이지만, Interpreter 언어의 특징을 동시에 가진다.

Interpreter 언어

  • 소스파일을 컴파일하지 않고서 Interpreter를 사용하여 소스파일을 한 줄씩 번역하면서 실행하는 방식으로 동작이 되는 언어
  • 종류 : Javascript, Ruby, Python ...
  • 특징
    • 컴파일 언어처럼 별도의 목적파일이 존재하지 않는다.
    • 컴파일 과정 없이 바로 실행되기 때문에 수정 및 디버깅 시 편하다.
    • Interpreter만 존재하면 어디서든지 실행이 가능하기 때문에 자유롭고 독립적이다.
    • 실시간으로 번역되면서 실행되기 때문에 실행 속도가 느리다.

JVM

JVM은 Java 프로그램이 실행되는 가상 컴퓨터라고 생각하면 된다.

  • 위 이미지처럼 JVM은 내부적으로 복잡한 구조를 가지고 있다.
  • 이 중에서 Runtime Data Areas를 간단하게 정리해 보자.

전 처리 과정 이해하기

  • Runtime Data Areas를 학습하기 전에 전 처리 과정에 대해 학습하자.
  • 위에서 JRE는 Java의 실행 환경이라고 배웠다.
  • JRE는 프로그램을 실행하기 전에 먼저 프로그램에 메인 메서드를 포함하고 있는지 확인하고 존재한다면 JVM을 부팅시킨다.
  • 부팅이 된 JVM은 전달받은 코드를 실행시키는데 이 때 가장 먼저 하는 일이 전 처리라고 하는 과정이다.

전 처리 과정

  1. 모든 Java 프로그램은 반드시 java.lahg 패키지를 포함한다. 따라서 JRE는 해당 패키지를 Method Area에 배치한다.
  2. 프로그램이 사용하기 위해 import한 패키지들도 존재할 것이다. 마찬가지로 Method Area에 배치한다.
  3. 프로그램 상의 작성한 모든 클래스, 변수 및 메서드의 정보Method Area에 배치한다.
  4. static(정적) 변수와 메서드Heap Area에 배치한다.

Runtime Data Areas

  • 컴퓨터에서 메모리 같은 역할을 수행하는 영역이다. 자바 프로그램을 실행하여 발생하는 데이터를 저장하는 역할을 하는데, 데이터의 속성에 따라 영역이 분리되어 있다.

PC Register

  • 스레드가 시작될 때마다 생성되는 공간으로, 스레드마다 하나씩 존재한다.
  • 스레드가 어떤 명령에 의해 실행되어야 할지에 대한 기록을 하는 부분으로 현재 수행을 하고 있는 JVM의 명령 주소를 가지고 있다.

Native Method Stack

  • 자바 프로그램이 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역이다.
  • 자바 이외의 언어(C, C++, 어셈블리 등)로 작성된 코드를 실행할 때, Native Method Stack이 할당되며, 일반적인 C 스택을 사용한다.
  • Java Native Interface를 통해 바이트 코드로 전환하여 저장된다.
  • 일반 프로그램처럼 커널이 스택을잡아 독자적으로 프로그램을 실행시키는 영역이다.

Method Area(Metaspace, Static Area, Class Area)

  • 클래스 정보를 처음 메모리 공간에 올릴 때, 초기화되는 대상을 저장하기 위한 공간이다.
  • 클래스의 타입, 변수 및 메서드 등의 정보를 가지고 있으며 모든 스레드가 공유한다.
  • Runtime Constant Pool
    • 상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행한다.

Heap Area

  • 객체(인스턴스)가 생성되는 영역이다. 프로그램을 실행하는 중 생성되는 객체들은 모두 이곳에 생성된다.
  • Permanent Generation
    • 생성된 객체들의 정보의 주소값이 저장된 공간이다.
    • 클래스 로더에 의해 로드되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이며 JVM에 의해 사용된다.
    • Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다.
      • Reflection이란 객체를 통해 클래스의 정보를 분석해 내는 프로그래밍 기법
      • 구체적인 클래스 타입을 알지 못해도, 컴파일된 바이트 코드를 통해 역으로 클래스의 정보를 알아내어 사용할 수 있다.
    • Java 8 이전에는 Permanent Generation이 Heap 내부에 존재했지만 8 이후 제거되고 Method Area 즉, Metaspace라 불리우며 Heap이 아닌 Native 메모리 영역에 저장된다. 이전에 제한된 메모리 크기 때문에 발생했던 한계점을 극복하기 위해 변경되었다.
  • New/Young Generation
    • Eden : 객체들이 최초로 생성되는 공간이다.
    • Survivor 0, 1 : Eden에서 참조되는 객체들이 저장되는 공간이다.
    • 생명 주기가 짧은 객체를 Garbage Collector의 대상으로 하는 영역이다.
    • Eden 영역에 객체가 가득 차게 되면 Eden 영역에 있는 값들을 Survivor 1 영역에 복사하고 이 영역을 제외한 나머지 객체들을 삭제한다.
  • Tenured Generation
    • Old : 이 곳의 객체들은 Garbage Collector에 의해 삭제된다.
    • New/Young Generation 에서 일정시간 참조되고 있고 살아남은 객체들이 저장되는 공간이다.
    • 생성 주기가 긴 객체를 Garbage Collector 의 대상으로 하는 영역이다.

Stack Area

  • 프로그램 실행 과정에서 임시로 할당이 되었다가 메서드를 빠져 나가면 바로 소명이 되는 특성의 데이터들을 저장하기 위한 영역이다.
  • 실행되는 메서드 및 중괄호 블록(if문 등)에 대한 데이터가 저장되는 영역이다.
  • 가장 처음 실행되는 메서드(main())가 첫 번째로 메모리에 올라가고 그 다음에 실행되는 메서드들이 위에 쌓이는 구조이다.
  • 쌓이는 메서드의 단위를 스택 프레임이라고 부른다. 해당 메서드를 실행하기 위한 변수 및 블록이 존재하면 스택 프레임 내부에 스택 프레임이 생길 수 있다.
  • 가장 큰 특징은 멀티 스레드 환경에서 각 스레드가 고육의 스택 영역을 가진다는 점이다.