인생을 코딩하다.

[Java] JVM(Java Virtual Machine)란? 본문

Java

[Java] JVM(Java Virtual Machine)란?

Hyung1 2021. 1. 15. 08:55
728x90
반응형

JVM 역할이 뭘까??

  • 자바 애플리케이션 클래스 로더를 통해 읽어 들여 자바 API와 함께 실행
  • JAVA와 OS사이에서 중개자 역할을 수행하여 JAVA가 OS에 구애받지 않고 재사용을 가능하게 해줌
  • 메모리관리, Garbage collection을 수행한다.
  • 스택 기반으로 동작한다.

즉, 운영체제 위에서 동작하는 프로세스로 자바 코드를 컴파일해서 바이트 코드를 해당 운영체제가 이해할 수 있는 기계어로 바꿔 실행시켜주는 역할을 한다.      // 바이트코드) 자바 가상머신이 이해할 수 있는 언어로 변환된 자바 소스 코드

왜 JVM을 알아야 하는가?

메모리 효율성을 위해 메모리 구조를 알아야 하기 때문이다. 동일한 기능의 프로그램이더라고 메모리 관리에 따라 성능이 좌우된다. 우리는 한정된 메모리를 효율적으로 사용하여 최고의 성능을 내야한다.

JVM의 실행 과정을 알기전에 JDK, JRE에 관해 알아보자.

JDK 

  • 자바 개발도구 Java evelopment Kit의 약자이다.
  • JDK는 JRE에서 개발을 위해 필요한 도구(javac, java, visualVM 등)을 포함한다.

JRE  

  • 자바 실행환경(Java Runtime Environment)의 약자이다.
  • JRE는 JVM이 자바 프로그램을 동작시킬 때 필요한 라이브러리 파일들과 기타 파일들을 가지고 있다. JRE는 JVM의 실행환경을 구현했다고 할 수 있다.

JAVA 프로그램 실행 과정 및 JVM 구성

  1. 프로그램이 실행되면 JVM은 OS로부터 프로그램이 필요로 하는 메로리를 할당받고, JVM은 이 메모리를 용도에 따라 여러 영역으로 나누어 관리
  2. 자바 컴파일러(javac)가 자바 소스코드(.java)를 읽어들여 자바 바이트코드(.class)로 변환
  3. Class Loader을 통해 class파일들을 JVM으로 로딩.
  4. 로딩된 class파일들은 Exceuction engine를 통해 해석
  5. 해석된 바이트코드는 Runtime Data Areas에 배치되어 실질적인 수행이 이루어짐.
  6. 이러한 실행과정 속에서 JVM은 필요에 따라 Thread Synchronization, GC 같은 관리 작업을 수행.

Class Loader

자바는 컴파일 시점이 아닌 런타임 시점에 클래스를 처음으로 참조하며 해당 클래스를 로드하고 링크하는 동적 로드의 특성을 갖고 있다. Class Loader은 동적로드를 담당하는 부분이다.

 

Excution Engine

클래스를 실행시킨다. Class Loader가 런타임 데이터 영역에 바이트코드를 배치시키고, 기계어로 변경해 명령어 단위로 실행하는 역할을 한다. 명령어를 하나 하나 실행하는 (1)인터프리터(Interpreter) 방식이 있고 (2)JIT(Just-in-Time)컴파일러를 이용하는 방식이 있다.

 

(1)Interpreter

프로그램을 실행할 때 마다, 컴퓨터가 알아 들을 수 있는 언어로 변환을 하는 작업을 수행한다. 실행 엔진은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다. 하지만 이 방식은 인터프리터 언어의 단점을 그대로 갖고 있다. 한 줄 씩 수행하기 때문에 느리다. 간편하기는 하지만, 성능이 매우 느릴 수 밖에 없다.

정적(static) 컴파일 방식

정적(static) 컴파일 방식 역사적으로 Interperter 방식 말고 정적(static) 컴파일 방식도 있었다. 
정적 컴파일 방식은 실행하기 전에 컴퓨터가 알아들을 수 있는 언어로 변환하는 작업을 미리 실행한다.
따라서, 변환 작업은 딱 한번만 수행한다. 

 

(2)JIT(Just-in-Time)

JIT는 위 두가지 방식을 혼합한 것이라고 보면 된다. 작업은 인터프리터에 의해서 지속적으로 수행되지만, 필요한 코드의 정보는 캐시에 담아두었다가 재사용하게 된다. 인터프리티 방식으로 수행하다가 적절한 시점에 바이트 코드 전체를 컴파일하여 네이티브 코드로 변경한다. 이후에는 인터프리티는 수행되지 않는다. 네이티브 코드는 캐시에 보관하기 때문에 한 번 컴파일 된 코드는 빠르게 수행된다. 한 번만 실행되는 코드 같은 경우엔 전체를 컴파일 하는 JIT 보다는 Interpreter로 컴파일하는게 더 빠르다. JVM이 내부적으로 해당 메서드가 얼마나 자주 수행되는지를 판단하여 일정 정도가 넘을 때만 JIT로 컴파일 한다. 

 

 

Garbage collector

GC를 수행하는 모듈(쓰레드)이 있다. 

GC에 관하여 알아보기


Rumtime Data Area

프로그램을 수행하기 위해 OS에서 할당받은 공간

1) PC Register

  • Thread가 시작될 때 생성되는 공간으로 스레드마다 하나씩 존재
  • Thread가 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분으로 현재 수행중인 JVM 명령의 주소를 갖고있다.

2) JVM 스택 영역

  • 메소드가 시작할 때 { 에서 임시로 할당 되었다가 }를 만나면 소멸되는 데이터를 위한 영역
  • 변수나 임시 데이터, 스레드나 메소드의 정보를 저장
  • 메소드 호출 시 각각의 스택의 프레임에 공간이 할당되고, 수행이 끝나면 프레임별로 삭제 -> 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시 저장.

3) Native Method Stack

  • 바이트 코드(.class)가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 역역
  • 자바가 아닌 다른 언어로 작성된 코드를 위한 공간 ( C언어나 자바나 기계어로 번역하면 똑같기 때문에 다른 언어로도 접근 가능)
  • Native Method Interface를 통해 바이트 코드로 전환하여 저장

4) method Area (Static area)

  • 클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간. 모든 클래스 정보 등등 거의 모든 바이트 코드가 이곳에 올라가기 때문에 프로그램의 흐름을 구성하는 공간이다. 대부분의 인스턴스 생성도 이곳에서 명령하고 호출한다.
  • Runtime Constant Pool이라는 별도의 관리 영역을 통해 상수 자료형을 저장하여 참조하고 중복을 막는다.
  • Method Area도 Heap Area와 마찬가지로 GC의 관리 대상에 포함된다.

5) Heap Area

 

Permanent Generation

  • 생성된 객체들의 주소 값이 저장된 공간. Class Loader에 의해 Load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용, Reflaction을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다. 자바 8부터는 Mata space라는 영역으로 대체되었다.

Meta Space

  • 기존 Permanent Generation JVM에 의해 크기가 강제되었었다. MetaSpace는 Native 메모리 영역으로 OS가 자동으로 크기를 조절한다. 그 결과 기존과 비교해 큰 메모리를 사용할 수 있게 되었다. Permanent 영역 크기로 인한 java.lang.OutOfMemoryError를 더 보기 힘들어졌다.

New/Young Generation

  • Eden: 객체들이 최초로 생성되는 공간
  • Survivor 0/1: Eden에서 참조되는 객체들이 저장되는 공간
  • Eden 영역이 가득차면 첫 번째 GC가 발생하게 된다. Eden영역에 있는 값들을 survivor 영역 중 한 곳에 복사하고 나머지 영역에 있는 객체들을 삭제한다. -> Minor GC

Tenured Generation

  • New/Young Generation에서 일정 시간 이상 참조되고 있는 객체들이 저장되는 공간, survivor 영역에 계속해서 살아남는 객체들을 이곳으로 옮긴다. 모든 객체들을 검사하여 참조되지 않은 객체를 전부 삭제한다. 시간이 오래걸리고 GC를 실행하는 스레드를 제외하고는 전부 작업을 멈추고 GC가 완료되면 다시 실행된다. stop-the-world 라고도 한다. -> Major GC

인스턴스는 지역 변수처럼 소멸되는 시점을 예상할 수 없기에 Heap 영역에 저장된다. JVM은 인스턴스의 존재 이유가 더 이상 없을 때 합리적으로 소멸시킨다.
참조되고 있지 않은 객체를 Garbage라고 한다.

참고자료 : 

 

 

 

 

728x90
반응형
Comments