Skip to main content

김주엽

1. 📌 핵심 개념 정리

✅ 요약하기

객체는 처리의 추상화다. 스레드는 일정의 추상화다.

  • 제임스 O. 코플리엔
  1. 동시성이 필요한 이유?
    • 동시성은 결합(Coupling) 을 없애는 전략으로 무엇(what)언제(when) 를 분리하는 전략이다.
    • 스레드가 하나인 프로그램은 디버깅에서 중단점을 찍었을 때 어디서 언제 멈추는 지 확인이 가능하다.
    • 무엇과 언제를 분리하면 애플리케이션 구조와 효율이 극적으로 좋아진다.
    • 서블릿에서는 웹 요청이 들어올 때마다 웹 서버는 비동기식으로 서블릿을 실행한다.
      • 따라서 프로그래머는 들어오는 모든 웹 요청을 관리할 필요가 없다.
      • 원칙적으로 각 서블릿 스레드는 다른 서블릿 스레드와 무관하게 자신만의 공간에서 동작한다.

  1. 미신과 오해
    • 동시성은 다루기 어렵기에 주의하지 않으면 난감한 상황에 처한다.
    • 동시성에 관한 미신과 오해
      1. 동시성은 항상 성능을 높여준다.
        • 동시성은 때로 성능을 높여주지만 매번 그런 것은 아니다.
        • 대기 시간이 매우 길어 여러 스레드가 프로세서를 공유할 수 있거나 동시에 처리할 계산이 충분히 많은 경우에만 높은 성능을 보여준다.
      2. 동시성을 구현해도 설계는 변하지 않는다.
        • 단일 스레드와 멀티 스레드 시스템은 설계가 다르다.
        • 일반적으로 무엇과 언제를 분리하면 시스템 구조가 매우 달라진다.
      3. 웹 또는 EJB 컨테이너를 사용하면 동시성을 이해할 필요가 없다.
        • 실제로는 컨테이너가 어떻게 동작하는지 어떻게 동시 수정, 데드락 문제를 해결하는지 알아야만 한다.
    • 동시성과 관련된 타당한 생각
      1. 동시성은 다소 부하를 유발한다.
        • 성능 측면에서 부하가 있으며 추가 코드를 작성해야 한다.
      2. 동시성은 복잡하다.
        • 간단한 문제도 동시성에서는 복잡하다.
      3. 일반적으로 동시성 버그는 재현하기 어렵다.
        • 결함을 간혹 발생하는 일회성 문제로 여겨 무시하기 쉽다.
      4. 동시성을 구현하려면 흔히 근본적인 설계 전략을 재고해야 한다.

  1. 난관
    • 동시성을 구현하기가 어려운 이유는 잘못된 결과를 출력하는 일부분으로 인해 예측하기 어렵다.
    • 예시
    public class X { 
      private int lastIdUsed;
    
      public int getNextId() {
        return ++lastIdUsed;
      }
    }
    
    위 클래스를 호출하는 2개의 스레드가 있다고 했을 때 결과는 어떻게 나올까?
    아주 간단한 함수이지만 두 스레드가 같은 변수를 동시에 참조하기에 출력을 확실하게 예측하기 어렵다.

  1. 동시성 방어 원칙
    • SRP(단일 책임 원칙)
      • 주어진 클래스, 메서드, 컴포넌트를 변경할 이유가 오직 하나여야 한다는 원칙
      • 동시성 코드는 독자적인 개발, 변경, 조율 주기가 있다.
      • 동시성 코드에는 다른 코드에서 겪는 난관과 다르고 어렵기에 독자적인 난관이 존재한다.
      • 잘못 구현한 동시성 코드는 다양한 방식으로 실패한다.
      • 동시성 코드를 다른 코드와 분리하라.
    • 자료 범위를 제한하라
      • 동일한 공간을 두 스레드가 사용하면 예상치 못한 결과를 내놓는다.
      • 공유 객체를 사용하는 코드 내 임계영역을 synchronized 키워드로 보호하라.
      • 임계영역의 수를 줄이는 기술도 중요하다.
      • 자료를 캡슐화하고 공유 자료를 최대한 줄여라.
    • 자료 사본을 사용하라
      • 공유 자료를 줄이려면 처음부터 공유하지 않는 방법이 제일 좋다.
      • 객체를 복사해 읽기 전용으로 사용하는 방법이 있다.
      • 각 스레드가 객체를 복사해 사용한 후 한 스레드가 해당 사본에서 결과를 가져오는 방법도 가능하다.
    • 스레드는 가능한 독립적으로 구현하라
      • 다른 스레드와 자료를 공유하지 않는 독립적인 스레드를 구현하라.
      • 독자적인 스레드로 가능하면 다른 프로세서에서 돌려도 괜찮도록 자료를 독립적인 단위로 분할하라.

  1. 실행 모델을 이해하라
    • 다중 스레드 애플리케이션을 논하기 전에 먼저 몇 가지 용어를 이해하자.

      1. 한정된 자원(Bound Resource): 다중 스레드 환경에서 사용하는 자원으로 크기, 숫자가 제한적이다.
        데이터 베이스 연결, 길이가 일정한 읽기 및 쓰기 버퍼 등이 예시다.
      2. 상호 배제(Mutual Exclusion): 한 번에 한 스레드만 공유 자료나 공유 리소스를 사용할 수 있는 경우를 말한다.
      3. 기아(Starvation): 한 스레드나 여러 스레드가 굉장히 오랫동안 혹은 영원히 자원을 기다린다.
        예를 들어 항상 우선순위에 의해 한 스레드가 자원을 독차지한다면 다른 스레드는 기아 상태에 빠진다.
      4. 데드락(Deadlock): 여러 스레드가 서로 끝나기만을 기다리는 상황이다.
        모든 스레드가 각자 필요한 자원을 다른 스레드가 점유하는 바람에 더 이상 동작하지 않는다.
      5. 라이브락(Livelock): 락을 거는 단계에서 다른 스레드가 서로를 방해한다.
        스레드는 계속해서 진행하려고 하지만 공명(resonance) 으로 인해 진행하지 못한다.
    • 생산자-소비자(Producer-Consumer)

      • 생산자 스레드와 소비자 스레드가 사용하는 대기열은 한정된 자원이다.
      • 생산자 스레드는 대기열에 빈 공간이 있어야 정보를 채울 수 있기에 빈 공간이 생길 때까지 대기한다.
      • 소비자 스레드는 대기열에 정보가 있어야 동작하기에 정보가 채워질 때까지 대기한다.
      • 대기열을 올바르게 사용하고자 서로에게 시그널을 보내도록 하라.
    • 읽기-쓰기(Readers-Writers)

      • 처리율(throughput) 을 강조하면 기아현상이 생기거나 오래된 정보가 쌓인다.
      • 읽기 쓰레드의 요구와 쓰기 스레드의 요구를 적절히 만족시켜 처리율도 적당히 높이고 기아도 방지하는 해법이 필요하다.
      • 간단한 전략은 읽기 스레드가 없을 때까지 갱신을 원하는 쓰기 스레드가 버퍼를 기다리는 방법이다.
        • 이 경우 읽기 스레드가 계속 이어진다면 쓰기 스레드는 기아 상태에 빠진다.
      • 쓰기 스레드에게 우선권을 준 상태에서 쓰기 스레드가 계속 동작한다면 처리율이 떨어진다.
      • 양쪽 균형을 유지하면서 동시 갱신 문제를 피하는 해법이 필요하다.

  1. 동기화하는 메서드 사이에 존재하는 의존성을 이해하라
    • 동기화하는 메서드 사이에 의존성이 존재하면 동시성 코드를 찾기 어렵다.
    • 공유 객체 하나에는 메서드 하나만 사용하라.
    • 공규 객체 하나에 여러 메서드가 필요하다면 다음 세 가지 방법을 고려하라.
      1. 클라이언트에서 잠금: 클라이언트에서 첫 번째 메서드를 호출하기 전에 서버를 잠구고 마지막 메서드를 호출할 때까지 유지한다.
      2. 서버에서 잠금: 서버에 서버에 락을 걸고 모든 메서드를 호출한 후 잠금을 해제하는 메서드를 구현해 이 메서드를 클라이언트에서 호출한다.
      3. 연결(Adapted)서버: 잠금을 수행하는 중간 단계를 생성한다.

  1. 동기화하는 부분을 작게 만들어라
    • 자바에서 synchronized 키워드를 사용하면 락을 설정할 수 있다.
    • 락은 스레드를 지연시키고 부하를 가중시킨다.
    • 임계영역으로 설정한 코드는 반드시 보호해야 하고 최대한 임계영역 수를 줄이도록 코드를 작성하라.
    • 동기화하는 부분을 최대한 작게 만드는 것을 권장한다.

  1. 스레드 코드 테스트하기
    • 멀티 스레드 환경에서는 테스트를 하기 매우 복잡하다.
      • 문제를 노출하는 테스트 케이스를 작성하라.
      • 프로그램 설정과 시스템 설정 및 부하를 바꿔가며 자주 돌려라.
      • 테스트가 실패하면 반드시 원인을 추적하라.
      • 다시 돌렸더니 통과한다는 이유로 그냥 넘어가면 절대로 안 된다.
    • 구체적인 지침으로 다음을 제시한다.
      • 말이 안 되는 실패는 잠정적인 스레드 문제로 취급하라.
        • 시스템 실패를 일회성이라 치부하지 마라.
      • 다중 스레드를 고려하지 않은 순차 코드부터 제대로 동작하게 만들어라.
        • 스레드 환경 밖에서 생기는 버그와 스레드 환경에서 생기는 버그를 동시에 디버깅하지 마라.
      • 다중 스레드를 쓰는 코드 부분을 다양한 환경에 쉽게 넣을 수 있도록 스레드를 작성해라.
        • 실행 중 스레드 수를 바꿔봐라.
        • 스레드 코드를 실제 환경과 테스트 환경 등 다양하게 돌려본다.
        • 테스트 코드를 다양한 속도로 돌리고 반복 테스트가 가능하도록 테스트 케이스를 작성한다.
        • 다양한 곳에서 사용할 수 있도록 코드를 구현하라.
      • 프로세서 수보다 많은 스레드를 돌리고 다양한 플랫폼에서 스레드를 돌려보라.
        • 시스템이 스레드를 스왑할 때도 문제가 발생한다.
        • 임계영역을 빼먹은 코드나 데드락을 일으키는 코드를 찾기 쉽도록 많은 스레드를 돌려본다.
      • 코드에 보조 코드를 넣어 강제로 실패를 일으키게 해보라.

  1. 결론
    • SRP 원칙을 준수해서 POJO를 사용해 스레드를 아는 코드와 모르는 코드를 분리한다.
    • 동시성 오류를 일으키는 잠정적인 원인을 철저히 이해한다.
    • 사용하는 라이브러리와 기본 알고리즘을 이해한다.
    • 보호할 코드 영역을 찾아내는 방법과 특정 코드 영역을 잠그는 방법을 이해한다.
    • 일회성 문제를 단순한 문제로 치부해 무시하지 않는다.
    • 시간을 들여 보조 코드를 추가하면 오류가 드러날 가능성이 크게 높아진다.

2. 🤔 이해가 어려운 부분

🔍 질문하기

  1. 개념 또는 원칙의 이름
    • 어려웠던 부분
      동시성 방어 원칙에서 SRP를 지키는 코드가 어떤 코드인지 이해하기 어려웠다.
    • 궁금한 점
      SRP 원칙을 지키는 멀티 스레드 코드에는 어떤 것이 있는지 궁금하다.

3. 📚 참고 사항

📢 논의하기

  1. 관련 자료 공유

  1. 논의하고 싶은 주제
    • 주제
      논의하고 싶은 내용을 간략히 정리합니다.
    • 설명
      논의하고 싶은 이유를 작성합니다.