상세 컨텐츠

본문 제목

[논문리뷰] An adaptive approach for determining batch sizes using the hidden Markov model-2

공부

by 김지똥 2025. 3. 24. 01:15

본문

[The HMM-based adaptive batch size determination]

[Brief review of the HMM]

 HMM (Hidden Markov Model)의 개요

HMM은 시계열 데이터를 모델링하는 확률적 기법 중 하나로, 특히 관측할 수 없는(hidden) 상태(state)를 기반으로 미래를 예측하는 데 적합한 모델이다. 

 HMM의 기본 개념

  • 관측값(Observation)과 은닉 상태(Hidden State)로 구성됨.
  • 은닉 상태는 직접적으로 보이지 않지만, 관측값을 통해 추론할 수 있음.
  • 시간에 따라 상태가 변하면서 관측값이 확률적으로 결정됨.

 제조 공정에서의 예시:

  • 은닉 상태 (Hidden State): 공정의 품질 상태 (예: 정상 상태 vs. 비정상 상태)
  • 관측값 (Observation): 품질 측정 데이터 (예: 제품 치수, 위치 편차 등)

 즉, 공정의 실제 상태는 직접 관측할 수 없지만, 품질 데이터를 통해 현재 공정이 정상적인지 예측할 수 있다.


 HMM의 수학적 표현

논문에서는 HMM을 다음과 같은 세 가지 주요 요소로 정의한다.

 1. 초기 확률 벡터 (Initial State Probability)

  • 모델이 특정 상태에서 시작할 확률을 나타낸다.
  • π={πk}이고, 여기서 πk는 상태 S1 일 확률을 의미한다.

 제조 공정 예시:

  • 처음 공정을 시작할 때 기계가 정상 상태일 확률 비정상 상태일 확률을 정의할 수 있다.

*벡터 여러 개의 숫자를 한 줄로 나열한 것


 2. 상태 전이 확률 행렬 (State Transition Probability)

  • 특정 상태에서 다른 상태로 전이될 확률을 의미한다.
  • 행렬 A={aij}에서 aij=P(St=j∣St−1=i)

 제조 공정 예시:

  • 기계가 정상 상태에서 정상 상태를 유지할 확률,
  • 또는 정상 상태에서 비정상 상태로 변할 확률을 정의할 수 있다.

 즉, 시간이 지남에 따라 공정 상태가 어떻게 변화할지를 수학적으로 표현하는 행렬이다.

 

*행렬은 숫자들이 행(row)과 열(column)로 이루어진 이차원 배열


 3. 방출 확률 행렬 (Emission Probability)

  • 각 상태에서 특정한 관측값이 발생할 확률을 의미함.
  • 행렬 B={bij}에서 bij=P(Ot=j∣St=i)

 제조 공정 예시:

  • 만약 공정이 정상 상태라면 치수 편차가 평균적으로 낮을 확률이 높다.
  • 하지만 공정이 비정상 상태라면 치수 편차가 크게 나타날 확률이 높다.

 즉, 특정 상태에서 관측되는 품질 데이터의 분포를 정의하는 행렬이다.


 HMM의 활용: 배치 크기 결정과 관련된 문제 해결

논문에서는 HMM을 활용하여 배치 크기 결정 문제를 해결하는 방법을 설명하고 있다.

 HMM을 이용하면 무엇이 가능할까?

  1. 공정 변동성을 실시간으로 감지할 수 있다.
  2. 공정 변동성이 증가할 때 배치 크기를 줄여 불량률을 줄일 수 있다.
  3. 공정 변동성이 낮을 때 배치 크기를 늘려 생산성을 최적화할 수 있다.

 즉, HMM을 이용하면 배치 크기를 공정의 변동성에 맞게 유동적으로 조정할 수 있다...


 HMM에서 해결해야 하는 3가지 핵심 문제

HMM을 실제로 적용하기 위해 해결해야 하는 세 가지 문제가 있다.

 1. 평가 문제 (Evaluation Problem)

  • 주어진 HMM 모델과 관측값이 있을 때, 이 관측값이 해당 모델에서 발생할 확률을 계산하는 문제다
  • Forward-Backward 알고리즘을 사용하여 계산 가능하다.

 제조 공정 적용 예시:

  • 현재까지의 품질 데이터를 기반으로 현재 공정 상태가 정상일 확률 vs. 비정상일 확률을 계산할 수 있다.

 2. 디코딩 문제 (Decoding Problem)

  • 주어진 관측값을 바탕으로 최적의 상태 전이 경로를 찾는 문제다
  • Viterbi 알고리즘을 사용하여 해결 가능하다

 제조 공정 적용 예시:

  • 현재까지의 데이터를 분석하여 가장 가능성이 높은 공정 상태의 변화 경로를 추적할 수 있다.

 3. 학습 문제 (Learning Problem)

  • 모델의 파라미터(A,B,π)를 최적화하는 문제
  • Baum-Welch 알고리즘 (Expectation-Maximization, EM 기법 활용)

 제조 공정 적용 예시:

  • 기존 데이터로부터 공정이 정상 상태에서 비정상 상태로 변할 확률, 품질 데이터의 분포 등을 학습하여 모델을 개선할 수 있다.

 즉, 학습을 통해 HMM 모델을 공정의 특성에 맞게 최적화할 수 있다.


 HMM을 이용한 배치 크기 결정의 핵심 아이디어

논문에서는 HMM을 이용하여 배치 크기를 적응적으로 조정하는 방법을 제안하고 있다..

 공정이 정상 상태일 경우 → 배치 크기 증가
 공정이 비정상 상태로 변할 가능성이 클 경우 → 배치 크기 감소

 이 논문에서의 핵심 차별점:

  • 기존 연구들은 배치 크기를 고정된 값으로 설정했지만,
  • 이 논문에서는 공정 상태 변화를 실시간으로 감지하여 배치 크기를 동적으로 조절하는 방법을 제안한다.

 즉, 품질 데이터를 기반으로 HMM을 활용하여 배치 크기를 최적화할 수 있다.


 최종 정리 (HMM-Based Adaptive Batch Size Determination 핵심 내용 요약)

 HMM이란?

  • 관측할 수 없는 "은닉 상태(hidden state)"를 기반으로 데이터를 분석하는 확률적 모델이다.
  • 제조 공정에서 "공정 상태"를 은닉 상태로 보고, 품질 데이터(관측값)를 통해 공정 상태를 예측하는 데 활용 가능하다.

 HMM의 주요 구성 요소:

  • 초기 확률 벡터 (π)
  • 상태 전이 확률 행렬 ()
  • 방출 확률 행렬 (B)

 HMM이 배치 크기 결정에 적용되는 방식:

  • 공정 상태를 실시간으로 분석하여 배치 크기를 동적으로 조정하는 방식을 제안한다.
  • 기존 방식(고정된 배치 크기)과 달리, HMM을 활용하면 품질 유지와 생산성 최적화가 가능하다.

 HMM의 세 가지 주요 문제:

  1. 평가 문제 (Evaluation Problem): 현재까지의 데이터를 이용해 공정 상태를 예측 (Forward-Backward 알고리즘 사용)
  2. 디코딩 문제 (Decoding Problem): 최적의 상태 경로를 찾음 (Viterbi 알고리즘 사용)
  3. 학습 문제 (Learning Problem): 모델을 최적화하여 정확도를 높임 (Baum-Welch 알고리즘 사용)

 즉, HMM을 적용하면 배치 크기를 공정 상태에 따라 조절할 수 있고, 이를 통해 불량률을 줄이면서도 생산성을 높이는 것이 가능해진다.


1. 문제 정의: 제조 공정에서 품질과 공정 변동성(Process Variability)

 품질 평가의 핵심 개념

현대 제조 시스템에서는 자동화된 검사 프로세스를 통해 제품의 품질을 평가한다.
이때, 제품의 실제 값과 명목 값(nominal value)의 차이를 측정하여 품질이 정상인지 아닌지를 판단한다.

  • di,fL: 제품 i의 특정 특징 f에 대한 위치(Location) 데이터
  • di,fD: 제품 의 특정 특징 f에 대한 치수(Dimensional) 데이터
  • 즉, 제품의 각 특징(feature)에 대해 실제 값이 기준 값에서 얼마나 벗어났는지(deviation) 측정.

이 데이터는 관측값(Observation, Oi)으로 활용되어 공정 상태를 추정하는 데 사용된다.

 

2. 숨겨진 마르코프 모델(HMM) 적용

HMM에서는 공정 상태(Equipment State)는 직접 관측할 수 없고, 품질 검사 데이터(Observation)만 볼 수 있다.
따라서, Forward-Backward 알고리즘을 이용해 공정 상태를 추정해야 한다.

 (1) 상태 변수 정의

  • 숨겨진 상태(Hidden States, ): 제조 공정의 상태(기계가 정상인가, 비정상인가?)
  • 관측값(Observations, Oi): 품질 검사 데이터(제품 품질이 정상인가, 불량인가?)
  • 전이 확률(Transition Probability, ): 공정이 정상에서 비정상으로 변할 확률
  • 방출 확률(Emission Probability, ): 특정 공정 상태에서 특정 품질 데이터가 나올 확률

3. 평가 문제(Evaluation Problem): Forward-Backward 알고리즘 활용

평가 문제란?
 - 주어진 HMM과 품질 검사 데이터(관측값)이 있을 때, 이 데이터가 해당 HMM에서 발생할 확률을 계산하는 문제
 - Forward-Backward 알고리즘을 사용하여 계산 가능

 

4. Forward-Backward 알고리즘 적용

🔹 (1) Forward 알고리즘

목표: 현재까지의 관측값을 바탕으로 특정 공정 상태가 존재할 확률 계산

  1. 초기 확률 적용:

 

→ 처음 공정 상태가 정상 또는 비정상일 확률에 해당 품질 데이터가 발생할 확률을 곱함.

 

2. 전방향으로 상태 확률 업데이트:

→ 이전 상태에서 현재 상태로 이동할 확률과 현재 상태에서 품질 데이터가 나올 확률을 곱하여 업데이트.

 

🔹 (2) Backward 알고리즘

목표: 현재 상태에서 앞으로 나올 관측값을 고려했을 때, 공정 상태가 존재할 확률 계산

  1. 초기화 (마지막 상태에서 시작):

 

  2. 역방향으로 상태 확률 업데이트:

→ 앞으로 나올 품질 데이터를 고려하여 상태 확률 업데이트.

 

🔹 (3) 최종 확률 계산

Forward와 Backward 값을 결합하여 특정 공정 상태가 존재할 확률을 구함.

5. 제조 공정에서 Forward-Backward 알고리즘 활용 예제

🔹 (1) 문제 상황

  • 제조 공정에서 3일간의 품질 검사 데이터가 있음: 
  • 공정 상태가 정상(Normal) 또는 비정상(Faulty)일 수 있음.
  • Forward-Backward 알고리즘을 사용하여 각 날짜별로 공정 상태가 정상일 확률을 추정함.

🔹 (2) 알고리즘 적용

  1. Forward 계산 → 현재까지의 품질 데이터 기반으로 상태 확률 추정.
  2. Backward 계산 → 미래 품질 데이터 고려하여 상태 확률 조정.
  3. 최종 확률 계산 → Forward와 Backward 결과 결합하여 공정 상태 예측.

 

6. Fig. 3 (Forward-Backward 알고리즘을 이용한 공정 평가) 설명

📌 Fig. 3은 HMM을 활용하여 공정 상태를 평가하는 과정을 나타냄.
📌 Forward-Backward 알고리즘을 사용하여 품질 데이터 기반으로 공정 상태를 추정하는 과정이 보임.

 

🔹 그림 설명

  1. 입력 데이터 (품질 검사 데이터 )
    • 자동화된 검사 시스템에서 수집된 품질 데이터.
  2. Forward-Backward 알고리즘 적용
    • Forward를 이용해 공정 상태 확률 계산.
    • Backward를 적용해 미래 데이터를 반영한 상태 확률 업데이트.
  3. 전이 확률 (Transition Probability) 적용
    • P(St∣St−1): 한 상태에서 다음 상태로 바뀔 확률.
  4. 방출 확률 (Emission Probability) 적용
    • P(Ot∣St): 특정 상태에서 특정 품질 데이터가 나올 확률.
  5. 최종 평가: 정상 제품 vs. 불량 제품
    • 특정 시점에서의 공정 상태에 따라 제품이 정상인지 비정상인지 평가.
    • 만약 비정상 제품이 많이 나오면, 공정을 중단할지 결정.

HMM 기반 공정 변동성 예측을 통한 배치 크기 결정 (Batch Size Determination Based on Process Variability Prediction)

이번 내용은 제조 공정의 변동성을 실시간으로 예측하고, 이를 기반으로 배치 크기를 조정하는 방법을 제안하는 부분이다.

이를 위해 HMM(Hidden Markov Model)을 활용하고, EM(Expectation Maximization) 알고리즘을 이용하여 모델을 지속적으로 업데이트한다.

 

 배치 크기 조정의 기본 개념

 배경:

  • 공정 변동성(process variability)은 제조 품질에 영향을 미치는 중요한 요소다.
  • 변동성이 커질 경우, 불량률(nonconforming product rate)이 증가할 가능성이 있다.
  • 기존 방식에서는 배치 크기를 고정된 값으로 설정했지만, 이렇게 하면 공정 상태가 악화될 경우에도 같은 배치 크기로 생산하여 불량품이 많아질 위험이 있다.
  • 따라서, 공정 변동성을 실시간으로 예측하고 배치 크기를 유동적으로 조정하는 방식이 필요하다.

 HMM을 활용한 해결 방법:

  • HMM을 사용하여 공정의 변동성을 추론하고, 이를 바탕으로 배치 크기를 결정한다.
  • 실시간으로 품질 데이터를 수집하고 분석하여 공정이 비정상 상태로 변할 가능성이 높아지면 배치 크기를 줄이고, 정상 상태일 경우 배치 크기를 늘린다.
  • 이 방법을 통해 제조 비용을 줄이면서도 제품 품질을 보장할 수 있다.

 HMM을 활용한 배치 크기 결정 과정

논문에서 제안하는 HMM 기반 배치 크기 결정 과정은 다음과 같다:

 1. 품질 데이터 수집 및 HMM 모델 초기화

  • 제조 공정에서 각 제품의 품질 데이터를 실시간으로 수집한다.
  • 품질 데이터는 치수 공차(Dimensional Tolerance)와 위치 공차(Location Tolerance)를 포함한다.
  • HMM 모델의 초기값 λ={A,B,π} 를 설정한다.
    • A: 상태 전이 확률 (State Transition Probabilities)
    • : 방출 확률 (Emission Probabilities)
    • : 초기 상태 확률 (Initial Probabilities)
  • 초기 데이터가 부족한 경우, 랜덤 값으로 설정하고 이후 데이터가 쌓이면서 업데이트한다.

 2. 공정 변동성 예측 (Process Variability Inference)

  • 품질 데이터가 수집될 때마다 HMM을 통해 공정 상태를 추정한다.
  • Forward-Backward 알고리즘을 사용하여 현재 공정이 정상 상태인지, 비정상 상태인지 예측한다.
  • 다음 제품이 불량품이 될 확률 PDi+1 을 계산한다:

  • 여기서 NC 불량품(nonconforming product)의 집합을 의미한다.
  •  가 특정 임계값  이상이면, 공정 상태가 비정상으로 판단된다.

 3. 배치 크기 조정 (Batch Size Adjustment)

  • PDi+1 값이 기준값 보다 크면, 배치 크기를 줄이고 공정을 재보정(recalibration) 진행한다.
  • PDi+1 값이 기준값 보다 작으면, 공정이 정상 상태이므로 배치 크기를 유지하거나 증가한다.

 즉, 품질 데이터 기반으로 공정 상태를 실시간으로 평가하고, 배치 크기를 동적으로 조정하는 방식이다.


 4. 모델 업데이트 (Model Parameter Update using EM Algorithm)

  • EM(Expectation-Maximization) 알고리즘을 사용하여 HMM의 파라미터 를 지속적으로 업데이트한다.
  • 새로운 품질 데이터가 들어올 때마다 HMM을 업데이트하여 점점 더 정확한 예측이 가능하도록 개선한다.
  • 이를 통해 공정 변동성을 보다 정확하게 예측하고, 최적의 배치 크기를 결정할 수 있다.

 

 

* EM 알고리즘이란?

 EM 알고리즘은 "관측되지 않은 데이터(은닉 상태)를 가진 확률 모델에서 최적의 매개변수를 찾는 방법"이다.
 E-Step (Expectation Step): 현재 정보를 기반으로 숨겨진 확률을 추정한다.
 M-Step (Maximization Step): 추정한 확률을 바탕으로 모델의 확률값을 조정한다.
 반복적으로 실행하여 모델을 점점 더 정확하게 만든다

 HMM에서는 EM 알고리즘을 이용하여 상태 전이 확률과 방출 확률을 지속적으로 업데이트하여, 배치 크기를 실시간으로 조정하는 데 활용한다.

 

EM 알고리즘 vs. Forward 알고리즘

예시를 통해 이해해보자

도넛 가게 예제

  • 가게에서 "초코 도넛"과 "바닐라 도넛"을 파는데, 고객들의 선호도를 모르고, 구매 패턴만 알고 있다.
  • 이를 통해 고객이 어떤 도넛을 선호하는지 예측하려고 한다.

 Forward 알고리즘은?
➡ "이 고객이 초코 도넛을 사러 올 확률이 얼마나 될까?"
➡ "지난 5번 동안 초코 도넛을 샀는데, 이번에도 살 확률이 얼마나 될까?"
 현재까지의 데이터를 기반으로 확률을 계산하는 알고리즘

 

 EM 알고리즘은?
➡ "초코 도넛과 바닐라 도넛을 선호하는 고객 비율을 어떻게 설정해야 가장 정확할까?"
➡ "도넛 구매 데이터를 이용해서, 고객의 선호도를 점점 더 정확하게 학습할 수 있을까?"
 관측 데이터를 바탕으로 모델 자체를 최적화하는 학습 알고리즘

 

 즉, Forward 알고리즘은 "현재 상태 예측"을 위한 것이고, EM 알고리즘은 "모델 학습"을 위한 알고리즘이다.


 Fig. 4: HMM 기반 배치 크기 결정 모델의 흐름도 분석

 Fig. 4는 논문에서 제안한 HMM 기반 배치 크기 조정 모델의 흐름도를 보여준다.

  • 초기 모델 설정 후, 각 제품을 처리하면서 품질 데이터를 수집하고 공정 변동성을 분석한다.
  • 예측된 불량률 PDi+1  기준값  이상이면 공정을 멈추고 재보정(calibration)을 진행한다.
  • 일정 학습 주기가 지나면 EM 알고리즘을 사용하여 HMM 모델을 업데이트한다.
  • 이후 공정이 정상 상태로 유지되면 배치 크기를 다시 조정하여 생산을 지속한다.

 이 모델을 통해 제조 품질을 유지하면서도 생산성을 극대화할 수 있다.


 최종 정리 – HMM 기반 배치 크기 결정 핵심 요약

 왜 배치 크기를 실시간으로 조정해야 하는가?

  • 공정 변동성은 시간이 지나면서 변화하며, 이를 반영하지 않으면 불량률이 증가할 가능성이 있다.
  • 기존 방식은 고정된 배치 크기를 사용하지만, 이는 변동성을 고려하지 못해 비효율적이다.
  • HMM을 이용하면 실시간으로 변동성을 추정하고 배치 크기를 조정할 수 있다.

 HMM을 활용한 배치 크기 결정 방식
1)  품질 데이터 수집 → HMM을 통해 공정 상태 추론
2) 변동성 예측 → 다음 제품이 불량품일 확률 PDi+1계산
3)  배치 크기 조정 → PDi+1 이 임계값  이상이면 배치 크기 축소 & 공정 재보정
4) 모델 업데이트 → EM 알고리즘을 통해 HMM 모델을 지속적으로 개선

 이 방법의 장점

  • 불량률 감소: 공정 변동성이 커질 때 배치 크기를 줄여 불량품 생산을 방지
  • 생산성 최적화: 공정이 안정적인 경우 배치 크기를 증가시켜 생산량 극대화
  • 비용 절감: 불필요한 폐기율을 줄이고, 공정 재보정을 최적화함

 즉, HMM 기반 배치 크기 조정 모델을 활용하면 품질 유지와 비용 절감을 동시에 달성할 수 있다.


관련글 더보기