업무시간의 빈번한 autoscaling을 어떻게 해결할 것인가?

2025.12.03·수정 2026.04.23·수정 2회

operation autoscaling

요약

cpu 기반의 오토스케일링 문제(뇌피셜)
인스턴스가 늘면 CPU가 내려가고, 인스턴스가 줄면 CPU가 올라감
- 그래서 보통 scale out 할 때는 2개 늘리고 scale in 할 때는 1개씩 줄임
임계값에서 엄청 자주 업스케일과 다운스케일이 반복됨
우리 회사는 50% 기준으로 업스케일하고 30% 기준으로 다운스케일링함
이런 시스템에서는 임계값을 어떻게 구할 수 있을까?
- 그니까 어느정도 request일 때 반복적으로 배포가 일어나는지 알 수 있을까?
이런 논리를 만들어보면 좋을 거 같은데
- 인스턴스 수가 N대이고 request 수가 M이면 CPU 사용률이 얼마

업무시간의 빈번한 autoscaling을 어떻게 해결할 것인가?

이 문서를 참조하는 노트 (1)

업무시간의 빈번한 autoscaling을 어떻게 해결할 것인가?

함께 읽기 좋은 글