요약
- cpu 기반의 오토스케일링 문제(뇌피셜)
- 인스턴스가 늘면 CPU가 내려가고, 인스턴스가 줄면 CPU가 올라감
- 그래서 보통 scale out 할 때는 2개 늘리고 scale in 할 때는 1개씩 줄임
- 임계값에서 엄청 자주 업스케일과 다운스케일이 반복됨
- 우리 회사는 50% 기준으로 업스케일하고 30% 기준으로 다운스케일링함
- 이런 시스템에서는 임계값을 어떻게 구할 수 있을까?
- 그니까 어느정도 request일 때 반복적으로 배포가 일어나는지 알 수 있을까?
- 이런 논리를 만들어보면 좋을 거 같은데
- 인스턴스 수가 N대이고 request 수가 M이면 CPU 사용률이 얼마