Dimensional SER에서 CCC는 사실상 표준 평가 지표다
·수정 2026.04.23·수정 2회
요약
Speech Emotion Recognition(SER)에서 CCC는 Dimensional Emotion 예측의 사실상 표준 평가 지표다. AVEC Challenge 등 주요 대회에서 공식 지표로 채택되었으며, 손실 함수로도 활용된다. 단, Categorical SER에서는 Cross-Entropy가 표준이다.
본문
SER의 두 가지 접근법
| 유형 | 출력 | 예시 | 평가 지표 |
|---|---|---|---|
| Categorical | 이산 감정 클래스 | happy, sad, angry, neutral | Accuracy, F1, UAR |
| Dimensional | 연속값 | Valence, Arousal, Dominance | CCC, MSE, PCC |
Dimensional SER에서 CCC가 표준인 이유
-
AVEC Challenge 공식 채택
- Audio/Visual Emotion Challenge (2011~)에서 CCC를 primary metric으로 사용
- 학계에서 de facto standard로 자리잡음
-
연속값 예측에 적합
- Valence(-1 ~ +1), Arousal(-1 ~ +1) 같은 연속 스케일
- 예측값이 실제값과 얼마나 "일치"하는지 직접 측정
-
상관관계만으로는 부족
- Pearson 상관계수는 스케일/바이어스 차이를 반영 못함
- CCC는 평균, 분산 차이까지 페널티 부여
손실 함수로서의 CCC
# 평가 지표 → 손실 함수 변환
loss = 1 - CCC # 또는 -CCC
일반적인 조합:
- CCC Loss 단독
- CCC Loss + MSE (안정성 보완)
- CCC Loss + L1 Loss
주의: 유일한 표준은 아님
- Categorical SER: Cross-Entropy가 표준
- Dimensional SER에서도:
- MSE, MAE 여전히 사용됨
- 일부 연구는 PCC(Pearson) 사용
- CCC는 "주류"이지 "유일한 표준"은 아님
AVEC Challenge 연혁
| 연도 | 특징 |
|---|---|
| 2011-2014 | Audio-Visual Emotion Challenge 시작 |
| 2015~ | CCC를 primary metric으로 채택 |
| 현재 | Dimensional emotion의 표준 벤치마크 |
참고
- CCC Loss는 예측값과 실제값의 일치도를 측정한다
- AVEC Challenge: https://avec-db.sspnet.eu/
- UAR (Unweighted Average Recall): Categorical SER의 주요 지표