Zettelkasten

Dimensional SER에서 CCC는 사실상 표준 평가 지표다

·수정 2026.04.23·수정 2

요약

Speech Emotion Recognition(SER)에서 CCC는 Dimensional Emotion 예측의 사실상 표준 평가 지표다. AVEC Challenge 등 주요 대회에서 공식 지표로 채택되었으며, 손실 함수로도 활용된다. 단, Categorical SER에서는 Cross-Entropy가 표준이다.

본문

SER의 두 가지 접근법

유형 출력 예시 평가 지표
Categorical 이산 감정 클래스 happy, sad, angry, neutral Accuracy, F1, UAR
Dimensional 연속값 Valence, Arousal, Dominance CCC, MSE, PCC

Dimensional SER에서 CCC가 표준인 이유

  1. AVEC Challenge 공식 채택

    • Audio/Visual Emotion Challenge (2011~)에서 CCC를 primary metric으로 사용
    • 학계에서 de facto standard로 자리잡음
  2. 연속값 예측에 적합

    • Valence(-1 ~ +1), Arousal(-1 ~ +1) 같은 연속 스케일
    • 예측값이 실제값과 얼마나 "일치"하는지 직접 측정
  3. 상관관계만으로는 부족

    • Pearson 상관계수는 스케일/바이어스 차이를 반영 못함
    • CCC는 평균, 분산 차이까지 페널티 부여

손실 함수로서의 CCC

# 평가 지표 → 손실 함수 변환
loss = 1 - CCC  # 또는 -CCC

일반적인 조합:

  • CCC Loss 단독
  • CCC Loss + MSE (안정성 보완)
  • CCC Loss + L1 Loss

주의: 유일한 표준은 아님

  • Categorical SER: Cross-Entropy가 표준
  • Dimensional SER에서도:
    • MSE, MAE 여전히 사용됨
    • 일부 연구는 PCC(Pearson) 사용
    • CCC는 "주류"이지 "유일한 표준"은 아님

AVEC Challenge 연혁

연도 특징
2011-2014 Audio-Visual Emotion Challenge 시작
2015~ CCC를 primary metric으로 채택
현재 Dimensional emotion의 표준 벤치마크

참고