Zettelkasten

Cepstral Analysis은 배음 구조를 찾게 해준다.

·수정 2026.04.23·수정 4

w #audio-processing

요약

  • cepstral 분석은 배음 구조를 찾게해주는 분석 방법
  • 배음 구조는 소리의 고유한 특징을 나타냄

본문

악기 소리, 사람의 음성은 일반적으로 배음(harmonics) 구조를 갖고 있음

  • 기본 주파수와 함께 기본 주파수의 정수배인 배음들로 구성
    • 정수배인 배음들이 고주파
  • 배음은 악기, 성대 구조에 따라 다르며 배음구조가 음색의 차이를 만듦 Spectrum에서 배음 구조를 찾으면 소리의 고유 특징을 찾아낼 수 있음
  • 이러한 배음 구조를 찾게해주는 방법을 cepstrum이라고 함
  • 일반적으로 스펙트럼은 피크들을 갖고 있고 피크의 의미는 해당 주파수가 지배적이라는 의미
  • 이런 피크들을 Formant라고 함
    • 소리가 공명되는 특정 주파수 대역
    • 음성은 성대에서 형성되어 성도를 거치며 변형되는데
    • 성도를 지나면서 포먼드를 만나 증폭되거나 감쇠됨
    • 포먼트는 배음과 만나 소리를 풍성하게 선명하게 만드는 ˜필터 역할을 함
  • 포먼트는 소리의 특징을 유추할 수 있는 중요한 단서
    • Spectrum과 포먼트를 연결한 곡선을 분리하는 것
    • 포먼트를 연결한 곡선 Spectral Envelope
    • MFCC는 둘을 분리하는 과정에서 도출됨
      • log과 IFFT(Inverse Fast Fourier Transform)

스펙트럼 신호의 로그값에 역퓨리에 변환을 하면 캡스트럼이 됨 캡스트럼 분석 자체는 소스와 필터 특징을 분리하기 위한 수단 quefrency: The most prominent peak in the cepstral domain

  • 음성의 피치와 관련있음
  • f0의 역수

Cepstral Peack Prominence(CPP) cepstral analysis로 부터 도출된 피크: "기본 주파수"

cepstrum.png

  • 넓은 골 => 기본 주파수

  • 좁은 골 => 기본 주파수의 정수배

  • 좁은 마루 => 조화음(harmonics)

  • 넓은 마루 => 성도의 공명

조화음이 공명 주파수와 일치하는 경우(성도 공명 주파수가 기본 주파수의 정수배인 경우)

공명 주파수가 조화음의 주파수와 어긋나면

log 함수는 두개의 곱으로 형성된 함수를 합으로 분리할 수 있고 주파수 영역으로 변환된 신호의 크기와 위상을 분리할 수 있음 => 작은 마루, 큰 마루를 분리할 수 있음