Pre-emphasis filtering, Ceptral mean normalization

y_t = ax_t + (1-a)x_{t-1}
다음과 같은 필터링 공식을 통해 저주파수의 amplitude는 줄이고, 고주파수는 증가시키는 방식을 이용한다.

Applied Speech and Audio Processing  책의 102p에 다음과 같이 나와있다.(번역은 내맘대로)

LPC 분석은 high frequency는 poor한 반면에, lower frequencys를 더 정확히 맞추는(?;satify) 경향이 있다. ㅇ그래서 LPC 분석 전에 pre-emphasis를 시키는 것이 일반적이다. 음성이 입을 통해 발화될 때, 높은 압력에서 대기라는 낮은 압력으로 나오면서, spectral roll-off 가 발생하여 고주파수의 진폭이 감소하게 된다. 따라서 입의 ‘밖’에서 녹음된 음성은 ‘안’에서 녹음된 음성과 다르다. LPC filter라는 것 자체가 vocal tract response를 분석하기 위한 것 이므로 이러한 입의 방사(lip radiation)의 영향을 배제해야한다.

책에 따르면 위의 식은 흔하게 다음과 같이 작성된다.
s\textprime (n) = s(n) - 0.9375 \cdot s(n-1)

출력이 필요할 때는 반대로, de-emphasizing을 해야해서 IIR filter를 다음과 같이 구현하다.
r(n) = s\textprime (n) + 0.9375 \cdot r(n-1)

이를 구현하는 matlab 코드는 103p에 나와있다.

https://www.quora.com/Why-is-pre-emphasis-i-e-passing-the-speech-signal-through-a-first-order-high-pass-filter-required-in-speech-processing-and-how-does-it-work

그러나 위의 링크에서 보면 이는 과거의 방식이며 최근에는 이것이 필요치 않다고 한다. Channel normalzation으로 대체가능하며 그 대표적인 예가 Ceptral mean normalization이라고 한다. (맞는 주장인지는 모르겠다)

그 ceptral mean normalization 에 대한 해설은 아래와 같다.

https://dsp.stackexchange.com/questions/19564/cepstral-mean-normalization

그러나 아직은 잘 이해가 되지 않는다. 이해가 되는 순간 추가 글을 작성하겠다.(2017.07.25)

0 Shares:
1 comment
Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.