Gurugail Application/Sound Source Localization
Application

Sound Source Localization

음원 인식 (Sound Source Localization)은 로봇에서 사용자의 음성에 대한 반응을 하기 위해 마이크 어레이를 사용하여 구현하는 기능으로 넓게는 음성 인식 중 하나로 분류된다.

음원 인식은 사용자 음성이나 혹은 임의 음원에 대한 방향을 찾아내는 기술이다.

음원 인식의 방법

음원을 인식하기 위해서는 기본적으로 마이크 즉 음원을 받아드릴 수 있는 장치가 두 개 이상 있어야 한다. 사람으로 설명하면 귀에 해당한다. 음원의 방향을 구하기 위해서는 사람의 경우는 어떤 방법을 사용할까가 궁금하다. 얼핏 음파의 속도가 다르기 때문에 생기는 시간차로만 생각할 수 있는데 아래 두 가지 경우로 크게 나뉘어 진다.

  1. 시간차 (time difference)

음원 장치(혹 귀)에 음원으로부터 음파가 도착하는 데 걸리는 시간이 다를 것이다. 결국 음파의 위상차로 걸리는 시간이 계산될 것이며 그 정보를 가지고 음원의 위치를 찾아낸다

  1. 레벨차 (level difference)

음원 장치에 도달하는 음파의 크기 (amplitude) 차이도 있을 것이다. 쉽게 설명하면 중간에 벽이 있으면 소리가 작게 들리게 된다. 마찬가지로 머리도 작은 벽? 효과를 한다고 생각하면 된다. (head shadow 현상)

참고

http://en.wikipedia.org/wiki/Sound_localization