© Fraunhofer IIS/Viaframe

방송 오디오의 미래

2017년은 한국 방송업계에 기념비적인 한 해였다. 세계 최초로 도입된 ATSC 3.0 표준 기반 지상파 UHD 방송은 더욱 선명해진 화질을 선보였으며 차세대 오디오 코덱인 MPEG-H 오디오를 채택하여 획기적으로 향상된 음질을 선보였다.

MPEG-H 오디오 기술은 전통적인 채널 신호 외에도 객체 신호, 장면 신호, 그리고 이들 3개 신호 유형의 조합을 지원하며, 이를 기반으로 몰입형 오디오 및 인터랙티브 기능을 제공한다. 몰입도 높은 오디오 장면은 사용자 경험을 향상시키며, 인터랙티브 기능은 시청자가 필요에 따라 맞춤형 오디오를 설정할 수 있도록 해준다. 오디오 장면의 특정 부분에 사용되는 오디오 객체의 설정을 시청자가 직접 변경할 수 있기 때문이다. 예를 들어, 방송사는 대화를 객체로 전송하여 환경배경음 대비 대화 음량을 조절하는 대화 증폭(Dialogue Enhancement) 기능을 시청자에게 제공할 수 있으며, 시청자는 이를 통해 본인의 청각 능력이나 청취 환경에 최적화된 오디오 믹스를 설정할 수 있다. 해당 기능은 잠재 사용자를 대상으로 하는 연구조사에서 높은 만족도를 보였다. 이 외에도 축구나 야구 경기 시청 시, 홈팀 해설이나 원정팀 해설 중 하나를 선택하거나 해설 없이 경기장의 현장감을 그대로 즐길 수 있다. 객체 기반 오디오는 언어별로 오디오 객체를 사용하고 배경음은 채널로 전송하는 등 다중언어 서비스를 효율적인 방식으로 지원한다. 이 때, 배경음은 각 언어별이 아닌 한번만 전송되면 된다. 특히, 서라운드나 몰입형 오디오 프로그램의 경우, 비트율 절감 효과가 뛰어나다.

오디오 객체가 제공하는 또 다른 혜택은 바로 탁월한 접근성 기능이다. 예를 들어, 시각장애인을 위한 음성해설을 객체화시켜 수신기의 최종 오디오 믹스에 추가시키고, 시각장애인이 앉아 있는 쪽에 음성해설을 위치시킬 수 있다. 고급형 TV의 경우, 2개의 오디오 출력 기능을 지원하기 때문에 메인 스피커로는 일반 오디오를, 헤드폰으로는 음성해설을 청취할 수 있다.

MPEG-H 오디오 재생의 가장 큰 과제는 인터랙티브 기능을 사용자 친화적이고 접근성 높은 방식으로 제공하는 것이다. 때문에 MPEG-H 오디오 시스템은 두 가지 수준의 인터랙션을 지원하고 있다. 첫 번째는 오리지널 믹스와 함께 제공되는 방송사가 정의한 오디오 프리셋(preset)이다. 대화 음량 증가, 각종 스포츠 해설 모음, 경기장 현장음 등이 이에 해당한다. 두 번째는 사용자가 직접 객체별 설정을 변경하는 것이다.  이 때, 변경 가능 범위는 컨텐츠 제공자가 메타데이터를 통해 설정할 수 있다.

© Fraunhofer IIS/Youngju Ju
© Fraunhofer IIS/Youngju Ju

MPEG-H의 인터랙티브 기능을 지원하는 2019년형 TV 신제품들 덕분에 방송사는 시청자에게 더욱 다양한 서비스를 제공할 수 있게 되었다. MBC는 제29회 국제 방송·음향·조명기기 전시회(KOBA 2019)에서 대화 증폭, 다중언어 지원 기능 등 미래형 방송 기술을 시연할 계획이다. 특히, ‘시청자 선택형 오디오’라는 제목으로, 향후 정규 방송에 도입할 인터랙티브 오디오 서비스를 소개한다. 방송용 인터랙티브 오디오 서비스가 상용화되면 이 또한 세계 최초가 된다.

Header image © Fraunhofer IIS/Viaframe

This post is also available in: English

우리를 따라 오세요

Twitter – Fraunhofer IIS