IVAS 기술로 몰입형 통화 및 화상회의가 현실이 됩니다
일반적으로 전화 회의는 대면 회의보다 더 피곤하다고 느껴집니다. 스피커에서 나오는 여러 목소리를 구분하고 각 화자와 연결시키는 작업이 필요하기 때문입니다. 대부분의 경우 오디오는 모노로 재생되기 때문에 우리 뇌는 이 작업을 수행하는 데 더 많은 에너지를 소모하게 됩니다.
오늘날 휴대폰 통화 품질은 추측 게임 하듯 감으로 유추했던 과거와는 비교할 수 없을 만큼 향상되었습니다. EVS(Enhanced Voice Services) 같은 통신 코덱은 뛰어난 음질과 더불어 높은 안정성과 효율성을 보장합니다. 2014년 출시된 이래 EVS는 전화통신 분야의 사실상의 표준으로 자리 잡았지만, 여전히 한쪽 귀에 수화기를 대고 통화한다는 전제를 기반으로 작동하기 때문에 기본적으로는 모노 사운드에 초점이 맞춰져 있습니다. 모노 사운드는 많은 상황에 적합하긴 하지만, 급변하는 기술 발전으로 생겨난 다양한 통화 관련 기능들을 모두 지원하지는 않습니다.
모바일 네트워크를 위한 공간음향
오늘날에는 이어버드, 사운드바, 차량 및 노트북 스피커 등 다양한 오디오 기기들이 출시되고 있으며, 실제로 많은 사람들이 통화나 온라인 회의 시 이들 기기를 사용합니다. 이러한 기기의 대부분은 스테레오나 몰입형 사운드를 지원하지만, 정작 통화에는 거의 활용되지 않고 있는 실정입니다. 이 문제를 해결할 수 있는 새로운 기술이 바로 IVAS(Immersive Voice and Audio Services) 입니다. IVAS는 EVS의 확장형 코덱으로 모바일 네트워크 상에서 스테레오 및 몰입형 오디오의 전송을 지원합니다. 통신 코덱으로서 공간 오디오의 고효율 압축에 최적화되어 있으며, 이는 모바일 네트워크에서 매우 중요한 요소입니다. 기존의 통신 코덱이 주로 모노 신호에 대한 압축 효율성과 대역폭 향상에 집중해 왔다면, IVAS는 그 한계를 뛰어넘어 스테레오 신호뿐 아니라 멀티채널, 앰비소닉스(Ambisonics), 객체 기반 오디오, 새로운 메타데이터 기반 공간음향 포맷인 MASA 등 몰입형 신호를 지원합니다.
새로운 통신 환경 조성
IVAS 코덱과 적절한 기기를 통한 몰입형 공간 오디오 전송은 새로운 차원의 통신 환경을 만들어줍니다.
- 몰입형 통화: 회의 참가자는 몰입형 오디오 장면을 포착하고 공유할 수 있습니다. 이 기능은 행사나 야외 활동 등 몰입감 있는 경험을 생생하게 공유하는 데 이상적입니다.
- 즉석 회의: 테이블 위에 전화기를 놓는 것만으로도 주변의 음향 이미지를 생생하게 포착해 수신기기에 실감나게 렌더링할 수 있습니다. 이를 통해 화자별 음성 인식과 음성 및 현장음 구분이 훨씬 수월해집니다.
- 다자간 회의: 다수의 참가자 음성을 개별 스트림으로 전송하고, 수신기기에서 이를 입체적으로 렌더링하며 동시에 전송되는 영상과 싱크를 맞춥니다. 사용자는 참가자별 음량이나 음성의 위치를 조정할 수 있습니다. 이 외에도 중간 통화 서버를 통해 여러 지역에서 접속한 참가자들을 하나의 몰입형 가상 장면으로 통합시킬 수도 있습니다.
이러한 기능은 비즈니스 통화뿐 아니라 행사 현장이나 야외 활동의 몰입형 경험을 공유하는 데에도 이상적입니다. IVAS는 사무실, 가정, 차량 등 다양한 환경을 연결하는 데 적합하며, 도시, 산업, 야외 환경을 하나의 몰입형 장면으로 통합하는 기능도 제공합니다. 이로 인해 청취에 수반되는 노력과 피로도는 현저히 감소하게 됩니다.
IVAS는 SMS, iMessage, RCS 등 여전히 널리 사용되는 모노 채널 오디오 메시지에 대한 몰입형 기능도 지원합니다.
IVAS는 최근 3GPP에 의해 5G Advanced(Release 18) 네트워크 기능으로 채택되었습니다. 세계적으로 저명한 오디오 기술 연구기관인 프라운호퍼 IIS는 11개 기업이 참여한 ‘IVAS 공공 협력(IVAS Public Collaboration)’ 프로젝트에 핵심적인 기여를 했습니다.