RoEx Automix가 내부에서 작동하는 방식

이 글에서는 RoEx Automix 기술의 내부를 살펴보며, 여러분의 오디오를 어떻게 처리해 며칠이 아닌 몇 분 만에 전문적이고 균형 잡힌 믹스를 돌려드리는지 소개합니다.

AI 음악 믹싱 및 마스터링으로 오디오 혁신하기

오디오 믹싱 분야는 복잡성이 매우 큽니다. 다양한 사운드 구성 요소의 균형을 맞추는 일은 전 세계 사운드 엔지니어가 직면하는 과제입니다. 핵심 문제 중 하나는 '마스킹(masking)'으로, 예를 들어 킥 드럼 같은 음원이 베이스 기타처럼 더 큰 소리에 가려 들리지 않게 되는 현상입니다. 이를 해결하기 위해 엔지니어들은 다양한 기법과 오디오 이펙트를 사용하여, 각 소리가 고유한 존재감을 갖는 조화롭고 균형 잡힌 믹스를 만듭니다.


볼륨 레벨을 미세 조정하고, 스테레오 위치 조절인 '패닝(panning)'을 관리하며, 특정 주파수를 조절하기 위한 이퀄라이제이션(EQ)을 적용하는 것은 중요한 단계입니다. 음원의 크기를 제어하는 기법인 다이내믹 레인지 컴프레션(DRC)도 중요한 역할을 합니다. 그런데 이 복잡한 과정이 자동화되어 수작업 개입을 없애고 오류 가능성을 줄일 수 있다면 어떨까요?


인공지능이 지휘자가 되는 AI 음악 믹싱의 세계에 오신 것을 환영합니다. 오디오 믹싱 및 마스터링 시스템에서의 AI는 믹싱 과정을 간소화하고 향상시켜, 완벽하게 균형 잡힌 고품질 오디오를 만들어냅니다. AI로 구동되는 자동화 오디오 믹싱 및 마스터링의 매력적인 영역을 함께 살펴보며, 음악 제작의 미래를 탐구해 보세요.

우리의 믹싱 시스템

혁신적인 AI 음악 믹싱 시스템인 Automix는 완벽한 오디오 이펙트 설정을 결정하는 복잡한 과정을 자동화하여 오디오 믹싱을 새롭게 정의합니다. 믹싱을 위해 제출된 어떤 멀티트랙 오디오에서도 공간적 균형을 정교하게 유지하고, 마스킹을 최소화하며, 지각되는 라우드니스를 조절합니다.

고급 음악 정보 검색(MIR) 기법을 활용해 Automix는 각 트랙 또는 스템을, 해당 트랙/스템에 영향을 주는 다른 모든 트랙/스템의 맥락에서 철저히 분석합니다. 이 분석 단계는 위 그림에 표시된 '멀티트랙 분석 모듈(Multitrack Analysis Module)'에서 수행됩니다. 여기서 우리는 다양한 멀티트랙 오디오 특징을 분석하고 추출하며, 그중 일부는 실시간으로 처리할 수 있어 실시간 오디오 믹싱 가능성을 제공합니다.


각 트랙/스템에서 추출된 멀티트랙 특징은 확립된 믹스 엔지니어링 규칙을 이해하는 AI 모델로 입력됩니다. 이 모델은 제출된 각 트랙/스템의 음향적 특성, 상호작용, 음악 스타일을 바탕으로 볼륨, EQ, DRC, 패닝, 리버브의 가장 적합한 설정을 판별합니다. 그 결과 Automix 는 개별 스템과 전체 멀티트랙을 효과적으로 믹싱하는 뛰어난 능력을 보여줍니다.


모델이 최적의 멀티트랙 오디오 설정을 최종 결정하면, EQ, DRC, 패닝, 라우드니스 등의 설정이 각 트랙/스템에 적용됩니다. 이후 멀티트랙 오디오는 결합되고, 마스터링에 필요한 헤드룸을 확보하기 위해 -3dBFs로 피크 노멀라이즈됩니다.


또한 유사한 기술을 기반으로 한 마스터링 모듈도 개발했으며, 사용은 선택 사항입니다. 이 모듈은 믹싱된 오디오와 사용자의 라우드니스 선호도를 반영해 AI 마스터링 시그널 체인을 적용합니다. 최종 결과물은 배포에 최적화된 wave, FLAC 또는 mp3 파일이며, Spotify, Soundcloud, 또는 Bandcamp 같은 플랫폼에 바로 배포할 수 있습니다.

API 소개: AI 음악 믹싱 및 마스터링을 구동하는 Tonn

우리는 획기적인 Automix 기술을 Tonn API의 일부로, 강력한 Google Cloud Platform(GCP) 위에서 운영합니다. 이는 확장 가능한 컨테이너형 애플리케이션으로 동작하며, 특정 시점에 필요한 믹스 수에 맞춰 조정할 수 있습니다. 이러한 유연성 덕분에 증가하는 수요에 효율적으로 대응하고 고객의 고유한 요구를 충족할 수 있습니다. 더 나아가 외부 애플리케이션이 여러 믹스 작업을 동시에 시작할 수 있어, 대규모 멀티트랙 프로젝트의 믹싱 과정을 크게 가속화할 수 있습니다.

이를 설명하기 위해 실용적인 예를 들어보겠습니다. 40개 트랙으로 구성된 멀티트랙이 있다고 가정해 보죠. 기타 트랙 10개, 드럼 트랙 10개, 스트링 트랙 10개, 신스 트랙 10개입니다. Tonn API를 사용하면 사용자는 각 악기 그룹별로 믹스 작업을 만들어 동시에 실행할 수 있습니다. 개별 기타, 드럼, 스트링, 신스 믹스가 완료되면, 위 그림과 같이 이 믹스들을 바탕으로 최종 믹스와 마스터 트랙을 만들 수 있습니다.


Tonn API를 사용한 현재 벤치마크에 따르면, RoEx Automix 기술은 각각 3분 길이(일반적인 팝송 길이)의 8개 트랙을 약 4.5분 만에 믹싱할 수 있습니다. 우리는 이 성능을 지속적으로 개선하고 있습니다. Tonn API의 성능을 직접 경험해 보고 싶다면 API 키 발급을 위해 문의해 주세요. Tonn API 문서는 여기에서 확인할 수 있습니다.

RoEx Realtime Mix: 실시간 애플리케이션을 위한 AI 음악 믹싱

Automix의 혁신적인 기술을 바탕으로, 현재 우리는 실시간 오디오 과제를 해결하도록 설계된 RoEx Realtime Mix를 개발하고 있습니다. 이 시스템은 여러 오디오 채널을 동시에 처리하고, 각 채널을 분석하며, 즉시 오디오 이펙트를 적용해 마스킹을 줄이고 청취 명료도를 높이도록 구성되어 있습니다.


라이브 방송, 비디오 게임, VR처럼 여러 음원이 시간에 따라 동적으로 상호작용하는 애플리케이션에 이상적이며, RoEx Realtime Mix는 변화하는 자극에 적응하고 대응할 수 있습니다. 예를 들어 비디오 게임에서 주인공이 말하고 있다면, 시스템은 자동으로 해당 음성을 강조하고 다른 소리는 미묘하게 필터링해 마스킹을 최소화합니다.

결론: AI 음악 믹싱과 함께하는 음악 제작의 미래

전통적인 음악 제작, 즉 '믹싱'은 음악 창작과는 다른 기술 세트를 요구하는 노동집약적 과정입니다. 보통 서로 다른 환경에서 생성되고 고유한 특성을 가진 수많은 음원을 다루며, 목표는 각 소스가 선명하게 들리면서 조화롭고 또렷한 사운드 블렌드를 이루게 하는 것입니다. 이러한 균형을 달성하는 일은 어렵고, 일반적으로 전문 사운드 엔지니어의 기술이 필요합니다.

하지만 Automix와 같은 자동화 음악 제작 도구의 등장은 이 지형을 바꾸고 있습니다. AI 음악 믹싱의 힘을 활용함으로써 이러한 도구는 음악 제작의 복잡한 측면을 해결하고, 뮤지션이 직접 믹싱/마스터링을 하거나 전문 서비스에 외주를 맡길 때보다 더 빠르고 쉽게, 그리고 비용 효율적으로 자신의 콘텐츠를 의도한 청중에게 전달할 수 있게 합니다.

이 기술은 음악 산업의 진입 장벽을 낮춰, 기술적 배경이 부족한 사람들에게도 음악 커리어를 더 쉽게 접근 가능하게 만듭니다. 앞으로 RoEx Automix와 같은 AI 음악 믹싱 및 마스터링 시스템은 음악 제작을 민주화하여, 전 세계 아티스트에게 새로운 창작 표현의 문을 열어줄 것입니다.