RoEx Automix가 내부에서 작동하는 방식

2022. 10. 13.

이번 포스트에서는 RoEx Automix 기술의 내부를 들여다보며 오디오를 처리하여 며칠이 아니라 몇 분 안에 전문적이고 균형 잡힌 사운드 믹스를 제공하는 방법에 대한 아이디어를 드리겠습니다.

AI 음악 믹싱 및 마스터링으로 오디오 혁신하기

오디오 믹싱 분야는 복잡성으로 가득 차 있습니다. 다양한 음향 요소의 균형을 맞추는 것은 전세계 음향 엔지니어들이 직면한 도전 과제입니다. 주요 문제 중 하나는 '마스킹'인데, 이는 킥 드럼과 같은 사운드 소스가 베이스 기타와 같은 더 큰 요소 때문에 들리지 않게 되는 현상입니다. 이를 해결하기 위해 엔지니어들은 다양한 기술과 오디오 효과를 활용하여 각 사운드가 독특한 존재감을 가지는 조화롭고 균형 잡힌 믹스를 만듭니다.

볼륨 레벨을 미세 조정하고, 스테레오 위치 또는 '팬닝'을 관리하며, 특정 주파수를 조절하기 위해 이퀄라이제이션(EQ)을 적용하는 것은 중요한 단계입니다. 소리 소스의 음량을 제어하기 위해 사용되는 동적 범위 압축(DRC) 기법 또한 중요한 역할을 합니다. 하지만 이 복잡한 과정이 자동화되어 수동 개입을 없애고 오류 가능성을 줄일 수 있다면 어떨까요?

AI 음악 믹싱의 세계에 오신 것을 환영합니다. 여기서는 인공지능이 지휘자 역할을 합니다. 오디오 믹싱 및 마스터링 시스템의 AI는 믹싱 프로세스를 간소화하고 향상시켜 완벽하게 균형 잡힌 고품질 오디오를 만듭니다. AI에 의해 구동되는 자동화된 오디오 믹싱 및 마스터링의 매혹적인 영역을 탐구하며 음악 제작의 미래를 함께 살펴보세요.

우리의 믹싱 시스템

우리가 혁신적인 AI 음악 믹싱 시스템인 Automix는 완벽한 오디오 효과 설정을 자동으로 결정하는 복잡한 프로세스를 자동화하여 오디오 믹싱을 재정의합니다. 이 시스템은 공간적 균형을 세심하게 유지하고, 마스킹을 최소화하며, 믹싱을 위해 제출된 모든 멀티트랙 오디오에서 인식된 음량을 조절합니다.

고급 음악 정보 검색(MIR) 기술을 활용하여, Automix는 모든 다른 트랙/스탬 영향을 받는 맥락에서 각 트랙이나 스탬을 철저히 분석합니다. 이 분석 단계는 위의 그림에 나타난 '멀티트랙 분석 모듈'에서 이루어집니다. 여기서 우리는 다양한 멀티트랙 오디오 기능을 분석하고 추출하며, 이 중 일부는 실시간으로 처리되어 실시간 오디오 믹싱을 위한 가능성을 제공합니다.

각 트랙/스탬에서 추출한 멀티트랙 기능은 확립된 믹스 엔지니어링 규칙을 이해하는 AI 모델에 입력됩니다. 이 모델은 제출된 각 트랙/스탬의 음향 특성, 상호작용 및 음악 스타일에 따라 볼륨, EQ, DRC, 팬닝 및 리버브에 대한 가장 적합한 설정을 식별합니다. 결과적으로, Automix 는 개별 스탬과 전체 멀티트랙을 효과적으로 믹싱하는 능력을 발휘합니다.

모델이 최상의 멀티트랙 오디오 설정을 최종 결정하면 이러한 설정 - EQ, DRC, 팬닝 및 음량 -가 각 트랙/스탬에 적용됩니다. 멀티트랙 오디오는 결합된 후 마스터링을 위한 필요한 헤드룸을 확보하기 위해 -3dBFs로 피크 정규화됩니다.

또한, 우리는 유사한 기술 기반의 마스터링 모듈을 개발했으며, 이 모듈은 선택사항입니다. 이 모듈은 믹싱된 오디오 및 사용자의 음량 선호도를 고려하여 우리의 AI 마스터링 신호 체인을 적용합니다. 최종 제품은 플랫폼에서 배포되기 위해 완전히 최적화된 WAV, FLAC 또는 mp3 파일이 됩니다 Spotify, Soundcloud 또는 Bandcamp.

우리의 API 소개: Tonn - AI 음악 믹싱 및 마스터링을 지원하는 시스템

우리는 우리의 혁신적인 Automix 기술을 robust Google Cloud Platform (GCP)에서 Tonn API의 일환으로 호스팅합니다. 이는 필요할 때마다 믹스의 수에 조정할 수 있는 확장 가능한 컨테이너화된 애플리케이션으로 작동합니다. 이러한 유연성 덕분에 우리는 성장하는 수요에 맞춰 효율적으로 확장할 수 있으며 고객의 고유한 요구를 충족할 수 있습니다. 나아가 어떤 외부 애플리케이션도 동시에 여러 믹스 작업을 시작할 수 있어 대규모 멀티트랙 프로젝트의 믹싱 프로세스를 현저히 가속화할 수 있습니다.

이를 설명하기 위해 실용적인 예를 들어 보겠습니다: 40개의 트랙으로 구성된 멀티트랙을 상상해 보세요 - 10개의 기타 트랙, 10개의 드럼 트랙, 10개의 스트링 트랙, 그리고 10개의 신스 트랙. 우리의 Tonn API를 사용하면 사용자는 각 악기 그룹에 대한 믹스 작업을 동시에 수행할 수 있습니다. 개별 기타, 드럼, 스트링 및 신스 믹스가 완료되면 사용자는 이 믹스에서 최종 믹스 및 마스터링된 트랙을 편집할 수 있습니다, 이는 위의 그림에 나타나 있습니다.

현재 Tonn API를 사용하여 얻은 벤치마크에 따르면 우리의 RoEx Automix 기술은 세 곡의 3분 트랙을 약 4.5분에 믹싱할 수 있습니다(일반적인 팝송 길이). 우리는 이 성능을 향상시키기 위해 계속 노력하고 있습니다. Tonn API의 힘을 직접 경험하고 싶다면 API 키를 요청해 주세요. Tonn API 문서는 여기에서 찾으실 수 있습니다.

RoEx 실시간 믹스: 실시간 애플리케이션을 위한 AI 음악 믹싱

Automix의 변혁적인 기술을 바탕으로 현재 RoEx 실시간 믹스를 개발 중이며, 이는 실시간 오디오 문제를 다루도록 설계된 시스템입니다. 이 시스템은 여러 오디오 채널을 동시에 처리하고, 각 채널을 분석하며, 지속적으로 오디오 효과를 적용하여 마스킹을 줄이고 청각적 선명도를 높이도록 설정되어 있습니다.

라이브 방송, 비디오 게임, 또는 VR과 같은 여러 음료원이 동적으로 시간에 따라 상호작용하는 애플리케이션에 적합한 RoEx 실시간 믹스는 변화하는 자극에 적응하고 반응할 수 있습니다. 예를 들어, 비디오 게임의 주요 캐릭터가 말하고 있는 경우 시스템은 자동으로 그들의 발언을 강조하면서 다른 소리를 미세하게 필터링하여 마스킹을 최소화할 것입니다.

결론: AI 음악 믹싱을 통한 음악 제작의 미래

전통적인 음악 제작 또는 '믹싱'은 음악 창작보다 다른 기술 세트를 요구하는 고된 과정입니다. 일반적으로 여러 소리 소스가 고유한 환경에서 생성되며 각기 다른 특성을 가진 경우가 많습니다. 목표는 각 소스가 명확하게 들릴 수 있도록 하여 조화롭고 선명한 사운드 블렌드에 기여하는 것입니다. 이러한 균형을 이루는 것은 도전적이며 일반적으로 전문 소리 엔지니어의 기술을 필요로 합니다.

그러나 Automix와 같은 자동화된 음악 제작 도구의 출현은 이 풍경을 변화시키고 있습니다. AI 음악 믹싱의 힘을 활용함으로써 이러한 도구는 음악 제작의 복잡한 측면을 다루어 뮤지션이 콘텐츠를 더 빠르고 쉽게, 그리고 비용 효율적으로 전달할 수 있게 돕습니다. 이는 그들이 직접 믹싱 및 마스터링을 하거나 전문 서비스를 아웃소싱하는 것보다 더 유리합니다.

이 기술은 음악 산업 진입 장벽을 낮추어 비기술적 배경을 가진 사람들에게 음악 경력을 더 쉽게 열 수 있습니다. 앞으로 나아가면서 RoEx Automix와 같은 AI 음악 믹싱 및 마스터링 시스템은 음악 제작을 민주화하여 전 세계 아티스트들에게 새로운 창작 표현의 문을 열어줄 것을 약속합니다.