Como o RoEx Automix funciona por trás das cenas

Neste post, vamos dar uma olhada nos bastidores da nossa tecnologia RoEx Automix para dar a você uma ideia de como tratamos seu áudio para devolver uma mixagem profissional e equilibrada em minutos, em vez de dias.

Revolucionando o Áudio com Mixagem e Masterização Musical por IA

O campo da mixagem de áudio é repleto de complexidades. Equilibrar componentes sonoros diversos é um desafio enfrentado por engenheiros de som no mundo todo. Uma questão-chave é o "mascaramento", um fenômeno em que uma fonte sonora, como um bumbo, torna-se inaudível devido a um elemento mais alto, como um contrabaixo. Para lidar com isso, engenheiros empregam várias técnicas e efeitos de áudio, criando uma mixagem harmoniosa e equilibrada em que cada som tem sua presença distinta.


O ajuste fino dos níveis de volume, o gerenciamento do posicionamento estéreo ou "pan", e a aplicação de equalização (EQ) para modular frequências específicas são etapas críticas. A compressão de faixa dinâmica (DRC), uma técnica usada para controlar o volume percebido das fontes sonoras, também desempenha um papel significativo. Mas imagine se esse processo intricado pudesse ser automatizado, eliminando a intervenção manual e deixando menos margem para erro.


Bem-vindo ao mundo da Mixagem Musical por IA, onde a inteligência artificial assume a regência. Sistemas de IA para mixagem e masterização de áudio simplificam e aprimoram o processo de mixagem, resultando em áudio perfeitamente equilibrado e de alta qualidade. Junte-se a nós enquanto mergulhamos no fascinante domínio da mixagem e masterização automatizadas por IA e exploramos o futuro da produção musical.

Nosso Sistema de Mixagem

O Automix, nosso inovador sistema de mixagem musical por IA, redefine a mixagem de áudio ao automatizar o processo complexo de determinar as configurações ideais de efeitos de áudio. Ele mantém meticulosamente o equilíbrio espacial, minimiza o mascaramento e regula o volume percebido em qualquer áudio multifaixa enviado para mixagem.

Aproveitando técnicas avançadas de recuperação de informação musical (MIR), o Automix analisa minuciosamente cada faixa ou stem no contexto de todas as outras faixas/stems que a influenciam. Essa etapa analítica ocorre no "Módulo de Análise Multifaixa", como mostrado na figura acima. Aqui, analisamos e extraímos uma multitude de características de áudio multifaixa, algumas das quais podem ser processadas em tempo real, oferecendo potencial para mixagem de áudio em tempo real.


As características multifaixa extraídas de cada faixa/stem são então alimentadas em um modelo de IA que compreende regras estabelecidas de engenharia de mixagem. Esse modelo identifica as configurações mais adequadas para volume, EQ, DRC, pan e reverb com base nas características sonoras de cada faixa/stem enviada, na interação entre elas e no estilo musical. Consequentemente, o Automix demonstra uma capacidade habilidosa de mixar stems individuais e multifaixas completas de forma eficaz.


Após a determinação final, pelo modelo, das melhores configurações de áudio multifaixa, essas configurações — EQ, DRC, pan e loudness — são aplicadas a cada faixa/stem. O áudio multifaixa é então combinado e normalizado por pico para -3dBFs, a fim de reservar a headroom necessária para a masterização.


Além disso, desenvolvemos um módulo de masterização baseado em tecnologia semelhante, embora seu uso seja opcional. Esse módulo leva em conta o áudio mixado e a preferência de loudness do usuário para aplicar nossa cadeia de sinal de masterização por IA. O produto final é um arquivo wave, FLAC ou mp3, totalmente otimizado e pronto para distribuição em plataformas como Spotify, Soundcloud ou Bandcamp.

Apresentando Nossa API: Tonn - Impulsionando Mixagem e Masterização Musical por IA

Hospedamos nossa tecnologia revolucionária Automix na robusta Google Cloud Platform (GCP) como parte da nossa Tonn API. Ela opera como uma aplicação escalável e conteinerizada, capaz de se ajustar ao número de mixagens necessárias em qualquer momento. Essa flexibilidade nos permite escalar com eficiência para acompanhar a demanda crescente e atender às necessidades únicas dos nossos clientes. Além disso, ela permite que qualquer aplicação externa inicie múltiplas tarefas de mixagem simultaneamente, acelerando significativamente o processo de mixagem de grandes projetos multifaixa.

Vamos usar um exemplo prático para ilustrar: imagine uma multifaixa composta por 40 faixas — 10 faixas de guitarra, 10 de bateria, 10 de cordas e 10 de synths. Com nossa Tonn API, os usuários podem criar uma tarefa de mixagem para cada grupo instrumental e executá-las em paralelo. Depois que as mixagens individuais de guitarra, bateria, cordas e synth estiverem concluídas, os usuários podem então compilar uma mixagem final e uma faixa masterizada a partir dessas mixagens, como mostrado na figura acima.


Nosso benchmark atual usando a Tonn API demonstra que nossa tecnologia RoEx Automix consegue mixar oito faixas de três minutos cada (duração típica de uma música pop) em aproximadamente 4,5 minutos. Estamos continuamente nos esforçando para melhorar esse desempenho. Se você tiver interesse em experimentar o poder da Tonn API em primeira mão, entre em contato conosco para obter uma chave de API. Você pode encontrar a documentação da Tonn API aqui.

RoEx Realtime Mix: Mixagem Musical por IA para Aplicações em Tempo Real

Com base na tecnologia transformadora por trás do Automix, estamos desenvolvendo atualmente o RoEx Realtime Mix — um sistema projetado para enfrentar desafios de áudio em tempo real. Ele está equipado para lidar com múltiplos canais de áudio simultaneamente, analisar cada canal e aplicar efeitos de áudio em tempo real, visando reduzir o mascaramento e aumentar a clareza auditiva.


Ideal para aplicações como transmissão ao vivo, videogames ou VR, nas quais múltiplas fontes sonoras interagem dinamicamente ao longo do tempo, o RoEx Realtime Mix pode se adaptar e responder a estímulos em mudança. Por exemplo, se o personagem principal de um videogame estiver falando, o sistema destacaria automaticamente sua fala enquanto filtraria sutilmente outros sons para minimizar o mascaramento.

Conclusão: O Futuro da Produção Musical com Mixagem Musical por IA

A produção musical tradicional, ou "mixagem", é um processo intensivo em trabalho que exige um conjunto de habilidades diferente da criação musical. Normalmente envolvendo inúmeras fontes sonoras, cada uma gerada em um ambiente único e com atributos distintos, o objetivo é permitir que cada fonte seja ouvida com clareza, contribuindo para uma combinação harmoniosa e nítida de sons. Alcançar esse equilíbrio é desafiador e, em geral, requer as habilidades de um engenheiro de som profissional.

No entanto, o advento de ferramentas automatizadas de produção musical, como o Automix, está transformando esse cenário. Ao aproveitar o poder da mixagem musical por IA, essas ferramentas lidam com os aspectos complexos da produção musical, permitindo que músicos entreguem seu conteúdo ao público-alvo de forma mais rápida, fácil e econômica do que se tivessem feito a mixagem e a masterização por conta própria ou terceirizado para serviços profissionais.

Essa tecnologia reduz as barreiras de entrada na indústria musical, tornando uma carreira na música mais acessível para quem não tem formação técnica. À medida que avançamos, sistemas de mixagem e masterização por IA como o RoEx Automix prometem democratizar a produção musical, abrindo novas portas de expressão criativa para artistas de todo o mundo.