Comment RoEx Automix fonctionne en coulisses

13 oct. 2022

Dans cet article, nous allons jeter un coup d'œil sous le capot de notre technologie RoEx Automix pour vous donner une idée de la façon dont nous traitons votre audio afin de vous restituer un mixage professionnel et équilibré en quelques minutes au lieu de jours.

Révolutionner l'audio avec le mixage et le mastering de musique par IA

Le domaine du mixage audio est rempli de complexités. Équilibrer les différentes composantes sonores est un défi auquel sont confrontés les ingénieurs du son dans le monde entier. Un problème clé est le 'masquage', un phénomène où une source sonore, disons une grosse caisse, devient inaudible à cause d'un élément plus fort, comme une guitare basse. Pour y remédier, les ingénieurs utilisent diverses techniques et effets audio, créant un mix équilibré et harmonieux où chaque son a sa présence distincte.


Ajuster les niveaux de volume, gérer le positionnement stéréo ou 'panning', et appliquer l'égalisation (EQ) pour moduler des fréquences spécifiques sont des étapes critiques. La compression de la plage dynamique (DRC), une technique utilisée pour contrôler le volume des sources sonores, joue également un rôle important. Mais imaginez si ce processus complexe pouvait être automatisé, éliminant l'intervention manuelle et laissant moins de place à l'erreur.


Bienvenue dans le monde du mixage de musique par IA, où l'intelligence artificielle joue le maestro. L'IA dans les systèmes de mixage et de mastering audio simplifie et améliore le processus de mixage, aboutissant à un audio parfaitement équilibré et de haute qualité. Rejoignez-nous alors que nous plongeons dans le domaine fascinant du mixage et du mastering audio automatisés alimentés par l'IA, et explorons l'avenir de la production musicale.

Notre système de mixage

Automix, notre système innovant de mixage de musique par IA, redéfinit le mixage audio en automatisant le processus complexe de détermination des réglages d'effets audio parfaits. Il maintient méticuleusement l'équilibre spatial, minimise le masquage et régule la perception du volume sur n'importe quel audio multitrack soumis au mixage.

En utilisant des techniques avancées de récupération d'information musicale (MIR), Automix analyse minutieusement chaque piste ou élément dans le contexte de toutes les autres pistes/éléments qui l'influencent. Cette étape analytique a lieu dans le 'Module d'analyse multitrack', comme illustré dans la figure ci-dessus. Ici, nous analysons et extrayons une multitude de caractéristiques audio multitrack, dont certaines peuvent être traitées en temps réel, offrant le potentiel pour un mixage audio en temps réel.


Les caractéristiques multitrack extraites de chaque piste/élément sont ensuite alimentées dans un modèle IA qui comprend les règles de mixage établies. Ce modèle discerne les réglages les plus adaptés pour le volume, l'EQ, la DRC, le panning et la réverbération en fonction des caractéristiques sonores de chaque piste/élément soumis, de leur interaction et du style musical. Par conséquent, Automix présente une capacité adroite à mixer efficacement des éléments individuels et des multitrack complets.


Une fois que le modèle a déterminé les meilleurs réglages audio multitrack, ces réglages - EQ, DRC, panning et volume - sont appliqués à chaque piste/élément. L'audio multitrack est ensuite combiné et normalisé à -3 dBFs pour réserver la marge nécessaire au mastering.


De plus, nous avons développé un module de mastering basé sur une technologie similaire, bien que son utilisation soit optionnelle. Ce module prend en compte l'audio mixé et la préférence de volume de l'utilisateur pour appliquer notre chaîne de signal de mastering par IA. Le produit final est un fichier wave, FLAC ou mp3, entièrement optimisé et prêt à être distribué sur des plateformes comme Spotify, Soundcloud ou Bandcamp.

Présentation de notre API : Tonn - Powering AI Music Mixing and Mastering

Nous hébergeons notre technologie révolutionnaire Automix sur la robuste Google Cloud Platform (GCP) dans le cadre de notre API Tonn. Elle fonctionne comme une application scalable, containerisée, capable de s'adapter au nombre de mixages nécessaires à tout moment. Cette flexibilité nous permet d'augmenter efficacement notre capacité pour répondre à la demande croissante et aux besoins uniques de nos clients. En outre, elle permet à toute application externe d'initier plusieurs tâches de mixage simultanément, accélérant considérablement le processus de mixage de projets multitrack volumineux.

Prenons un exemple pratique pour illustrer cela : imaginez un multitrack composé de 40 pistes - 10 pistes de guitare, 10 pistes de batterie, 10 pistes de cordes et 10 pistes de synthétiseur. Avec notre API Tonn, les utilisateurs peuvent créer une tâche de mix pour chaque groupe instrumental à exécuter simultanément. Après que les mixages individuels de guitare, de batterie, de cordes et de synthétiseur soient terminés, les utilisateurs peuvent ensuite compiler un mix final et une piste master à partir de ces mixages, comme le montre la figure ci-dessus.


Notre référence actuelle utilisant l'API Tonn démontre que notre technologie RoEx Automix peut mixer huit pistes d'environ trois minutes chacune (durée typique d'une chanson pop) en environ 4,5 minutes. Nous nous efforçons continuellement d'améliorer cette performance. Si vous êtes intéressé par l'expérience du pouvoir de l'API Tonn de première main, veuillez nous contacter pour une clé API. Vous pouvez trouver la documentation de l'API Tonn ici.

RoEx Mix Realtime : Mixage de musique par IA pour des applications en temps réel

S'appuyant sur la technologie transformative derrière Automix, nous développons actuellement RoEx Mix Realtime - un système conçu pour relever les défis audio en temps réel. Il est équipé pour gérer plusieurs canaux audio simultanément, analyser chaque canal et appliquer des effets audio en temps réel, visant à réduire le masquage et améliorer la clarté auditive.


Idéal pour des applications tels que la diffusion en direct, les jeux vidéo ou la réalité virtuelle, où plusieurs sources sonores interagissent dynamiquement au fil du temps, RoEx Mix Realtime peut s'adapter et réagir aux stimuli changeants. Par exemple, si le personnage principal d'un jeu vidéo parle, le système mettrait automatiquement en valeur son discours tout en filtrant subtilement d'autres sons pour minimiser le masquage.

Conclusion : L'avenir de la production musicale avec le mixage de musique par IA

La production musicale traditionnelle ou 'mixage' est un processus intensif en main-d'œuvre qui nécessite un ensemble de compétences différent de celles de la création musicale. Impliquant généralement de nombreuses sources sonores, chacune générée dans un environnement unique et avec des attributs distincts, l'objectif est de permettre à chaque source d'être entendue clairement, contribuant à un mélange harmonieux et net de sons. Atteindre cet équilibre est difficile et nécessite généralement les compétences d'un ingénieur du son professionnel.

Cependant, l'avènement d'outils de production musicale automatisés comme Automix transforme ce paysage. En tirant parti de la puissance du mixage de musique par IA, ces outils s'attaquent aux aspects complexes de la production musicale, permettant aux musiciens de livrer leur contenu à leur public cible plus rapidement, facilement, et de manière plus économique que s'ils avaient entrepris le mixage et le mastering eux-mêmes ou externalisé à des services professionnels.

Cette technologie abaisse les barrières à l'entrée dans l'industrie musicale, rendant une carrière dans la musique plus accessible à ceux qui n'ont pas de formation technique. À mesure que nous avançons, les systèmes de mixage et de mastering par IA comme RoEx Automix promettent de démocratiser la production musicale, ouvrant de nouvelles portes d'expression créative pour les artistes du monde entier.