Wie RoEx Automix im Hintergrund funktioniert

13.10.2022

In diesem Beitrag werfen wir einen Blick hinter die Kulissen unserer RoEx Automix Technologie, um Ihnen eine Vorstellung davon zu geben, wie wir Ihre Audiodaten behandeln, um Ihnen in Minuten anstelle von Tagen einen professionellen und ausgewogenen Mix zurückzugeben.

Die Revolutionierung von Audio mit KI-Musikmixing und Mastering

Das Feld des Audio-Mixings ist voller Komplexitäten. Das Ausbalancieren verschiedener Klanglelemente ist eine Herausforderung, mit der Toningenieure weltweit konfrontiert sind. Ein zentrales Problem ist das 'Maskieren', ein Phänomen, bei dem eine Klangquelle, sagen wir, eine Kick-Drum, aufgrund eines lauteren Elements, wie etwa einer Bassgitarre, unhörbar wird. Um dies zu bewältigen, setzen Ingenieure verschiedene Techniken und Audioeffekte ein, um einen harmonischen und ausgewogenen Mix zu erstellen, bei dem jeder Klang seine eigene Präsenz hat.

Das Feinabstimmen der Lautstärkepegel, das Verwalten der Stereo-Positionierung oder das 'Panning' sowie das Anwenden von Equalisation (EQ), um spezifische Frequenzen zu modulieren, sind kritische Schritte. Die Dynamikbereichskompression (DRC), eine Technik zur Steuerung der Lautstärke von Klangquellen, spielt ebenfalls eine wichtige Rolle. Aber stellen Sie sich vor, dieser komplexe Prozess könnte automatisiert werden, was manuelle Eingriffe überflüssig macht und weniger Raum für Fehler lässt.

Willkommen in der Welt des KI-Musikmixings, wo künstliche Intelligenz die Hauptrolle spielt. KI in Audio-Mixing- und Mastering-Systemen optimiert und verbessert den Mixing-Prozess, was zu perfekt ausgewogenem, hochwertigem Audio führt. Begleiten Sie uns, während wir in das faszinierende Gebiet der automatisierten Audiomischung und des Masterings durch KI eintauchen und die Zukunft der Musikproduktion erkunden.

Unser Mischsystem

Automix, unser innovatives KI-Musikmixing-System, definiert das Audiomixing neu, indem der komplexe Prozess der Bestimmung der perfekten Audioeffekteinstellungen automatisiert wird. Es gewährleistet akribisch den räumlichen Gleichgewicht, minimiert das Maskieren und regelt die wahrgenommene Lautstärke aller eingereichten Multitrack-Audios für das Mixing.

Durch die Nutzung fortgeschrittener Techniken zur Musikinformationsabruf (MIR) analysiert Automix jeden Track oder Stem im Kontext aller anderen Tracks/Stems, die ihn beeinflussen. Diese analytische Phase findet im 'Multitrack-Analysemodul' statt, wie in der obigen Abbildung dargestellt. Hier analysieren und extrahieren wir eine Vielzahl von Multitrack-Audioeigenschaften, von denen einige in Echtzeit verarbeitet werden können, was das Potenzial für Echtzeit-Audiomixing bietet.

Die Multitrack-Eigenschaften, die aus jedem Track/Stamm extrahiert werden, werden dann in ein KI-Modell eingespeist, das die etablierten Mixing-Engineering-Regeln versteht. Dieses Modell erkennt die am besten geeigneten Einstellungen für Lautstärke, EQ, DRC, Panning und Reverb basierend auf den klanglichen Eigenschaften jedes eingereichten Tracks/Stamms, deren Wechselspiel und dem Musikstil. Folglich zeigt Automix eine geschickte Fähigkeit, individuelle Stems und vollständige Multitracks effektiv zu mischen.

Nach der endgültigen Bestimmung des Modells der besten Multitrack-Audioeinstellungen werden diese Einstellungen - EQ, DRC, Panning und Lautstärke - auf jeden Track/Stamm angewendet. Das Multitrack-Audio wird dann kombiniert und auf -3dBFs Spitzen-normalisiert, um den notwendigen Headroom für das Mastering zu reservieren.

Darüber hinaus haben wir ein Mastering-Modul entwickelt, das auf ähnlicher Technologie basiert, dessen Verwendung jedoch optional ist. Dieses Modul berücksichtigt das gemischte Audio und die Lautstärkepräferenz des Benutzers, um unsere KI-Mastering-Signalverarbeitung anzuwenden. Das Endprodukt ist eine WAV-, FLAC- oder mp3-Datei, die vollständig optimiert und bereit für die Verbreitung auf Plattformen wie Spotify, Soundcloud oder Bandcamp ist.

Einführung unserer API: Tonn - Treiber für KI-Musikmixing und Mastering

Wir hosten unsere bahnbrechende Automix-Technologie auf der robusten Google Cloud Platform (GCP) als Teil unserer Tonn API. Es funktioniert als skalierbare, containerisierte Anwendung, die in der Lage ist, sich an die Anzahl der zu einem bestimmten Zeitpunkt benötigten Mischungen anzupassen. Diese Flexibilität erlaubt es uns, effizient zu skalieren, um die wachsende Nachfrage zu decken und die einzigartigen Bedürfnisse unserer Kunden zu erfüllen. Darüber hinaus ermöglicht es jede externe Anwendung, mehrere Mischaufgaben gleichzeitig zu starten, was den Mixing-Prozess großer Multitrack-Projekte erheblich beschleunigt.

Lassen Sie uns ein praktisches Beispiel zur Veranschaulichung nehmen: Stellen Sie sich ein Multitrack mit 40 Tracks vor - 10 Gitarren-Tracks, 10 Schlagzeug-Tracks, 10 Streicher-Tracks und 10 Synth-Tracks. Mit unserer Tonn API können Benutzer eine Mischaufgabe für jede instrumentale Gruppe erstellen, die gleichzeitig ausgeführt wird. Nachdem die einzelnen Mischungen von Gitarre, Schlagzeug, Streicher und Synth abgeschlossen sind, können die Benutzer einen finalen Mix und einen gemasterten Track aus diesen Mischungen zusammenstellen, wie in der obigen Abbildung dargestellt.

Unser aktueller Benchmark mit der Tonn API zeigt, dass unsere RoEx Automix-Technologie acht Tracks mit jeweils drei Minuten (typische Pop-Song-Dauer) in etwa 4,5 Minuten mischen kann. Wir streben ständig danach, diese Leistung zu verbessern. Wenn Sie daran interessiert sind, die Leistung von Tonn API aus erster Hand zu erleben, kontaktieren Sie uns bitte für einen API-Schlüssel. Sie finden die Tonn API-Dokumentation hier.

RoEx Realtime Mix: KI-Musikmixing für Echtzeitanwendungen

Aufbauend auf der transformativen Technologie hinter Automix entwickeln wir derzeit RoEx Realtime Mix - ein System, das entwickelt wurde, um Herausforderungen im Bereich Echtzeitaudio zu bewältigen. Es ist in der Lage, mehrere Audiokanäle gleichzeitig zu verarbeiten, jeden Kanal zu analysieren und Audioeffekte in Echtzeit anzuwenden, um das Maskieren zu reduzieren und die auditive Klarheit zu verbessern.

Ideal für Anwendungen wie Live-Übertragungen, Videospiele oder VR, wo mehrere Klangquellen dynamisch miteinander interagieren, kann RoEx Realtime Mix sich anpassen und auf sich ändernde Reize reagieren. Zum Beispiel, wenn die Hauptfigur in einem Videospiel spricht, würde das System automatisch ihre Sprache hervorheben und gleichzeitig andere Geräusche subtil filtern, um das Maskieren zu minimieren.

Fazit: Die Zukunft der Musikproduktion mit KI-Musikmixing

Traditionelle Musikproduktion oder 'Mixing' ist ein arbeitsintensiver Prozess, der andere Fähigkeiten erfordert als die Musikschöpfung. Typischerweise umfasst es zahlreiche Klangquellen, die alle in einer einzigartigen Umgebung und mit unterschiedlichen Eigenschaften erzeugt werden, mit dem Ziel, jede Quelle klar hörbar zu machen und zu einer harmonischen und klaren Klangmischung beizutragen. Dieses Gleichgewicht zu erreichen ist herausfordernd und erfordert typischerweise die Fähigkeiten eines professionellen Toningenieurs.

Der Aufstieg automatisierter Musikproduktionswerkzeuge wie Automix verändert jedoch dieses Bild. Durch die Nutzung der Macht des KI-Musikmixings bewältigen diese Werkzeuge die komplexen Aspekte der Musikproduktion, sodass Musiker ihre Inhalte schneller, einfacher und kostengünstiger an ihr Publikum liefern können, als wenn sie das Mixing und Mastering selbst übernommen oder an professionelle Dienstleistungen ausgelagert hätten.

Diese Technologie senkt die Einstiegshürden in die Musikindustrie und macht eine Karriere in der Musik für diejenigen zugänglicher, die keinen technischen Hintergrund haben. Während wir voranschreiten, versprechen KI-Musikmixing- und Mastering-Systeme wie RoEx Automix, die Musikproduktion zu demokratisieren und neue Türen für kreative Ausdrucksformen für Künstler auf der ganzen Welt zu öffnen.