RoEx Automixはどのように機能しているのか
2022/10/13
この記事では、私たちのRoEx Automix技術の裏側を覗いて、あなたがどのように音声を処理して、数日ではなく数分でプロフェッショナルでバランスの取れたサウンドミックスを提供するかのアイデアをお伝えします。
AI音楽ミキシングとマスタリングによるオーディオ革命
オーディオミキシングの分野は複雑さに満ちています。多様な音の要素のバランスを取ることは、世界中の音響エンジニアが直面する課題です。主要な問題の一つは『マスキング』であり、これは例えばキックドラムなどの音源が、ベースギターのような大きな要素によって聞こえなくなる現象です。これに対処するため、エンジニアはさまざまな技術やオーディオ効果を駆使し、それぞれの音に独自の存在感を持たせた調和の取れたバランスの良いミックスを作成します。
音量レベルの微調整や、ステレオポジショニング(『パンニング』)の管理、特定の周波数を変調するためのイコライゼーション(EQ)の適用は重要なステップです。動的レンジ圧縮(DRC)は、音源の音量を制御するために使用される技術であり、重要な役割を果たします。しかし、この複雑なプロセスが自動化され、手作業の介入が不要になり、エラーの余地が少なくなるとしたら、想像してみてください。
AI音楽ミキシングの世界へようこそ。ここでは人工知能が指揮者として機能します。AIはオーディオミキシングとマスタリングシステムの過程を効率化・強化し、完璧にバランスの取れた高品質のオーディオを実現します。私たちがAIによる自動化されたオーディオミキシングとマスタリングの魅力的な領域に深く足を踏み入れる中、音楽制作の未来を探りましょう。
私たちのミキシングシステム
Automix、私たちの革新的なAI音楽ミキシングシステムは、オーディオミキシングを再定義し、完璧なオーディオ効果設定の決定という複雑なプロセスを自動化します。空間バランスを綿密に維持し、マスキングを最小限に抑え、ミキシングのために提出された任意のマルチトラックオーディオ全体で知覚される音量を調整します。

高度な音楽情報取得(MIR)技術を利用して、Automixは、影響を及ぼすすべての他のトラック/ステムの文脈内で、各トラックまたはステムを徹底的に分析します。この分析段階は、上の図に示されている『マルチトラック分析モジュール』で行われます。ここでは、リアルタイムで処理可能な多くのマルチトラックオーディオ機能を分析し、抽出します。
各トラック/ステムから抽出されたマルチトラック機能は、その後、確立されたミックスエンジニアリングルールを理解するAIモデルに供給されます。このモデルは、提出された各トラック/ステムの音響特性、相互作用、および音楽スタイルに基づいて、音量、EQ、DRC、パンニング、リバーブの最適な設定を判別します。したがって、Automixは、個々のステムとフルマルチトラックを効果的にミックスする能力に長けています。
モデルが最適なマルチトラックオーディオ設定を最終的に決定すると、これらの設定(EQ、DRC、パンニング、音量)が各トラック/ステムに適用されます。次に、マルチトラックオーディオは結合され、マスタリングのために必要なヘッドルームを確保するために-3dBFsにピークノーマライズされます。
さらに、同様の技術に基づいたマスタリングモジュールも開発しましたが、その使用は任意です。このモジュールは、ミックスされたオーディオとユーザーの音量の好みを考慮して、私たちのAIマスタリング信号チェーンを適用します。最終製品は、波形、FLAC、またはmp3ファイルで、完全に最適化され、Spotify、Soundcloud、またはBandcampのプラットフォームで配布される準備が整っています。
私たちのAPIの紹介: Tonn - AI音楽ミキシングとマスタリングの推進
私たちは、Tonn APIの一環として、強力なGoogle Cloud Platform (GCP)上に革新的なAutomix技術をホスティングしています。これはスケーラブルでコンテナ化されたアプリケーションとして機能し、特定の時間に必要なミックス数に応じて調整可能です。この柔軟性により、成長する需要に合わせて効率的にスケールアップでき、顧客の独自のニーズに応えることが可能です。さらに、外部アプリケーションが同時に複数のミックスタスクを開始できるようになり、大規模なマルチトラックプロジェクトのミキシングプロセスを大幅に加速させます。

具体的な例を挙げて説明しましょう。40のトラック(10のギタートラック、10のドラムトラック、10のストリングトラック、10のシンセトラック)から成るマルチトラックを想像してみてください。私たちのTonn APIを使えば、ユーザーは各楽器グループのミックスタスクを同時に実行できます。各ギター、ドラム、ストリング、およびシンセのミックスが完了した後、ユーザーはこれらのミックスから最終的なミックスとマスタートラックをコンパイルできます。これは上の図に示されています。
私たちの現在のベンチマークは、Tonn APIを使用して、私たちのRoEx Automix技術が約4.5分で3分間の8トラックをミックスできることを示しています。私たちはこのパフォーマンスを向上させるために絶えず努力しています。Tonn APIの力を体験したい場合は、APIキーを取得するためにご連絡ください。Tonn APIのドキュメントはこちらでご覧いただけます。
RoExリアルタイムミックス: リアルタイムアプリケーション向けのAI音楽ミキシング
Automixの背後にある画期的な技術を基に、私たちは現在RoExリアルタイムミックスを開発中です。これはリアルタイムオーディオの課題に対応するように設計されたシステムです。複数のオーディオチャンネルを同時に処理し、各チャンネルを分析し、オーディオ効果をその場で適用し、マスキングを減らし、聴覚の明瞭さを高めることを目指します。
ライブ放送、ビデオゲーム、またはVRのように、時間とともに複数の音源が動的に相互作用するアプリケーションに最適なRoExリアルタイムミックスは、変化する刺激に適応し反応することができます。たとえば、ビデオゲームの主人公が話している場合、このシステムは自動的に彼らのセリフを強調し、他の音を微妙にフィルタリングしてマスキングを最小限に抑えます。
結論: AI音楽ミキシングによる音楽制作の未来
伝統的な音楽制作や『ミキシング』は、音楽制作とは異なるスキルセットを必要とする労働集約型のプロセスです。通常、様々な音源が多く含まれ、それぞれが異なる環境で生成され、特異な属性を持っており、各音源を明確に聞こえるようにして、調和のとれた明瞭な音のブレンドを提供することを目的としています。これを実現するバランスを取得することは困難であり、プロの音響エンジニアのスキルを通常必要とします。
しかし、Automixのような自動化された音楽制作ツールの登場は、この状況を変えています。AI音楽ミキシングの力を活用することで、これらのツールは音楽制作の複雑な側面に取り組み、ミュージシャンがコンテンツを意図した観客に迅速かつ簡単に、より低コストで届けることを可能にします。これは、彼ら自身でミキシングとマスタリングを行う場合や、専門のサービスに外注する場合よりもはるかに迅速です。
この技術は音楽業界への参入障壁を下げ、技術的な背景を持たない人々にも音楽のキャリアを持つことを可能にします。私たちが前進するにつれ、RoEx AutomixのようなAI音楽ミキシングとマスタリングシステムは、音楽制作を民主化し、世界中のアーティストに新たな創造的表現の扉を開くことを約束します。