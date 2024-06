Audio Restauration und Mastering mit Machine Learning

Der iZotope RX11 Advanced Audio Editor ist ein Segen, wenn es um das Retten von wichtigen Audioaufnahmen, das Mastering oder die Audio-Post-Production beim Film geht. Mit ausgeklügelten neuen KI-Funktionen erreicht die Software ein bislang ungeahntes Maß an Präzision und Klangqualität.

iZotope

Die Firma iZotope wurde 2001 von den MIT-Studenten Jeremy Todd und Mark Ethier gegründet und hat heute ihren Firmensitz in Boston, USA. Von Anfang an hat man sich stark auf intelligente Algorithmen für Audio-Restauration und Post-Production konzentriert. Insbesondere Algorithmen für das Denoising gehörten zu den wichtigsten Forschungsfeldern der US-Firma. Mit der Mastering-Software Ozone feierte man große Erfolge, während die Software RX für die Audio-Restauration vorgesehen ist. Machine-Learning-Algorithmen leisten dabei Erstaunliches: Selbst Hallfahnen können aus Sprachaufnahmen entfernt werden, ohne das Nutzsignal zu stark zu beeinträchtigen. iZotope wurde im Jahr 2023 von Native Instruments übernommen.

Überblick iZotope RX11 Advanced Audio Editor

iZotope RX11 Advanced ist mehr als ein simpler Audio-Editor. Ob Sprache, Dialog oder Musik, die Software bietet für alle Bereiche eine Vielzahl unterschiedlicher Plug-ins, die sich entweder innerhalb einer DAW oder standalone im iZotope RX11 Advanced-Editor nutzen lassen.

Die Vielzahl an Plug-ins ist mit dem Erscheinen von iZotope RX11 noch einmal deutlich gestiegen. Zum Test steht uns die Advanced-Version der Software.

Neue Funktionen in iZotope RX11 – Dialogue Isolate

Dialogue Isolate wurde verbessert und bietet nun noch mehr Möglichkeiten, Dialoge verständlich zu gestalten und von Hintergrundgeräuschen zu befreien oder sie davon abzuheben. Dialogue Isolate nutzt dazu Machine-Learning. Parameter wie Voice, Reverb und Noise sowie Sensivity sowie Quality ermöglichen es auch Einsteigern in die Materie, schnell zu sehr guten Ergebnissen zu gelangen. Erstmalig steht Dialogue Isolate auch in RX11 Standard zur Verfügung. Advanced-Nutzer freuen sich über den neuen High-Quality-Mode sowie Multiband-Processing.

Während Voice die Präsenz der Stimme im Mix verändert, lässt sich mit Reverb der Anteil des Halls verringern. Besonders bei Interviews in sehr halligen Umgebungen lässt sich somit die Qualität der Aufnahme deutlich verbessern. Noise senkt den Anteil an Hintergrundgeräuschen ab oder eliminiert ihn ganz.

Spectral Editor ARA

Der Spectral Editor kann nun direkt in Logic aufgerufen werden, um Audiomaterial ohne das Verlassen der DAW zu bearbeiten. Weitere DAWs sollen folgen. Leider funktioniert die Einbindung derzeit nur mit Intel Macs oder an Macs mit M-Prozessoren innerhalb von Rosetta.

Das ist allerdings nicht iZotope RX11 Advanced anzulasten, sondern Logic Pro 11. Apple hat es leider bislang versäumt, der nativen Version von Logic Pro ARA-Support zu spendieren. Dieser ist zur Zeit der Intel-Version von Logic Pro vorbehalten. Schlimmer noch: Mit dem jüngsten Update von Logic Pro auf die Version 11 benötigt Logic Pro mehrere Minuten für den Start. Danach läuft dann allerdings die ARA-Anbindung einwandfrei.

Tipp: Logic Pro 11 und die Vorgängerversion können gleichzeitig installiert werden. So kann man Logic 10.8.1 unter Rosetta starten und Logic Pro 11 nativ.

Loudness Optimize in RX11 Advance

Mit Loudness Optimize lässt sich die Lautheit eines Musiksignals optimieren und checken. Nach einer kurzen Analyse zeigt Loudness Optimize, ob der gehörrichtige Durchschnittspegel (LUFS) optimal ist oder weiter verbessert werden kann.

Streaming Preview – Export aus iZotope RX11

Mit iZotope RX11 Advanced ist es nun möglich, sich per Streaming Preview vorab einen Eindruck vom Klang des eigenen Masters bei verschiedenen Streaming-Diensten wie Spotify oder Apple Music zu verschaffen. Dabei wird nicht nur der Codec des jeweiligen Streaming-Anbieters berücksichtigt, sondern auch die maximale Lautheit in LUFS, die der Dienst verlangt.

Music Rebalance mit Stems

Stem-Separierung per KI ist aktuell in aller Munde und auch iZotope RX11 Advanced macht hier keine Ausnahme. Mit Music Rebalance wird ein fertiger Mix in vier Stems zerlegt. Wie üblich handelt es sich dabei um Stems für Vocal, Bass, Drums und Other. Nun können mit einem kleinen Mischpult nicht nur die Pegelverhältnisse verändert werden, sondern auch einzelne Stems solo abgehört oder stummgeschaltet werden.

Neuer Repair Assistant

Für iZotope RX11 Advanced wurde der Repair Assistant überarbeitet und mit neuesten Machine Learning-Algorithmen versehen. Funktionen wie De-noise, De-reverb, De-hum, De-click, De-Ess, Tone, De-Clip und andere stehen nun in noch besserer Qualität zur Verfügung.

Dialogue Contour

Mit Dialogue Contour bearbeitet man Sprache mit Parametern wie Formant, Pitch oder Variant. Neu ist die sogenannte Pitch Curve, die den Tonhöhenverlauf der Sprache anzeigt, der fortwährend analysiert wird. Dieser lässt sich natürlich auch beeinflussen und somit die Sprache eines aufgenommenen Sprechers noch emotionaler und aufregender oder im Gegenteil emotionsloser gestalten – ganz so, wie es das Projekt erfordert.

Audio Device Handling – Wechsel des Treibers

Per Audio Device Handling ist endlich das Wechseln des Audiotreibers ohne Neustart der Software möglich. Auch neu hinzugefügte Audio Devices werden erkannt und lassen sich sofort aktivieren.

Mid/Side-Bearbeitung in iZotope RX11

Der neue Mid/Side-Modus zeigt die Mitten- und Seiten-Signalanteile getrennt voneinander an und ermöglicht auch die getrennte Bearbeitung. Auf diese Weise lässt sich das aufgenommene Material noch präziser bearbeiten.

Praxiseinsatz der Audio Repair Software

Während der Installation der Software muss diese zunächst per Seriennummer autorisiert werden. Auch die Installation mittels iLok-Dongle ist möglich. Das ist praktisch, wenn die Software mit mehreren Computern eingesetzt werden soll.

Nach der Installation meldet sich iZotope RX11 Advanced zunächst mit einem schnöden Programmfenster. Wer möchte, klickt hier auf „What’s new“ für einen kurzen Überblick über die neuen Funktionen. Da ich mir zuvor schon das gute Informationsvideo zu iZotope RX11 Advanced angeschaut habe, überspringe ich diesen Vorschlag. Nach dem Start lädt iZotope RX11 Advanced automatisch eines der mitgelieferten Hörbeispiele. Doch ich möchte lieber auch mit eigenen Aufnahmen experimentieren. Deshalb schnappe ich mir meinen Zoom H1n Field Recorder und ab geht es in den Garten.

Aufnahme des Grauens

Unser Garten grenzt direkt an das Außengelände eines Kindergartens auf der einen Seite und eine Kirche auf der anderen Seite. Kaum stehe ich mit meinem Zoom H1n in der Hand im Garten, ist es 12 Uhr und die Glocken beginnen zu läuten. Ich sehe meine Chance gekommen, eine richtig unbrauchbare Aufnahme zu machen: Ohrenbetäubend laute Glocken und Kinder begleiten meine in circa 30 cm Abstand in den Zoom H1n gesprochenen Worte. Viel Vertrauen habe ich da nicht in die Fähigkeiten der iZotope RX11 Advanced Software, deshalb nehme ich sicherheitshalber noch einen zweiten Monolog auf, nachdem die Glocken wieder verstummt sind. Hier ist nur noch das Kindergeschrei zu hören, außerdem einige Windgeräusche sowie vorbeifahrende Autos.

Selbsterklärend

Zu meiner Überraschung gestaltet sich die Arbeit mit iZotope RX11 Advanced ziemlich selbsterklärend. Der Blick ins Handbuch der Software ist eigentlich nicht erforderlich. In der Mitte nimmt den meisten Platz der große Spektrum Editor ein. Auf der rechten Seite sind die einzelnen Plug-ins der Software zu finden. Im unteren Teil des Programmfensters entdecke ich zudem eine Transportleiste, eine große Pegelanzeige sowie Anzeigen für Dauer, Start und Endpunkt der Audiodatei beziehungsweise des darin markierten Bereichs.

Audio Restauration

Im ersten Schritt versuche ich mich an der Audio Restauration meiner soeben erstellten Aufnahme des Grauens. Viel Hoffnung habe ich nicht, davon überhaupt etwas verwenden zu können. Per Drag & Drop findet die Aufnahme schnell den Weg in iZotope RX11 Advanced. Eine kurze Analyse und schon kann es losgehen. Zunächst einmal teste ich die neue Funktion Dialogue Isolate.

Wichtig zu wissen ist, dass fast alle Plug-ins eine Preview-Funktion besitzen, bei der kurze Fragmente der Audioaufnahme von iZotope RX11 Advanced gerendert und dann abgespielt werden. Dieses Vor-Rendering geschieht konsekutiv, es ist also nicht nötig, immer wieder den gleichen Bereich anzuhören, sondern iZotope RX11 rendert beim Abspielen im Vorschaumodus selbstständig den nächsten Bereich. Es ist also nicht notwendig, immer wieder neu auf Preview zu klicken. Allerdings dauert es immer eine kurze Zeit, bis Reglerbewegungen während des Abspielens einer Vorschau einen Effekt haben, da die Änderungen selbstverständlich erst beim nächsten zu berechnenden Bereich der Datei greifen.

Dann die Überraschung: Mit nur einer Reglerbewegung waren alle Nebengeräusche meiner Aufnahme komplett verschwunden – nur noch die Sprache ist zu hören. Das Signal ist sauber und lediglich die automatische Aussteuerung meines H1n stört mit ihren Pegelveränderungen etwas. Doch selbst diese ließen sich noch korrigieren, wenn ich es wollte. Das hatte ich nicht erwartet. Genutzt habe ich dafür noch nicht einmal die Multiband-Funktion, sondern lediglich den Regler für Noise.

Nun möchte ich aber auch wissen, ob das Reduzieren von Hall funktioniert. Statt in die benachbarte Kirche zu gehen und noch eine Aufnahme zu starten, nutze ich stattdessen dieses Mal eine der mitgelieferten Demoaufnahmen. Und auch hier ist es nur eine Reglerbewegung und die Aufnahme ist vom Hall befreit.

Wer es noch komfortabler haben möchte, nutzt den Repair Assistant, der das Audiomaterial nach dem Klicken des Learn Buttons analysiert und alle Einstellungen automatisch vornimmt. Auch hier lässt sich mit wenigen Reglern schnell ein sehr gutes Ergebnis erzeugen.

Eine weitere Testaufnahme aus meinem Garten wurde erneut mit den diversen Tools von Nebengeräuschen befreit. Mit Dialogue Contour habe ich im Anschluss noch meine Stimme etwas bearbeitet und mit ein wenig mehr Ausdruck versehen. Befreit man die Stimme von sämtlichen Tonhöhenschwankungen und verändert dann noch Pitch und Formanten, lassen sich damit übrigens auch prima Roboterstimmen basteln.

KI-Stems in iZotope RX11

Music Rebalance wird auch viele Leser interessieren. Nachdem ich kürzlich innerhalb von wenigen Tagen zunächst RipX DAW AI und Logic Pro 11 testen konnte und deren Fähigkeiten zur Stem Extrahierung beurteilen durfte, war ich auf das Ergebnis mit iZotope RX11 Advanced gespannt. Aus diesem Grund habe ich einfach noch einmal auf meinen KI-Song zurückgegriffen, den ich auch beim Test der zwei anderen DAWs genutzt habe – so könnt ihr besser vergleichen.

Music Rebalance macht einen guten Job. Natürlich ist auch wie bei den beiden anderen Kandidaten das Ergebnis stark vom Mix des Masters abhängig. Ohne weitere Einstellungen macht die KI in Logic bei meinem Test-Song einen etwas besseren Job, zumindest was den Gesang angeht. In iZotope RX11 Advanced lassen sich aber einige Einstellungen vornehmen, mit denen sich das Ergebnis noch verbessern ließe. Ganz frei von Artefakten ist aber derzeit keine KI Stem-Software am Markt.

Dennoch lässt sich mit Music Rebalance sehr gut ein Mix nachträglich verändern, schnell ein Playback erstellen oder die Stimme extrahieren, um diese zum Beispiel für einen Remix zu verwenden. Ein wichtiger Anwendungsbereich ist auch das Nachsynchronisieren älterer Filme für die Wiederveröffentlichung auf Streaming Diensten. Oftmals liegen nur noch monophone Tonspuren vor, die Dialoge, Geräusche und Musik enthalten. Möchte man nun ohne viel Aufwand eine Version in einer anderen Sprache produzieren, können die Stimmen aus dem Mix entfernt werden, um dann die neu aufgenommenen Stimmen in der Zielsprache in den Mix einzubetten.

Ausprobiert habe ich außerdem das Streaming Preview. Allerdings muss ich gestehen, dass die Unterschiede zwischen den einzelnen Presets für die diversen Streaming-Dienste wirklich marginal sind. Deutliche Unterschiede höre ich nur bei sehr drastischen manuellen Einstellungen der jeweiligen Codecs. Für Mastering-Ingenieure mit goldenen Ohren ist das aber sicherlich ein fantastisches Tool, zumal man die Einstellungen über die Compare-Funktion schnell auf Knopfdruck vergleichen kann.