ANZEIGE
ANZEIGE

Praxis: Nachbearbeitung einer iPhone-Tonspur mit iZotope RX 9

23. Oktober 2021

Audiorettung des Hans Zimmer Interviews mit iZotope RX9

Wie in unserer Interview-Beitrag mit Hans Zimmer beschrieben, hat uns leider just in dem Augenblick die Audiotechnik per iOS im Stich gelassen, als das Interview begann. Wir haben also gute Miene zum bösen Spiel gemacht und das Ding durchgezogen. Der Notfallplan sah vor, das gesamte Interview letztendlich zu transkribieren, um es den AMAZONA.de-Leser zumindest als Text verfügbar zu machen.

ANZEIGE

Dass es doch anders kam, haben wir unseren Freunden von iZotope zu verdanken. Noch während wir in London waren, habe ich mit Christoph Haertwig von iZotope-Deutschland telefoniert und mein Leid geklagt. Christoph konnte beruhigte mich aber sogleich und meinte nur: „Das kriegen wir schon hin!“ An dieser Stelle ein dickes Danke an dich Christoph, denn ohne euch wären die Videoaufnahmen nie ins Netz gegangen.

Da iZotope nur wenige Tage später ein RX8-Update mit neuen Features auf den Markt brachte, war das die perfekte Möglichkeit, um am „lebenden“ Beispiel zu zeigen, was die Software draufhat. Und da Audio mehr sagt als tausend Worte, hier vorab mal ein A/B-Vergleich des Ausgangsmaterials und der finalen Bearbeitung:

Wenn ihr genau hinhört, ist nicht nur einfach der Pegel angehoben worden, sondern tatsächlich fehlen alle Umgebungsgeräusche und der Raumanteil (natürlicher Hall durch den Abstand des iPhone-Mikros zum Sprecher).

Wie das im Detail Jürgen Wirtz, der ausführende Techniker bei iZotope angestellt hat, lassen wir die iZotope-Experten nun selbst erklären.

Restauration mit iZotope RX 9 des Hans Zimmer Interviews 2021

Für die Aufbereitung der iPhone-Tonaufnahme wurde zunächst RX Dialogue Isolate verwendet. Der in Version 9 komplett neu aufgelegte Algorithmus von RX Dialogue Isolate wurde mit künstlicher Intelligenz auf Basis eines neuronalen Netzwerks darauf trainiert, automatisch die Frequenzanteile von Sprache in einer Tondatei mit beliebigen Hintergrundgeräuschen zu erkennen und zu isolieren. Mit dem Modul konnten Hintergrundgeräusche sowie störende Raumreflexionen um 15 dB reduziert werden. Mit RX Spectral De-Noise wurde dann ein Fingerabdruck des übrig gebliebenen Hintergrundrauschens (Verkehr und Lüfter) gelernt und weitere 18 dB der tonalen sowie 23 dB der geräuschhaften Störgeräusche reduziert. Das Modul arbeitet mit Hunderten Bändern als Multiband-Expander und nutzt dabei verschiedene psychoakustische Tricks, um die Arbeit zu verrichten.

Das Ergebnis wurde dann in Logic Pro mit iZotope Ozone bearbeitet. Zuerst wurde die Raumabbildung der iPhone-Stereoaufnahme eingeschränkt bzw. korrigiert, um die Sprecher in das Zentrum der Wiedergabe zu rücken. Danach wurde der Tiefenbereich begrenzt sowie Präsenzfrequenzen oberhalb von 1 kHz bis in die Höhen angehoben. Der Ozone Dynamikprozessor, Vintage Limiter und Maximizer sorgten für eine kontrollierte Dynamik und verbesserte Programmdichte mit Spitzenpegelbegrenzung für Audio-Streaming. Um die bereinigte Aufnahme etwas lebendiger zu gestalten (Verkehr im Hintergrund, Raumrückwürfe), wurde die unbearbeitete iPhone-Originalaufnahme noch leicht dazu gemischt. Dieser Trick bietet sich auch immer gut an, um kleinere Artefakte nach einer Restauration zu verdecken.

Original iPhone Wellenform

Finale Überarbeitung mit RX9

Zu den beiden Bildern oben
Die integrierte Loudness (Lautheit) wurde für den Vergleich angepasst. Man erkennt am schmalen Balken der Nulllinie die deutlich reduzierten Hintergrundgeräusche der finalen Bearbeitung (unteres Bild) sowie die gleichmäßigere Dynamik.

ANZEIGE

Zu den beiden Bildern oben
Identischer Vergleich mit RX Spektrogramm. Helle Bildpunkte entsprechen proportional höherem Pegel an der jeweiligen Frequenz, wobei von unten nach oben die tiefsten Frequenzen im Hörschallbereich zu den höchsten in der Aufnahme dargestellt werden und die Zeitachse wie bei der Wellenform von links nach rechts verläuft. Man sieht sehr deutlich das reduzierte Rauschen im Hintergrund nach der Bearbeitung, während die Sprache zielsicher gesäubert wurde.

Zum Bild oben
RX 9 Dialogue Isolate nutzt Maschine-Learning, eine Form der künstlichen Intelligenz, um Sprache automatisch zu erkennen und separieren. Per kleinem Mischpult mit zwei Pegelstellern kann dann die Sprache und alles Übrige – die Nebengeräusche – abgemischt werden. In RX 9 wurde der Algorithmus verbessert, was die Qualität der Ergebnisse noch steigern konnte.

Zum Bild oben
Ozone feiert dieses Jahr seinen 20. Geburtstag und ist ein auf Mastering spezialisiertes Plug-in von iZotope mit Audio-DSP auf höchstem Niveau. Ozone hat die Aufnahme klangjustiert und aufpoliert. Außerdem wurde im gleichen Zuge der Nachbearbeitung die iPhone-Originalaufnahme als zweite Spur etwas beigemischt, um das Ergebnis etwas lebendiger und natürlicher klingen zu lassen.

ANZEIGE
Fazit

Vornehm ausgedrückt, die iZotope-Jungs haben uns den Hintern gerettet. Dafür gebührt ihnen und den Entwicklern der RX9-Software großer Dank. Und wer nun hinter diesem Artikel versteckte Werbung vermutet, der irrt.

Hier ist gar nichts versteckt. Ich (Peter Grandl) werbe super gerne damit, dass iZotope uns geholfen hat, das Interview nun in einer wirklich guten Audioqualität der Öffentlichkeit präsentieren zu können.

Ich habe mich in der Vergangenheit schon oft mit allen möglichen Plug-ins rumgequält, um vor allem O-Töne von Filmaufnahmen oder Konzertmitschnitte einigermaßen erträglich zu machen. Als ich die iPhone Aufnahmen des Interviews im Hotel abhörte, war ich daher felsenfest davon überzeugt, dass das Kind in den Brunnen gefallen war. Das dem nicht so war, ist ganz alleine der Verdienst der RX9-Software. DANKE!

ANZEIGE
Klangbeispiele
Forum
  1. Profilbild
    DJ Ronny

    Die Aufnahme hat mich sehr beeindruckt. Ich habe noch ein paar Cd’s mit Mitschnitten von Predigten, die mit sehr viel Rauschen und Brummen sich nur schwer anhören lassen. Meine Versuche die Aufnahmen zu verbessern brachten nicht wirklich viel. Mal sehen ob es da eine Testversion gibt. Wenn ich damit gute Ergebnisse erziele, bin ich bereit in die Vollversion zu investieren. Danke für die Info.

  2. Profilbild
    bluebell AHU

    Schade, dass es keinen Abschnitt gibt, in dem keiner redet, also nur die Störgeräusche da sind. Hätte mich interessiert, wie sich die Rauschentfernung von Audacity verhält, wenn man ihm die Verkehrsgeräusche(?) als Rauschen andient.

  3. Profilbild
    Tim

    Ich will RX9 keinerlei Qualität absprechen.. aber ich finde grade das originalbeispiel ist deutlich besser zu verstehen, als die „gerettete“ version. Das original kann ich vom gehört her besser einordnen. Bei dem bearbeiteten Signal sind die Stimmen ziemlich omnipräsent und es klingt künstlich.

    • Profilbild
      Lensman

      Echt jetzt? Finde die überarbeitete Version phänomenal. Hätte nie auch nur im Entferntesten geglaubt, das so etwas machbar ist.

Kommentar erstellen

Die AMAZONA.de-Kommentarfunktion ist Ihr Forum, um sich persönlich zu den Inhalten der Artikel auszutauschen. Sich daraus ergebende Diskussionen sollten höflich und sachlich geführt werden. Politische Inhalte und Statements werden durch die Redaktion gelöscht.

Haben Sie eigene Erfahrungen mit einem Produkt gemacht, stellen Sie diese bitte über die Funktion Leser-Story erstellen ein. Für persönliche Nachrichten verwenden Sie bitte die Nachrichtenfunktion im Profil.

ANZEIGE