Audiorettung des Hans Zimmer Interviews mit iZotope RX9
Wie in unserer Interview-Beitrag mit Hans Zimmer beschrieben, hat uns leider just in dem Augenblick die Audiotechnik per iOS im Stich gelassen, als das Interview begann. Wir haben also gute Miene zum bösen Spiel gemacht und das Ding durchgezogen. Der Notfallplan sah vor, das gesamte Interview letztendlich zu transkribieren, um es den AMAZONA.de-Leser zumindest als Text verfügbar zu machen.
Dass es doch anders kam, haben wir unseren Freunden von iZotope zu verdanken. Noch während wir in London waren, habe ich mit Christoph Haertwig von iZotope-Deutschland telefoniert und mein Leid geklagt. Christoph konnte beruhigte mich aber sogleich und meinte nur: „Das kriegen wir schon hin!“ An dieser Stelle ein dickes Danke an dich Christoph, denn ohne euch wären die Videoaufnahmen nie ins Netz gegangen.
Da iZotope nur wenige Tage später ein RX8-Update mit neuen Features auf den Markt brachte, war das die perfekte Möglichkeit, um am „lebenden“ Beispiel zu zeigen, was die Software draufhat. Und da Audio mehr sagt als tausend Worte, hier vorab mal ein A/B-Vergleich des Ausgangsmaterials und der finalen Bearbeitung:
Wenn ihr genau hinhört, ist nicht nur einfach der Pegel angehoben worden, sondern tatsächlich fehlen alle Umgebungsgeräusche und der Raumanteil (natürlicher Hall durch den Abstand des iPhone-Mikros zum Sprecher).
Wie das im Detail Jürgen Wirtz, der ausführende Techniker bei iZotope angestellt hat, lassen wir die iZotope-Experten nun selbst erklären.
Restauration mit iZotope RX 9 des Hans Zimmer Interviews 2021
Für die Aufbereitung der iPhone-Tonaufnahme wurde zunächst RX Dialogue Isolate verwendet. Der in Version 9 komplett neu aufgelegte Algorithmus von RX Dialogue Isolate wurde mit künstlicher Intelligenz auf Basis eines neuronalen Netzwerks darauf trainiert, automatisch die Frequenzanteile von Sprache in einer Tondatei mit beliebigen Hintergrundgeräuschen zu erkennen und zu isolieren. Mit dem Modul konnten Hintergrundgeräusche sowie störende Raumreflexionen um 15 dB reduziert werden. Mit RX Spectral De-Noise wurde dann ein Fingerabdruck des übrig gebliebenen Hintergrundrauschens (Verkehr und Lüfter) gelernt und weitere 18 dB der tonalen sowie 23 dB der geräuschhaften Störgeräusche reduziert. Das Modul arbeitet mit Hunderten Bändern als Multiband-Expander und nutzt dabei verschiedene psychoakustische Tricks, um die Arbeit zu verrichten.
Das Ergebnis wurde dann in Logic Pro mit iZotope Ozone bearbeitet. Zuerst wurde die Raumabbildung der iPhone-Stereoaufnahme eingeschränkt bzw. korrigiert, um die Sprecher in das Zentrum der Wiedergabe zu rücken. Danach wurde der Tiefenbereich begrenzt sowie Präsenzfrequenzen oberhalb von 1 kHz bis in die Höhen angehoben. Der Ozone Dynamikprozessor, Vintage Limiter und Maximizer sorgten für eine kontrollierte Dynamik und verbesserte Programmdichte mit Spitzenpegelbegrenzung für Audio-Streaming. Um die bereinigte Aufnahme etwas lebendiger zu gestalten (Verkehr im Hintergrund, Raumrückwürfe), wurde die unbearbeitete iPhone-Originalaufnahme noch leicht dazu gemischt. Dieser Trick bietet sich auch immer gut an, um kleinere Artefakte nach einer Restauration zu verdecken.
Zu den beiden Bildern oben
Die integrierte Loudness (Lautheit) wurde für den Vergleich angepasst. Man erkennt am schmalen Balken der Nulllinie die deutlich reduzierten Hintergrundgeräusche der finalen Bearbeitung (unteres Bild) sowie die gleichmäßigere Dynamik.
Zu den beiden Bildern oben
Identischer Vergleich mit RX Spektrogramm. Helle Bildpunkte entsprechen proportional höherem Pegel an der jeweiligen Frequenz, wobei von unten nach oben die tiefsten Frequenzen im Hörschallbereich zu den höchsten in der Aufnahme dargestellt werden und die Zeitachse wie bei der Wellenform von links nach rechts verläuft. Man sieht sehr deutlich das reduzierte Rauschen im Hintergrund nach der Bearbeitung, während die Sprache zielsicher gesäubert wurde.
Zum Bild oben
RX 9 Dialogue Isolate nutzt Maschine-Learning, eine Form der künstlichen Intelligenz, um Sprache automatisch zu erkennen und separieren. Per kleinem Mischpult mit zwei Pegelstellern kann dann die Sprache und alles Übrige – die Nebengeräusche – abgemischt werden. In RX 9 wurde der Algorithmus verbessert, was die Qualität der Ergebnisse noch steigern konnte.
Zum Bild oben
Ozone feiert dieses Jahr seinen 20. Geburtstag und ist ein auf Mastering spezialisiertes Plug-in von iZotope mit Audio-DSP auf höchstem Niveau. Ozone hat die Aufnahme klangjustiert und aufpoliert. Außerdem wurde im gleichen Zuge der Nachbearbeitung die iPhone-Originalaufnahme als zweite Spur etwas beigemischt, um das Ergebnis etwas lebendiger und natürlicher klingen zu lassen.
Die Aufnahme hat mich sehr beeindruckt. Ich habe noch ein paar Cd’s mit Mitschnitten von Predigten, die mit sehr viel Rauschen und Brummen sich nur schwer anhören lassen. Meine Versuche die Aufnahmen zu verbessern brachten nicht wirklich viel. Mal sehen ob es da eine Testversion gibt. Wenn ich damit gute Ergebnisse erziele, bin ich bereit in die Vollversion zu investieren. Danke für die Info.
Na dann passt doch alles perfekt!
Denn zum 20 jährigen Jubiläum gibts Ozone Elements gerade gratis als Free Download…
https://www.izotope.com/en/shop/ozone-elements.html
Man muss weiter nach unten scrollen…
Ist aber limitiert…also Gas geben…
Danke für den tollen Artikel.
Schade, dass es keinen Abschnitt gibt, in dem keiner redet, also nur die Störgeräusche da sind. Hätte mich interessiert, wie sich die Rauschentfernung von Audacity verhält, wenn man ihm die Verkehrsgeräusche(?) als Rauschen andient.
Ich will RX9 keinerlei Qualität absprechen.. aber ich finde grade das originalbeispiel ist deutlich besser zu verstehen, als die „gerettete“ version. Das original kann ich vom gehört her besser einordnen. Bei dem bearbeiteten Signal sind die Stimmen ziemlich omnipräsent und es klingt künstlich.
@Tim Echt jetzt? Finde die überarbeitete Version phänomenal. Hätte nie auch nur im Entferntesten geglaubt, das so etwas machbar ist.
Hut ab an IZOTOPE und danke für den Bericht.
ABER:
Ihr seid eine Redaktion für professionelles Audioequipment und führt so ein Interview dann nur mit einem Smartphone durch?? Oha… ;-) Oder war das Telefon nur als Backup dabei?