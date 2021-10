Audiorettung des Hans Zimmer Interviews mit iZotope RX9

Wie in unserer Interview-Beitrag mit Hans Zimmer beschrieben, hat uns leider just in dem Augenblick die Audiotechnik per iOS im Stich gelassen, als das Interview begann. Wir haben also gute Miene zum bösen Spiel gemacht und das Ding durchgezogen. Der Notfallplan sah vor, das gesamte Interview letztendlich zu transkribieren, um es den AMAZONA.de-Leser zumindest als Text verfügbar zu machen.

Dass es doch anders kam, haben wir unseren Freunden von iZotope zu verdanken. Noch während wir in London waren, habe ich mit Christoph Haertwig von iZotope-Deutschland telefoniert und mein Leid geklagt. Christoph konnte beruhigte mich aber sogleich und meinte nur: „Das kriegen wir schon hin!“ An dieser Stelle ein dickes Danke an dich Christoph, denn ohne euch wären die Videoaufnahmen nie ins Netz gegangen.

Da iZotope nur wenige Tage später ein RX8-Update mit neuen Features auf den Markt brachte, war das die perfekte Möglichkeit, um am „lebenden“ Beispiel zu zeigen, was die Software draufhat. Und da Audio mehr sagt als tausend Worte, hier vorab mal ein A/B-Vergleich des Ausgangsmaterials und der finalen Bearbeitung:

Wenn ihr genau hinhört, ist nicht nur einfach der Pegel angehoben worden, sondern tatsächlich fehlen alle Umgebungsgeräusche und der Raumanteil (natürlicher Hall durch den Abstand des iPhone-Mikros zum Sprecher).

Wie das im Detail Jürgen Wirtz, der ausführende Techniker bei iZotope angestellt hat, lassen wir die iZotope-Experten nun selbst erklären.

Restauration mit iZotope RX 9 des Hans Zimmer Interviews 2021

Für die Aufbereitung der iPhone-Tonaufnahme wurde zunächst RX Dialogue Isolate verwendet. Der in Version 9 komplett neu aufgelegte Algorithmus von RX Dialogue Isolate wurde mit künstlicher Intelligenz auf Basis eines neuronalen Netzwerks darauf trainiert, automatisch die Frequenzanteile von Sprache in einer Tondatei mit beliebigen Hintergrundgeräuschen zu erkennen und zu isolieren. Mit dem Modul konnten Hintergrundgeräusche sowie störende Raumreflexionen um 15 dB reduziert werden. Mit RX Spectral De-Noise wurde dann ein Fingerabdruck des übrig gebliebenen Hintergrundrauschens (Verkehr und Lüfter) gelernt und weitere 18 dB der tonalen sowie 23 dB der geräuschhaften Störgeräusche reduziert. Das Modul arbeitet mit Hunderten Bändern als Multiband-Expander und nutzt dabei verschiedene psychoakustische Tricks, um die Arbeit zu verrichten.

Das Ergebnis wurde dann in Logic Pro mit iZotope Ozone bearbeitet. Zuerst wurde die Raumabbildung der iPhone-Stereoaufnahme eingeschränkt bzw. korrigiert, um die Sprecher in das Zentrum der Wiedergabe zu rücken. Danach wurde der Tiefenbereich begrenzt sowie Präsenzfrequenzen oberhalb von 1 kHz bis in die Höhen angehoben. Der Ozone Dynamikprozessor, Vintage Limiter und Maximizer sorgten für eine kontrollierte Dynamik und verbesserte Programmdichte mit Spitzenpegelbegrenzung für Audio-Streaming. Um die bereinigte Aufnahme etwas lebendiger zu gestalten (Verkehr im Hintergrund, Raumrückwürfe), wurde die unbearbeitete iPhone-Originalaufnahme noch leicht dazu gemischt. Dieser Trick bietet sich auch immer gut an, um kleinere Artefakte nach einer Restauration zu verdecken.

Zu den beiden Bildern oben

Die integrierte Loudness (Lautheit) wurde für den Vergleich angepasst. Man erkennt am schmalen Balken der Nulllinie die deutlich reduzierten Hintergrundgeräusche der finalen Bearbeitung (unteres Bild) sowie die gleichmäßigere Dynamik.

Zu den beiden Bildern oben

Identischer Vergleich mit RX Spektrogramm. Helle Bildpunkte entsprechen proportional höherem Pegel an der jeweiligen Frequenz, wobei von unten nach oben die tiefsten Frequenzen im Hörschallbereich zu den höchsten in der Aufnahme dargestellt werden und die Zeitachse wie bei der Wellenform von links nach rechts verläuft. Man sieht sehr deutlich das reduzierte Rauschen im Hintergrund nach der Bearbeitung, während die Sprache zielsicher gesäubert wurde.

Zum Bild oben

RX 9 Dialogue Isolate nutzt Maschine-Learning, eine Form der künstlichen Intelligenz, um Sprache automatisch zu erkennen und separieren. Per kleinem Mischpult mit zwei Pegelstellern kann dann die Sprache und alles Übrige – die Nebengeräusche – abgemischt werden. In RX 9 wurde der Algorithmus verbessert, was die Qualität der Ergebnisse noch steigern konnte.

Zum Bild oben

Ozone feiert dieses Jahr seinen 20. Geburtstag und ist ein auf Mastering spezialisiertes Plug-in von iZotope mit Audio-DSP auf höchstem Niveau. Ozone hat die Aufnahme klangjustiert und aufpoliert. Außerdem wurde im gleichen Zuge der Nachbearbeitung die iPhone-Originalaufnahme als zweite Spur etwas beigemischt, um das Ergebnis etwas lebendiger und natürlicher klingen zu lassen.