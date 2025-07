Ich glaub, ich hör nicht richtig!

Quantisierung, Swing, Humanizing und Mikrotiming sind faszinierende Themen und dieser Workshop soll einen kleinen Einblick in die Grundlagen und die zugrundeliegenden Phänomene, vor allem psychoakustischer Natur, geben. Es wird hier nicht um notierte Rhythmen gehen. Stattdessen widmen wir uns dem Reich des Mikrotimings und der Hörwahrnehmung, das nicht minder faszinierend ist wie die Entdeckung neuer Welten unter einem Mikroskop.

ANZEIGE

Quantisierung

Zunächst einmal ganz kurz: Was ist überhaupt (rhythmische) Quantisierung? Damit wird das Festlegen von Noten auf ein bestimmtes gleichförmiges zeitliches Raster bezeichnet. In der DAW ist meistens das 16tel-Raster voreingestellt. Eine eingespielte rhythmische Folge wird dann auf den nächst verfügbaren Rasterpunkt verschoben, unabhängig von der Tonhöhe.

Damit ist alles rasterkonform und hat, wie im Englischen gesagt wird, ein „deadpan“-Timing. So spielt aber kein Mensch. Die Notenfolge liegt zwar nun genau auf dem Raster, entbehrt aber jeglicher Authentizität und hat damit keinen individuellen Erkennungswert.

Psychoakustik – oder die Kunst des Hörens

Ich werde das Thema Psychoakustik nur soweit anschneiden, wie wir es für unseren Workshop Quantisierung, Swing, Humanizing und Mikrotiming benötigen. Das Ganze ist nämlich ein ganzer wissenschaftlicher Zweig mit unzähligen Studien, die bis in das vorletzte Jahrhundert und weiter zurück reichen. Im Prinzip könnte schon der Disput von Aristoxenus mit den Pythagoreern (ca. 330 v. Chr.) als Geburt der Psychoakustik gelten. Dieser behauptete nämlich, man solle die musikalischen Intervalle nicht nach ihrem mathematischen Verhältnis, sondern ihrer Wirkung auf den Hörer beurteilen.

Ich möchte versuchen, es mal ganz pragmatisch auszudrücken: Pychoakustik befasst sich mit dem Phänomen, dass wir Menschen akustische Ereignisse anders wahrnehmen, als uns die physikalischen Messwerte eigentlich vorgeben. Das betrifft auch generell Tiere, nur leider können die uns meistens nicht so gut erzählen, wie sie etwas wahrgenommen haben. Mit dem ersten Beispiel sind wir dann auch schon beim Thema Quantisierung, Swing, Humanizing und Mikrotiming.

Im Buch „Zwicker/Fastl Psychocoustics: facts and models“ (sozusagen der Bibel der Psychoakustik) gibt es zahlreiche erstaunliche Ergebnisse, wenn wir unserem Gehör mal auf den Zahn fühlen. So z .B. das Experiment auf Seite 267. Die Versuchsteilnehmer sind angehalten, eine Abfolge von kurzen Tönen anzuhören und die Pausen dazwischen so einzustellen, dass sie die Länge der Pausen genauso lang wahrnehmen, wie die Länge der Töne.

Einfache Sache, sollte man meinen. Ein 100 ms langer Ton erklingt und alle werden eine Pause von um die 100 ms einstellen, stimmt’s? Falsch! Es ist nicht nur so, dass die Pausen wesentlich länger eingestellt werden, um gleich wahrgenommen zu werden, diese Pausenlänge ist auch noch abhängig von der Tonhöhe des eingesetzten Testtons! Liegt dieser bei 3,2 kHz, so werden die Pausen im Mittel auf 400 ms eingestellt, dem Vierfachen von der Länge des Tons. Wird ein 200 Hz Ton zugrunde gelegt, reduziert sich das, was als gleichlange Pause eingestellt wird, auf ca. die Hälfte – willkommen in der wundersamen Welt der Psychoakustik!

Wahrnehmung ist dabei das Stichwort. Unser Ohr mag zwar ein physikalische Messinstrument sein, aber bereits auf den Nervenwegen zum Hirn beginnt eine Vorverarbeitung der eingehenden Nervensignale, die später nur noch komplexer wird. Und erst dann nehmen wir bewusst etwas als Hörereignis wahr.

ANZEIGE

Mit dieser, wie ich immer noch finde, erstaunlichen Erkenntnis wollen wir uns nun dem Workshop Thema Quantisierung, Swing, Humanizing und Mikrotiming nähern.

Timing: Der swingende Unterschied

Dazu habe ich einmal einige einfache Hörbeispiele vorbereitet, damit ihr hören (oder nicht hören) könnt, wie subtil dieser Effekt sein kann.

Dazu habe ich ein einfachen Klick-Track mit Audacity erstellt und ihn mit zunehmendem Swing versehen.

In diesem Fall bedeutet das, dass der zweite und dritte Klick ein wenig früher erklingt. Wir mischen also die sturen Viertel ein wenig nach vorne, weswegen auch der Begriff Shuffle verwendet wird.

Im Prinzip macht ihr also ein psychoakustisches Experiment, wenn ihr beurteilt, ab wann ihr die vorgezogenen Klicks 2 und 4 hört, entscheidet selbst. Es gibt Quellen, die behaupten, diese Schwelle läge bei 200 us (Mikrosekunden, also 200 millionstel Sekunden). Andere geben noch Werte darunter an, wieder andere höhere. Natürlich hängt das auch immer sehr vom Aufbau des Experimentes ab und ist deshalb mit so einer vereinfachten Präsentation nicht vollständig nachvollziehbar. Interessant dabei ist, dass dieses rhythmische Hören unabhängig vom tonalen Hören ist.

Hier eine zweite Reihe, wobei den einzelnen Verschiebungen immer der phasengedrehte Originalklick beigemischt ist. Logischerweise löschen sich diese bei dem Beispiel 0,000 = 0u vollständig aus. Deshalb spare ich mir das beeindruckend tonlose Beispiel hier. Aber ich denke, alle können nun auch bereits die Verschiebung von 208 us hören.

Im ersten Fall (208 us) hört ihr immer nur den zweiten und vierten Klick, dann eine Phasenauslöschung wie bei einem Kammfiltereffekt (1,6 ms). Dann bei 16 ms Unterschied ist ein Flam oder Doppelschlag zu hören, um schließlich bei 83 ms als deutlich hörbarer doppelter Klick zu erschienen.

Humanzing

Dieses Phänomen können wir auch bei der Analyse des Humanzing anwenden. Mit Humanizing, das sich eher schlecht als recht mit Vermenschlichung übersetzen lässt, wird im Allgemeinen eine zufällige Verteilung des Mikrotimings bezeichnet.

Hört euch zunächst die Beispiele an. Ab wann könnt ihr eine Änderung in der Abfolge der Klänge wahrnehmen? Die Zeitangaben im Namen deuten auf die ungefähr maximale Verschiebung hin. THL steht dabei für die Einstellung „Total Humanizing Level“ eines Reaper-Plug-ins, andere DAWs werden etwas ähnliches zu bieten haben.

Machen wir wieder die Sache mit dem Beimischen des phasenverdrehten Straight Grooves – und es treten deutlich die Timing-Variationen als Filtereffekte hervor. Hört ihr eine Pause, so war an der Stelle die humanized Note im Timing identisch mit der straight Note.

Dadurch dass der hier gewählte perkussive Klang eine längere Ausklingzeit aufweist, kann dieser Effekt auch viel deutlicher wahrgenommen werden.

Mahamta Groove, Mahatma keinen

Schaue ich mir wissenschaftlichen Publikationen zum Thema Groove an (ja tatsächlich), so finde ich vor allem folgende Definition:

“the urge to move in response to music, combined with the positive affect associated with the coupling of sensory and motor processes while engaging with music”

Groove Definition nach: (Janata et al. 2012, p. 54).

Auch auf Deutsch hört sich das nicht besonders groovy an:

„Der Drang, sich zur Musik zu bewegen, in Verbindung mit dem positiven Affekt, der mit der Verknüpfung von sensorischen und motorischen Prozessen während der Beschäftigung mit der Musik verbunden ist“

Nun, das ist für uns Musikschaffende eine hinreichend nutzlose Definition. Für unseren Workshop Quantisierung, Swing, Humanizing und Mikrotiming möchte ich daher eine praxisgerechtere Definition anwenden: Ist das Humanzing die zufällige Verteilung einer Note im Mikrotiming, so definiert der Groove eine feste Position im Mikrotiming innerhalb eines (oder mehreren aufeinanderfolgenden) Taktes.

Hören wir mal die Beispiele, in der einer 16tel Sequenz ein Groove mit verschiedenen Prozentanteilen aufgedrückt wird.

Und hier wieder mit dem Phaseninvertierungstrick, deutlich ist die regelmäßige Abweichung beinahe schon als Melodie zu hören.

Dabei bin ich euch aber eine Definition von Mikrotiming schuldig geblieben. Am besten, wir sehen uns das mal an einem Zahlenbeispiel an. Bei 120 BPM kommt alle 500 ms eine Viertelnote. Verfolgen wir das weiter, kommen wir auf folgende gerundete Zeitwerte bei 120 BPM:

250 ms 1/8

125 ms 1/16

62,5 ms 1/32

31,25 ms 1/64

15,63 ms 1/128

7,81 ms 1/256

3,90 ms 1/512

1,95 ms 1/1024

0,98 ms 1/2048

0,49 ms 1/4096

0,24 ms 1/9192

Für ein Mikrotiming muss also der Versatz einer Note oberhalb der Wahrnehmungsschwelle liegen (siehe Swing-Beispiele), aber unterhalb einer klar erkennbaren Absicht als zeitlich rhythmische Figur. Das Gefühl dafür liegt wohl bei allen etwas anders, wobei auch kulturelle Faktoren und eine musikalische Bildung eine Rolle spielen. Aber nach den Hörtests würde ich sagen, diese Schwelle liegt so um die 16 ms. Wenn ich es jetzt konkret auf 120 BPM festlege, würde ich also alles unter einer 1/128 Note in den Bereich des Miktotimings verordnen.

Das wird klar beim folgenden Beispiel, in dem ich einfach 128-tel Noten bei 120 BPM erzeugt habe. Das geht schon eher in Richtung Klangfarbe, als Rhythmus.

Natürlich spielen hier auch wieder psychoakustische Phänomene eine Rolle. Falls ihr euch viellicht gewundert habt, warum ihr auch bei den eigentlich voll quantisierten Beispielen einen Groove erkannt habt: Dieser lässt sich auch mental dazu dichten und hat auf die Fluktuation der Beta-Wellen im Gehirn den gleichen Einfluss wie ein tatsächlicher Groove (Iversen et al. 2009, Fujioka et al. 2015) – Einbildung ist auch eine Bildung auf seine schönste und erträglichste Art und Weise.