publié le 6 décembre 2022

temps de lecture env. 12 minutes


Sounddesign ist einer der wichtigsten Teile des Filmemachens, wird aber oft zugunsten auffälligerer Disziplinen wie Kamera oder Schnitt ‘übersehen’. Schlechter Ton ruiniert ein Video, während fantastischer Ton ein Video von gut zu großartig machen kann. Sounddesign ist storytelling. Sounddesign ist das Bauen einer (eigenen) Welt mit und über Töne – es erzählt eine Geschichte genauso wie die visuellen Elemente – « Audio ist Video für die Ohren ».

It’s All About the Torque

Sounddesign wird wahrscheinlich deshalb so stiefmütterlich behandelt, weil es sehr technisch ist und zwar auf einer anderen Ebene, als geile Blingblingkamera und bokääääh und hastenichtgesehen. Und irgendwie auch auf der anderen Seite des Tellerrandes. Krasser Fehler, da nicht hinzugreifen. Andererseits ist es sehr kreativ mit absolut tollen Herausforderungen, die dich dazu bringen, ein einfallsreicher content creator zu werden. Nur ist es da halt mit Blende aufreissen nicht getan. Tja.
Ton hilft sogar über ‘nicht so dolles Bildmaterial’ hinweg, weil es eine andere Wahrnehmungsebene beim Zuschauer antickert. Bild geil + sound mies = mieser Film. Bild nicht so geil + ordentlicher sound = guter Film. Geiles Bild + geiles Sounddesign = the most successful film at the box office of all times.
Geräusche und Laute werden unterbewusst wahrgenommen, die werden nicht hinterfragt, weil sie « einfach da sind ». Geräusche ermöglichen eine rämliche und zeitliche Orientierung des Zuschauers. Die Geräusche schaffen die Atmosphäre, das Gefühl eines Ortes, einer Zeit und geben damit den Szenen und Sequenzen im Film einen Zusammenhalt. Der Zuschauer soll denken « Jop, so ist es da. »

Post-Production. Allgemeines.

Wie sinnvoll an die Sache mit Film zusammenbauen rangegangen werden kann, das hast du noch ? Sonst guck es noch einmal nach. Mach es sortiert. Bins und Ordner. Und ordentlich. Die verhassten Metadaten. Die Zeit, die hier investiert wird holst du nicht wieder rein, wenn so ein Projekt erst einmal ein paar Tage liegengelassen wird oder anderer Kram dazwischenkommt.

Tip aus der Praxis : ’Sound’ kommt in sauberen Arbeitsabläufen *nach* dem Anordnen der Bilder. Wenn der Film ’steht’. Picture Lock im Fachsprech. Die Bilder geben vor, was wann an Geräuschen und Stimme kommt. Welche Vor- und Nachläufe gemacht werden können, damit die Bilder auf einer zweiten Ebene einen zusätzlichen flow erhalten. (Eine bewährte Reihenfolge ist: Erst alle Dialoge / Voice-Over (Off-Kommentare), dann Umgebungsgeräusche, Foley und SFX, zum Schluss die Musik.)
Sounddesign kommt *vor* der Farbstation, weil sich in der weitere Möglichkeiten der ‘subtilen Beeinflussung’ des Zuschauers ergeben, die auf Stimmungen aus dem Ton aufbauen. Kannst natürlich dieses professionelle Vorgehen in den Wind husten – du wirst Sachen doppelt und dreifach machen und vor allem welche vergessen und oder vermasseln. Versprochen. Auch wenn es manchmal juckt – schreib diese Ideen dann ‘zwischen’ und park sie irgendwo, damit sie später parat sind. Ordentliche Schnittprogramme bieten Möglichkeiten für Anmerkungen und Notizen.

Im Schnitt ist es schlau und gewitzt, für alles und jeden eine eigene Audiospur anzulegen. Denn nur so kannst du das hinterher einzeln fein einregeln. Vor allem ist das für die Sprachspuren erforderlich, Weiblein und Männlein erfordern nun einmal unterschiedliche Einstellungen und dann gibt es noch sowas wie unterschiedliche Stimmlagen. Wird vor allem bei szenischen Drehs ein Thema, also, wenn Darsteller mit von der Partie sind. Da sorgst du dann bitte auch dafür, dass Bild- und Ton zusammenbleiben und Schnitte eher über trim gemacht werden, statt mit der Rasierklinge zu wüten. Macht J- und L-cuts deutlich einfacher, wenn die Audiospur munter vorgezogen und nach hinten raus verlängert werden kann.

Bau deine timeline übersichtlich auf.
Wenn dann noch die Spuren farblich nach Art getrennt und obendrein unmissverständlich benannt sind, hilft das zusätzlich beim Kampf durch den Wust. Ganz ganz unten kommen die hübschgemachten, der Rest wird dann schlicht abgeschaltet oder nicht mit ausgerendert oder … was weiss denn ich. Frage des persönlichen workflows für die Endversion des blockbusters.

Workflow Audio Postproduction

Ich gebe dir hier ein paar Sachen an die Hand, ohne jetzt wirklich tief einzusteigen (kann ich auch gar nicht, weil ich kein Tonprofi bin und selbst auch nur an der Oberfläche rumkratze. Wenn ich was in high-end brauche, habe ich da jemanden für). Wenn dir Sachen unklar vorkommen, benutze Hirn und Internet, um schlauer zu werden. Ich gehe auch mehr auf Dialog a.k.a. Stimme ein, weil hier soviel dranhängt und ich dir den Spass beim rumrocken mit Foley und SFX nicht nehmen will 😎 Und ich zeige meinen workflow. Der ist nicht in Stein gemeisselt, der hat sich für mich lediglich als brauchbar rauskristallisiert.
D’accord, es liegt da nun eine geil volle timeline vor uns, Spuren sind alle angelegt, für die Übersicht auch farblich nach ihren Kernbereichen angemalt (Dialog und Voice Over / Atmo und Ambient / Foley und SFX / Mucke … ), in Mono- und Stereo und 5 oder noch mehr.1 aufklamüsert und vielleicht auch schon in dem ein oder anderen mix bus zusammengefasst.
Und noch eine wirklich wichtige Sache : J- und L-cuts bis einer heult (Tonmenschen sprechen von pre-loop (J-cut) und post-loop (L-cut) edits, das nur am Rande). Mensch ‘hört’ immer schon von irgendwo etwas, bevor wir das auch optisch raffen. Diese von Hobbyisten eisenhart gemachten « parallel cuts » (Bild- und Tonspur an derselben Stelle durchzuhacken) hören sich bestenfalls ’komisch’, eher ‘kaputt’ an.
Bei Ton darf zudem gerne alles – wirklich alles – ein- und ausgefadet werden. Kurz reicht, wenn es nicht länger verlangt wird. Wo das ‘zu eng’ aufeinanderhockt mach einen cross fade. Das verhindert, dass es mit Einsetzen des Soundschnipsels ‘klickt’. Ganz kurz nur und ganz doll nervig.

Dialog aufräumen

Wenn picture lock ist weiss ich, wo die Dialoge hinmüssen und wie lang die sind. Dabei entstehen gerne Lücken. Da kommen auf jeden Fall – wenn es irgendwo drinnen ist – room tone oder – draussen – ambient / Umgebungsgeräusche hin. Wie lange, das hängt auch vom gesprochenen Inhalt ab, auf jeden Fall aber in die Lücken. Das hört sich für den Zuschauer ‘organischer’ an, auch, wenn er es gar nicht mitbekommt. Das Unterbewusstsein schneidet das aber mit. Kannst einen drauf lassen. Ausserdem bin ich das dann auch los und kann eingehender mit dem Rest tüdeln.
Room tone / Atmo wie auch ambient / Umgebung klaubst entweder aus den ruhigen Stellen der Dialogspur raus und baust da eigene subtracks von. Oder du Fuchs greifst auf die geilerweise eigens für diesen Zweck aufgenommenen Einminüter zurück. Keine Hemmungen, die in einen loop zu setzen, bei room tone merkt es gar keiner, bei ambient suchst dir die passende Stelle, die unauffällig dafür geeignet ist. War draussen schnatterndes Vogelzeug unterwegs, bau andere mit ein. Fällt weniger auf. Wenn es keine Exoten sind. Die fallen auf, wenn sie nicht zum Ort passen. Die Schnipsel werden öfter gebraucht.

Balancing / Normalize

audio and sound design post production normalize
audio and sound design post production normalize

Balancing meint, alle tracks auf ein annehmbares Level heben.
 In der Regel heisst das, die jeweilige Spur in ihren Spitzen auf -3dB (für den heimischen Fernseher und dieses Internet) zu hieven. Sample Peak Program / mit relative und independant spielen. Leiser machen geht immer und hängt vom finalen Mix ab, wo und überhaupt.
(Mix fürs Kino sollte max -10dB peak haben, aber das ist hier jetzt deutlich over the top 😉 – wenn du das machen darfst, dann wirst du unterwegs auch mitbekommen haben, warum das so soll)
Balancing schafft eine Grundlage für die weiteren Schritte. Die erfolgen bei mir in immer derselben Reihenfolge : Compressor -> De-Esser -> Equalizer. Danach kommen – je nach Bedarf der ‘Störungsbeseitigung’ – De-clip, De-Hum, De-click, De-noise (voice de-noise).

Compressor

Der Compressor gehört bei Audio in den Bereich der Dynamikkontrolle. « Dynamik » bei Audio ist – ähnlich wie bei Bild – der Unterschied zwischen den leisesten und den lautesten Stellen in einer Audiospur. Der Compressor gleicht diese Lautstärken an – laute Teile werden gedrosselt, ohne dass die leisen Sachen dabei untergehen.
 Es ist klassische Handarbeit ; empfehlenswerte Werte gibt es dabei keine. Die Pegel im Auge behalten und dabei darauf achten, dass der Hauptausschlag bei ungefähr -3dB ankommt. Dann sollte es in Ordnung sein. Compressor macht den Dialog für den Zuhörer / Zuschauer leichter verständlich.

audio and sound design post production compressor
audio and sound design post production compressor

Gate
killt dB -> z.B. alles, was unter -35dB liegt. Kann gut benutzt werden, um Hintergrund- / Störgeräusche komplett zu beseitigen, sofern die nicht zu laut sind.

Expander lupft Bereiche an. (ist nur der Vollständigkeit halber – meistens wird der beim Abmischen von Musik benutzt, um von Getrommel das sog. reverb einzufangen.).

Threshold – ist die ‘Lautstärke’ in dB, ab der der Compressor zubeissen soll (-14dB ist ein guter Einstieg ; irgendwas bei -3dB in der Spitze gilt es zu erreichen. Drüber wird schwierig …)

Ratio sagt an, in welchem Verhältnis gedrückt werden soll, wie « aggressiv » der Compressor zuschlagen soll. 
Ratio 2:1 bedeutet dabei : jede 2dB werden auf 1dB gedrückt. Bietet sich in diesem Bereich für Dialog im Besonderen an. Unter allem liegende Mucke im ducking die ratio um und bei 10:1 – 10dB Mucke auf 1dB eindampfen, damit es nicht nervt. « Ducking » ist, wenn die Musik leiser wird, wenn die Stimme einsetzt und wieder lauter, wenn der Sprachteil vorbei ist. Musst du mit spielen, es wird sich ein Gefühl dafür entwickeln, wie sich das am besten anhört. Für eine absolute Unsitte halte ich es in aktuellen Zeiten, wenn fremdsprachliches Original mit deutsch als Voice-Over übersetzt wird und beide bummelig gleich laut sind. Zum Kotzen und eigentlich erstaunlich, dass sowas ‘durchgeht’. Kommt aber gleich, wie es gemacht wird.

Attack – sagt dem Compressor, wie schnell er einsetzen soll. Hier kann geschraubt werden, vor allem bei Musikspuren: Slow attack – bei ‘punchy’ vocals und wenn grössere peaks im track sind. Bringt eine sanftere Kompression, ist damit weniger aufdringlich und « transparenter » für Zuschauer und Zuhörer (z.B. bei Jazzmusik, Folk … )

Hold – wie lange soll der Compressor seine Komprimierung ausführen / halten

Release – wie lange soll der Compressor seine Komprimierung halten, wenn das Eingangssignal wieder unter den eingestellten Schwellwert sinkt. Hier ist vorsichtiges Spielen angesagt, weil es sonst recht schnell ins « pumpen » kommen kann. Und das hört sich dann so richtig nach Amateur an …

Make-Up Gain – VORSICHTIG mit rumspielen ; threshold und release wirken darauf mit ein und verändern das. Je mehr ratio, desto mehr boost kann make-up gain haben. Make-Up Gain erhöht den Dampf, nachdem der Compressor aktiv war.

Ducking / Sidechain

Für den Hinterkopf : Dialog und Voice Over können gerne auch um 0.5dB angezogen werden, solange es nicht zuviel wird.

« People never complain that the dialogue is too high. Complaints are always, that it is too low »

Ducking ist für den Hörer / Zuschauer sehr entspannend, weil gesprochenes Wort verständlich bleibt, während der Rest des Geräuschteppichs im Hintergrund bleibt.
Vorgehen
: Dialogspur auswählen, Compressor anwählen, « SEND » aktivieren. Ob Compressor aktiv ist oder nicht, spielt hierbei keine Rolle.
Anschliessend den Musiktrack (oder Umgebungsgeräusche oder was auch immer du da gedrückt brauchst – ich bleib der Einfachheit wegen mal bei Musik) aussuchen, den für dieses Feintuning nach « S » für solo stellen, Compressor anwählen, « LISTEN » aktivieren. Die Informationen aus der Dialogspur werden jetzt « gehört ». Compressor der Musikspur wird von der Dialogspur « getriggert » / « geschaltet ». Jedesmal, wenn der Dialog einsetzt, wird die Musik leiser gemacht.
Trick : Ratio mindestens 10:1 und hold wie auch release verlängern, damit das nicht in ein wildes Gepumpe abrauscht. Das ist dann widerlich. Gute Kopfhörer sind hier anzuraten, auch wenn die ansonsten zum Abmischen eher verpönt sind. (Mukkespur hinterher wieder von solo befreien nicht vergessen 😉 ).
Statt ducking kann die Musikspur auch schlicht mit -20dB / -25dB dahinplätschern. Kommt unter Umständen auf das gleiche Ergebnis.
Ducking ist angebracht, wenn die Pausen zwischen den Wortbeiträgen etwas länger sind. Voice Over ist zB ein klassischer Anwendungsbereich für das ducking, während bei Dialogen das Absenken über die Länge des Dialogs selbst eher angebracht ist. Wenn das nur kurz ist, fade in und fade out oder mit keypoints arbeiten (vier – einer sagt, wo es losgeht, der nächste, wie weit es runter soll, der kommende, wo es wieder aufhören soll und der letzte, wann es wieder auf Ursprung geht). Keypoints sind z.B. angebracht, wenn Original fremdsprachlich ist und eine germanische Übersetzung drübergelegt werden soll – das Muttersprachliche in den Hintergrund schieben.

De-Esser

audio and sound design post production de-esser
audio and sound design post production de-esser

Einfach zuschalten und machen lassen. Reicht in aller Regel vollkommen aus 😉

Equalizer / Parametric EQ

Das Mischen mit einem EQ ist der Verwendung von Fadern immer vorzuziehen, da mit dem EQ die problematischen Sounds direkt herausgenommen werden. Von hier aus sind Faderbewegungen dann viel effizienter. (Fader in z.B. daVinci Fairlight sind die Schieberegler der einzelnen Kanäle unter den Effekten, EQ und Dynamik).
Mit dem Equalizer werden auch Stimmen ‘angenehmer’ gemacht. Oder verfremdet. Kann man lustige Sachen mit machen – such mal, wie Fernsehstimme aus den 1950ern gebastelt wird und wie ‘Telefonanruf’. Es ist zauberhaft. Hier geht es allerdings erst einmal ‘normal’ weiter 😉

audio and sound design post production equalizer
audio and sound design post production equalizer

Männer und Frauen – Grundwissen

Frequenzbereich weibliche Stimme 175 Hz bis 1180 Hz und « loslegen » tun sie zwischen 200 und 400 Hz.
Frequenzbereich männliche Stimme 80 bis 500 Hz, « voll » im Bereich 100 bis 200 Hz.

Sonst Wissenwertes

Low cut bis 80Hz (bei Mädels bis 100 – 120 Hz, je nach Stimme und Aufnahme). Dieser Frequenzbereich kann eigentlich komplett in die Tonne, zumindest bei Dialogen und VO

Low shelf bei 180-200Hz (leicht ansteigende Kurve) gegen den « Nahbesprechungseffekt » / « proximity effect », bei dem tiefe Frequenzen verstärkt werden, wenn der Sprecher zu nach am Mikro gewesen ist. Diesen Bereich zu bereinigen macht, dass das untenrum « klarer », « leichter » klingt, nicht so dick auftragend.
Zwischen 300 und 1000 Hz kommen Raumgeräusche mit dazu, wenn die ordentlich sind, hört es sich « teuer » an 😉

Q-Factor (Quality Factor / Filtergüte) justiert, wie breit der Einflussbereich des Filterbandes ist. Es ist *das* Mittel, Ungemach auf die Schliche zu kommen.
Je grösser Q, desto schmaler das Band und umgekehrt (Anhebungen / Absenkungen). Irre hochziehen (+20 dB) und dann nach rechts und links hin- und herwandernd die Fehlgeräusche suchen. Wenn lokalisiert, auf -15dB bis -20 dB drücken, Q-Filter leicht erweitern, nächster … 
Je mehr Bänder, desto genauer lässt sich hier dann auch arbeiten – gerne auch mit einem mix-bus.

Sprachverständlichkeit im Bereich um 2kHz – das ist der Bereich, in dem das menschliche Ohr perfekt hören kann. Klare, freie Höhen liegen oberhalb 8kHz – in diesem Bereich bekommt die Stimme einen « luftigen » Klang. High shelf Filter, der das in diesem Bereich anhebt, ist auch eine Möglichkeit.

Dynamischer low shelf filter für die Bereiche unterhalb 200Hz, falls der proximity effect zu deutlich hörbar ist
Dynamischer high shelf filter als De-Esser-Ersatz, Absenkung ab 7kHz

Wet / Dry – Wet : Effekt volle Kanne drauf, Dry : Effekt reduzieren. (Gilt bei allen Audio-plugins / Spielereien, die das anbieten.)

Weiteres Feintuning nach Bedarf

de-Clip – nur, wenn die Aufnahme schon übersteuert ist und deutliche peaks und sonstige Ausreisser aufweist.

de-Hum – « mechanischer Lärm » wie elektrisches Brummen, Lampenbrummen, Lüftersummen und so Sachen. Die « Quellen » sollten gleichmässig sein, sonst wird das nichts.

de-Click – Mundgeräusche wie Schmatzen und ähnliche kalte Schauer. Nur auf die Bereiche anwenden, in denen das vorkommt und nervt. Der Vorgang ist irre rechenintensiv und damit auch entsprechend langsam.

Voice de-Noise – (iZotope RX) gentle / adaptive mode / dialogue und machen lassen. Sollte zu brauchbaren Ergebnissen führen. Noise Reduction ganz zum Schluss, andernfalls kann das bös kontraproduktiv werden.

Schmankerl

Musikunterlegung bei Interviews / Dialogen – Alternative

Nur so ein bisschen. Hört sich dann nicht so « steril », bringt etwas Emotion. Ist ein Vorschlag. Dahinplätschern lassen so mit vielleicht -15 bis -25dB, kein ducking (Ducking ist, wenn Mucke leiser wird, sobald eine Stimme einsetzt und wieder lauter, wenn Stimme aufhört). Bei der Musikspur den Bereich um 1000 Hz nahezu komplett wegnehmen (Kurve macht dann da ein « V », recht steil ( « Q-Factor » hochdrehen, dann wird das 😉 ). Mukkespur alleine hört sich dann irgendwie kaputt an, aber das Gesamtbild macht es, dass die einfach nicht stört, wenn was erzählt wird.
Stereo-Expander für die Musik. Dieser Schritt ist optional, hilft aber bei vielen Mischungen. Der Stereo-Expander verschiebt das Stereobild nach links und rechts, so dass in der Mitte mehr für die Stimme bleibt. Kann bei reiner Monowiedergabe zu Problemen führen, aber wer lauscht denn heute noch in Mono ? 😉

Sound vom Lavalier im EQ hübsch machen

– unterhalb ca. 60 Hz löschen bzw. auf -50 dB setzen
– ca. 15 kHz beschränken für die Höhen und alles drüber kann eigentlich auch auf -50 dB gedrückt werden
– gegen Ende bei ca. 10 kHz ein bisschen hochziehen
– bei ca. 2 – 3 kHz deutlich anheben
– bei ca. 200-300 Hz etwas drücken
– de-Esser einsetzen gegen das Zischen bei « S »
– add **a tiny touch **of short room reverb <- wet down. **Just a touch !**

Telefon, insbes. iPhone hübsch machen

– de-reverb (iZotope RX : -40dB, sensibility 60, ambience 75 bis 80)
– de-Noise (iZotope RX Voice deNoise : adaptive mode / dialogue / reduction ca. -6dB)
– EQ highpass 60Hz / Lowpass 13 bis 14kHz


Puha, Menge Holz, wa ? Unterteile dein Sounddesign nach Hintergrundatmosphäre und ‘action sounds’. Baue es aus einem Mix von room-tone / sonstigen Geräuschen von ‘vor Ort’, foley und Dialog (oder Dialogersatz a.k.a. Voice Over / Off-Kommentar). Damit ist dein blockbuster schon meilenweit vor dem Plunder aus der Hein Tech’schen Plunderei. Hab mit dir selbst Geduld, es wird sich auszahlen. Und vor allem : Hab Spass bei der Sache. Das ist nämlich ziiiemlich geil 🙂