Hoe werkt: Noise shaping
Noise shaping is een techniek die wordt gebruikt bij digitale audioverwerking om de hoorbaarheid van kwantisatie-ruis te verminderen. Het wordt vaak genoemd in één adem met dithering, omdat noise shaping in feite een slimme manier is om de onvermijdelijke ruis die ontstaat bij het naar een lagere bitdiepte omzetten, minder storend te maken voor het menselijk gehoor. In plaats van de ruis gelijkmatig over alle frequenties te verdelen (witte ruis), wordt de ruis als het ware “gevormd”: meer van de ruisenergie wordt naar frequentiegebieden verplaatst waar onze oren minder gevoelig voor zijn, en minder ruis in de meest gevoelige gebieden (met name het middengebied rond 2-5 kHz waar ons gehoor het scherpst is).
Hoe werkt: Noise shaping uitgelegd
Wanneer je audio van bijvoorbeeld 24-bit naar 16-bit brengt (denk aan het masteren voor CD), moet het audio-signaal afgerond worden naar minder precisie. Dit afronden introduceert zeer zacht ruis-achtig foutsignaal (quantization noise). Dithering voegt bewust een klein beetje random ruis toe vóór dat afronden, waardoor de quantization noise niet als vervorming maar als zacht ruisvloer gepresenteerd wordt – dat klinkt al veel prettiger.
Maar die ruis door dithering kan nog verder geoptimaliseerd worden via noise shaping. Onze oren zijn minder gevoelig in de extreem lage en hoge frequenties. Noise shaping filters de ditherruis zodanig dat er relatief meer ruisenergie in die uitersten belandt en relatief minder in het middengebied. Bijvoorbeeld, een veelgebruikt noise shaping curve houdt 500 Hz – 8 kHz relatief rustig qua ruis, maar boven 10 kHz mag de ruis sterker zijn (daar merk je het minder, tenzij op heel goede speakers of voor jonge oren), en ook onder 100 Hz doet wat extra ruis er vaak niet toe (die gaan vaak toch verloren in systeemruis of onhoorbaarheid).
Het resultaat is dat het waargenomen ruisniveau door noise shaping lager is dan ongevormde ruis zou zijn, voor ons oor. In metingen zie je het totale ruisniveau gelijk blijven, maar de verdeling verandert.
Hoe werkt: Noise shaping in de praktijk
Als je in een mastering- of audio-export menu ziet staan “Dither: on” en een keuze voor “Noise shaping: bijvoorbeeld POW-R type 1, type 2, etc.,” dan gaat het hierover. Voor een thuisstudio producer die op het eind zijn track bounce naar 16-bit WAV, is het meestal aan te raden dithering aan te zetten met een geschikte noise shaping voor muziek. De precieze curve (bijv. POW-R #1 vs #3) is niet enorm cruciaal, het zijn gewoon verschillende noise shaping profielen – vaak eentje algemener voor diverse muziek, eentje geoptimaliseerd voor meer klassiek/dynamisch werk, enz. Het verschil is subtiel.
Belangrijk om te weten: noise shaping is echt alleen zinvol bij het definitieve terugbrengen naar lagere bitdiepte. In 24-bit mixen voegt men doorgaans wel dither toe als er truncation is, maar noise shaping op 24-bit is niet nodig omdat de ruisvloer al ver onder gehoorniveau zit. Bij 16-bit audio (CD kwaliteit) echter kan noise shaping net dat beetje extra dynamisch bereik hoorbaar houden.
Stel, je hebt een fade-out van een nummer naar stilte. Zonder dithering hoor je bij de laatste paar bits soms krasserige artefacts. Met dither krijg je een zacht ruisje in plaats daarvan. Met noise shaping dither zul je merken dat dat ruisje voornamelijk een hoogfrequente ‘shh’ is en nauwelijks midden, wat minder opvalt tussen de muziek.
In mixing zelf gebruik je noise shaping niet actief als effect; het is meer een mastering-procesing detail. Maar het concept wordt elders ook toegepast: bijvoorbeeld in synthesizers of samplers om low-bit sounds beter te maken voor het oor, of in sommige noise reduction algoritmes.
Als gebruiker hoef je meestal alleen maar de juiste optie te kiezen in je export of plugin. Je zal niet direct “horen” dat noise shaping aan staat in een blinde test, behalve dat de stilte net iets schoner lijkt. Het is subtle, maar draagt bij aan maximale kwaliteit bij bitreductie.
Samenvattend: noise shaping verplaatst de energie van toegevoegde ruis naar plekken waar je het minst last ervan hebt. Zo kun je bijv. effectief 1 of 2 bits meer bruikbaar dynamisch bereik in het cruciale middengebied behouden, zonder dat de totale ruis toeneemt – hij is alleen slim verdeeld. Dit is een geavanceerd maar belangrijk concept om te begrijpen als je je muziek op verschillende formaten optimaal wil laten klinken.