Un peu de théorie pour aborder le mastering

Pour pouvoir réaliser un bon mastering, il faut au moins avoir approché un certain nombre de définitions théoriques. L’objectif n’est pas de devenir un érudit de la technique (ici, point de mathématiques, de théories sulfureuses complètement incompréhensibles) mais de connaître certaines contraintes techniques afin d’éviter quelques erreurs liées à la méconnaissance de ces théories. Je vous invite, pour certaines, à pratiquer quelques exercices afin de les confronter à l’expérience et de vous faire votre propre idée…

Mastering, fréquence audio et fréquence d’échantillonnage

La fréquence audio mesure le nombre d’ondes sonores propagées en une seconde. Elle est mesurée en Herz (HZ). Une fréquence base, 30 Hz par exemple, correspond à une vibration comportant peu d’ondes. Elle correspond aux sons graves. Au contraire, une fréquence haute, 16.000 Hz (16kHz), correspond à une vibration comportant de très nombreuses oscillation durant une seconde.

L’oreille humaine a un potentiel de fréquences audibles (une bande passante) qui s’étale de 20 Hz (graves) à 20 kHz (aigus).

Lorsque l’on échantillonne un signal analogique pour le transcrire en numérique, la fréquence d’échantillonnage doit être au moins deux fois plus grande que la plus haute fréquence que je désire échantillonner (théorème de Nyquist).

L’oreille humaine ayant pour limite haute 20 Khz, les électroniciens se sont penchés sur des composants capables d’échantillonner à plus de 40kHz. Ainsi naquit le standard 44,1 kHz qui donna le jour à un marché énorme. J’ai nommé le compact disc, plus communément appelé CD.

Cette technologie est suffisante pour représenter théoriquement des fréquences allant jusqu’à 22 kHz soit au-delà des plus hautes fréquences audibles pour une oreille humaine.

Mastering et technologie de l’échantillonnage

Mais comment encoder ces échantillons ? Les industriels ont travaillé sur différents standards et celui qui a dominé le marché (et qui reste d’actualité) est le standard PCM : Pulse Code Modulation. Il est le standard de presque tous les formats audionumériques non compressés hormis le format SACD qui emploie de son côté un autre standard d’échantillonnage : le PDM (Pulse Density Modulation)

La principale mise en œuvre du standard PCM date de 1982, date des débuts du CD mais vous l’utiliser certainement encore souvent puisque c’est à partir de ce standard que sont conçus les formats de fichiers AIFF (Mac) et WAV (Windows) pour ne citer que les principaux.

Avant cette date, le mastering consistait principalement à vérifier le signal et à transférer des bandes sur des matrices pour vinyles…

Donc l’objectif de ce standard est de capturer le signal audio analogique et de le transformer en valeurs numériques. Et c’est ici que nous entrons dans le détail !!!

En effet, pour déterminer la qualité d’un échantillonnage PCM, deux variables vont être importantes :

La fréquence d’échantillonnage (12 kHz J , 44,1 kHz , 48 kHz, 88,2 kHz, 96 kHz….) qui va déterminer le nombre d’échantillons qui seront prélevés durant une seconde
La quantification (8 bits, 16 bits, 32 bits virgule flottante) qui va déterminer le nombre de bits qui seront utilisés pour donner une valeur à l’échantillon

Le réglage de la fréquence d’échantillonnage permettra de reproduire des fréquences de plus en plus élevées Théoriquement, une fréquence d’échantillonnage de 96 kHz pourrait reproduire des fréquences supérieures à 40 kHz.

La quantification va elle déterminer la gamme de dynamique que l’échantillonnage et donc représenter et surtout la finesse de cette dynamique.

La gamme dynamique représente la différence de volume entre les sons les plus faibles (le bruit de l’air, la résonance lointaine d’une cymbale, la fin du son de la frappe d’un bol tibétain…) et les sons les plus forts comme l’attaque d’une trompette, la frappe sur une percussion.

Les studios ne sont pas passés du 16 bits au 24 bits par effet de mode : la différence est réellement audible pour un ingénieur du son….au delà de cette quantification de 24 bits, j’avoue manquer de finesse au niveau de mes oreilles pour faire la différence…et je ne pense pas être le seul ;-)

Le 0 dBFS (décibel Full Scale) correspond à la valeur maximale qui peut être atteinte par l’encodage du signal numérisé. La valeur maximale pouvant être atteinte par un échantillonnage en 16 bits est donc de +32.768. Toutes les dynamiques supérieures seront automatiquement coupées et ramenées à cette valeur de +32.768. Il en sera de même pour la seconde partie de l’onde qui sera tronquée à -32.768. Vous créerez donc une distorsion plus connue sous le nom de clipping.

Ce clipping peut ne pas être entendu lors du mixage (effet de masquage par d’autres fréquences et durée du clipping courte par exemple) mais le signal audio numérisé va contenir des aberrations qui vont nous gêner lors de la séance de mastering.

Les normes au studio

La norme du CD présente une résolution que nous appelons 44-16 soit une fréquence d’échantillonnage de 44,1 kHz permettant de représenter des fréquences allant jusqu’à 20 kHz et une quantification de 16 bits qui permet au signal de prendre une valeur comprise entre 32.767 et -32.767. Pour le public non audiophile, c’est la norme ultime qui représente le meilleur son car non compressé. Le format FLAC est un format de compression non destructif qui se base sur le format 44-16 pour encoder le son.

Aujourd’hui, la plupart des studios « PRO » travaillent plutôt en 96-24 voire pour ceux disposant de gros serveurs puissants en 192-24. Le signal audio est donc de meilleure qualité et cela permet de nombreuses manipulations du son sans distorsions liées à l’encodage. De plus, l’expérience de l’écoute est largement plus sympathique et même s’il reste toujours ce petit « je ne sais quoi » qui différencie un enregistrement de la réalité, la différence avec le format 44-16 est bien présente.

Le premier format qui m’en a fait prendre conscience est le format 48-24 qui m’ bluffé lors d’une comparaison avec un travail en 44-16….un véritable bond en avant dans le travail de mixage comme dans celui de mastering…avec la douleur de revenir en 44-16 pour le pressage CD L. Le passage au 96-24 a été moins spectaculaire mais il reste présent lors des étapes du mastering. Je ne suis pas passé au 192 kHZ car le format ne m’a rien apporté au niveau de l’expérience vécue même si mes convertisseurs sont capable de le gérer.

Et le mastering dans tout cela ?

Le mastering va devoir tenir compte de 3 effets liés à la numérisation

Mastering, clipping, sous-échantillonnage, dithering et aliasing

En voilà un joli lot de noms barbares…ces concepts forment néanmoins un ensemble qui va polariser l’attention de l’ingénieur du son dans le studio de mastering à différentes étapes du mastering.

Le clipping

Le clipping, je vous en ai parlé tout à l’heure lors de la présentation du 0 dBFS. Si vous n’y prêtez pas attention, une sortie d’équaliseur un peu trop amplifiée alors que le signal d’entrée est déjà en limite haute peut vous créer dans le meilleur des cas des craquements numériques audibles soit des distorsions liées à du clipping qui vous gêneront dans les traitements qui suivront (et vous vous ferez une réflexion du type : je ne comprends pas, je n’arrive pas à le faire sonner…).

C’est pour cela que je vous conseille lors de vos masterings numériques de bien régler les volumes d’entrée et de sortie des différents outils de votre chaine de mastering. Maintenant, les distorsions peuvent être un choix artistique voulu (en Electro par exemple) mais surement pas les craquements ;-(…

Aliasing

Lorsque vous travaillerez sur de beaux enregistrements, vous aurez peut-être à faire face à un effet désagréable, l’aliasing. Kesako ? C’est un effet perceptible dans les fréquences hautes lorsque vous échantillonnez en 44.1 kHz. La fréquence maximale représentable par cette fréquence d’échantillonnage est de 22,05 kHz. Si je cherche à reproduire une fréquence de 26,05 kHz qui existe dans le signal, il y aura un effet de repliement du spectre et l’échantillon va enregistrer une fréquence de 18,05 kHz ( 22,05 kHz- (26,05 – 22,05) ).

Cet effet va créer des aberrations dans le spectre sonore et donc nous fournir une expérience d’écoute désagréable. C’est un effet que vous obtiendrez surtout lorsque vous aurez besoin de sous-échantillonner.

Le sous échantillonnage est l’action de baisser la fréquence d’échantillonnage comme par exemple lors de la préparation d’un Cd en passant la fréquence d’échantillonnage du signal de 96 kHz (signal source) à 44,1 kHZ (échantillonnage cible pour le CD).

Sans outils spécifiques d’antialiasing, ce traitement créera des effets non désirés principalement dans le haut du spectre : vous venez de découvrir l’aliasing…

Et pour terminer, vous prendrez bien un peu de dithering ?

Tout à l’heure, nous avons aperçu les problèmes liés à une réduction de la fréquence d’échantillonnage et bien, il existe aussi des problèmes lors de la réduction de quantification. Lorsque vous passez de 24 bits à 16 bits, le système va devoir créer des approximations, des arrondis qui vont créer de la distorsion dans le signal (c’est le système de suppression des bits supplémentaires qui en est responsable).

Dithering

Pour essayer de réduire ces distorsions, le dithering va calculer au mieux la nouvelle quantification en se basant sur différents modèles mathématiques (triangulaire, gaussien…).

Ce procédé va réellement réduire les distorsions mais va rajouter du « bruit » dans l’enregistrement. Le process de dithering sera donc en général accompagné d’un traitement de réduction du bruit (version légère…).

Conclusion

Vous l’aurez peut-être remarqué mais dans cet article, je n’ai pas vraiment pris position (limite haute de l’oreille humaine, limite basse…) mais comme il s’agit ici de fournir une information simple, je n’ai pas voulu perdre le débutant avec des polémiques non nécessaires à ce stade.

Ne vous inquiétez pas, je reviens bientôt avec un article sur la compression audio (compression destructive) ;-)…..

Pour gagner du temps dans votre apprentissage du mastering, j’ai découvert une formation vraiment pas chère qui permet d’aborder un mastering réel pour le prix d’un restau en solo. Lorsque je me forme, le coût de mes masterclass est de l’ordre de 500 euros. Dans ce cours, pour le prix de 2 ou 3 paquets de clopes, un ingénieur du son fait le tour de différentes techniques et vous les présente. Ce serait dommage de vous en priver, vous allez vraiment gagner beaucoup de temps et peut être découvrir (pour les ingés son expérimentés) des techniques que vous ne pratiquiez pas.

Formation au mastering

Tags: aliasing, clipping, cours de mastering, dithering, échantillonage, formation mastering, mastering, quantification, technique mastering, tuto mastering, tutoriel mastering

Mastering addict - Formation au mastering

Tutoriel et méthode de mastering

Des difficultés sur votre mastering ? Besoin d'un ingénieur de mastering ?