A quelle fréquence d'échantillonnage travailler - Studio résidentiel La Boîte à Meuh

A quelle fréquence d’échantillonnage travailler

Cette question revient souvent : à quelle fréquence d’échantillonnage travailler ?
Vaste débat à l’heure ou de nombreux convertisseurs analogiques/numériques proposent jusqu’à 192 kHz.

Numérisation audio

Petits rappels pour ceux qui ne sont pas à l’aise avec la technique.

Un son est caractérisé par :

sa fréquence mesurée en hertz (Hz)
son amplitude, mesurée en décibels (dB) en acoustique ou en volts (V) lorsqu’il est enregistré avec des appareils électriques analogiques.

Pour rappel, un micro est un capteur qui transforme des ondes acoustiques en courant électrique.

La résolution

Pour numériser un son, on mesure l’amplitude d’un signal analogique à intervalles réguliers fixes que l’on code sur un certain nombre de bits numériques.
Cela s’appelle l’échantillonnage.
Plus il y a de bits plus on peut coder précisément la valeur de l’échantillon.
Un bit a deux valeurs possibles, 0 ou 1.
Un mot numérique de 16 bits est donc une succession de 0 et de 1.
Le nombre de bits est appelé résolution, on parle par exemple de résolution 16 bits.

La dynamique

Sur un bit on a du son ou on n’en a pas.
Sur deux cela fait quatre valeurs (ou paliers) possibles, sur trois cela en fait huit etc.
Chaque bit rajouté double le nombre de valeurs possibles.
Sur 16 bits on a 2 puissance 16 valeurs soit 65536 paliers.
Sur 24 bits cela en fait 16777216.

En son, on exprime les niveaux en décibel (dB).
Chaque fois qu’on double le niveau sonore (quand on ajoute un bit en numérique), on ajoute 6 dB.

Donc pour 16 bits on a 16 x 6 dB = 96 dB de dynamique.
Pour 24 bits on obtient 24 x 6 dB =144 dB de dynamique.

La dynamique est la différence entre le niveau le plus fort et le plus faible.

La fréquence d’échantillonnage

L’intervalle auquel on prend ces mesures est la fréquence d’échantillonnage exprimée en hertz (Hz).

1 Hz = 1 intervalle ou cycle par seconde.
44,1 kHz = 44100 Hz soit 44100 mesures par seconde ou une mesure toutes les 0,023ms.

Théorème de Nyquist

Ce théorème nous dit qu’il faut échantillonner un son au double de sa plage de fréquence utile pour le reproduire de manière optimum.
La plage de fréquence utile est la fréquence max moins la fréquence min.
L’oreille humaine peut percevoir les sons de 20Hz jusqu’à 20 kHz.
Il faut donc échantillonner au delà de 2 x 20 kHz soit au delà de 40 kHz pour coder l’ensemble du spectre audible.

Formats utilisés

A l’arrivée des produits numériques, les acteurs de l’industrie du disque et de l’audiovisuel se sont mis d’accords sur deux standards :

44,1 kHz 16 bits pour le CD audio
48 kHz 16 bits pour l’audio accompagnant des vidéos (TV, DVD, vidéos internet etc)

De nouveaux standards dits haute définition (HD) commencent à apparaître.
Ils consistent à travailler à une résolution plus élevée et/ou une fréquence d’échantillonnage plus élevée :

32 ou 24 bits au lieu de 16
96 ou 192 kHz au lieu de 44,1/48 kHz

Ces standards haute définition sont rendus possibles par les performances des convertisseurs modernes.
Ils travaillent maintenant en 24 bits et peuvent proposer des fréquences d’échantillonnage jusqu’à 192 kHz.

Au début de la démocratisation du numérique, les convertisseurs ne proposaient que du 16 bits 44,1 kHz ou 48 kHz.

Quelle fréquence d’échantillonnage ?

Echantillonnage 44k1 ou 48k

Il est important de choisir dès le début la fréquence d’échantillonnage en fonction de l’utilisation finale des fichiers audio.
44,1 kHz pour du CD et 48kHz pour de la vidéo.

La conversion entre 44,1k et 48k ne permet pas toujours de resynchroniser correctement des fichiers entre eux :

convertir un fichier enregistré en 44k1 vers du 48k pour le placer sur une vidéo ne permet pas forcément de le synchroniser correctement avec l’image
diffuser un enregistrement 44k1 (un CD par exemple) en analogique et enregistrer un instrument additionnel en 48k ne permet pas forcément de synchroniser les deux ensemble si on les importe dans le même projet en convertissant un des deux à la fréquence de l’autre.

A notre époque de musique dématérialisée et de réseaux sociaux, l’image a pris beaucoup d’importance.
De nombreuses vidéos sont tournées de manière réfléchies et anticipées ou pas (téléphone portables) et leur utilisation par la suite nécessitera une synchronisation avec l’audio enregistré.

Echantillonnage HD

Augmenter la fréquence d’échantillonnage et la résolution d’un fichier audio après enregistrement n’apportera pas de gain qualitatif.
Idem pour un son enregistré à des valeurs plus élevées qui auraient été réduites aux standards habituels après mixage et mastering et qu’on voudrait ensuite repasser en HD.

Si on veut travailler à des fréquences plus élevées, il vaut mieux choisir un multiple de deux du standard final.
Cela facilitera la conversion finale sans perte de synchronisation.

Tous les professionnels et scientifiques ne sont pas d’accords sur le gain de qualité d’un échantillonnage à 88,2 kHz (double du format CD), 96 kHz (double du format vidéo) ou plus.
Certains n’y voient que du marketing pour vendre des produits plus chers.

Une chose est certaine, une majorité de studios et de projets fonctionnent encore en 44,1 ou 48 kHz même s’ils ont la capacité de faire plus.

Bien avoir en tête que travailler au double des fréquences d’échantillonnage standards :

consomme deux fois plus de stockage disque
fait travailler deux fois plus les processeurs des ordinateurs lors du traitement du son (deux fois moins de plugins ouverts lors du mixage).
double le débit dans les connexions numériques.

Doubler le débit divise par deux le nombre de canaux disponibles dans certains types de connexions numériques :

un port ADAT pouvant véhiculer 8 canaux en 44,1 ou 48 kHz n’en passera que 4 en 96k et 2 en 192k

un port MADI pouvant véhiculer 64 canaux en 48k passera à 32 en 96k et 16 en 192k

Latence

L’augmentation du débit réduit la latence des ordinateurs ce qui est positif à conditions qu’ils aient la puissance de calcul nécessaire pour y faire face.
La latence est le temps nécessaire au processeur pour traiter les données audio.
Elles se règle dans les drivers de la carte son.
Lorsque le processeur n’arrive pas à traiter correctement l’audio, cela se traduit par des clics numériques, des craquements ou des coupures de son.
On augmente alors la latence pour laisser le temps au processeur de traiter les données audio.

24bits / 192 kHz Music downloads …and why they make non sense

Pour ceux qui maîtrisent bien l’anglais et la technique, voici les liens vers un article et deux vidéos de « Monty » Montgomery.

Christopher « Monty » Montgomery est le créateur américain du format de conteneur Ogg Free Software et du codec audio Vorbis, entre autres, et le fondateur de The Xiph.Org Foundation, qui promeut les codecs multimédia du domaine public. (Wikipedia)

Bien qu’extrêmement pédagogiques ces vidéos de vulgarisation font appel à des notions physiques et mathématiques assez pointues.
Elles sont néanmoins passionnantes.

Article : 24bits / 192 kHz Music downloads …and why they make non sense

Les vidéos disposent en haut de leur fenêtre de trois menus permettant de choisir la taille, d’aller directement au chapitre voulu et d’afficher des sous-titres dont le français.
Je suis bien content de m’en rendre compte maintenant après m’être tout farci en anglais sans sous-titres!

Vidéo 1 : A Digital Media Primer for Geeks

Vidéo 2 : Digital Show & Tell

Samplerates : the higher the better, right ?

Vidéo en anglais non sous-titrée publiée par le concepteur de plugins FabFilter .
Au delà de la pub pour leurs plugins, cette vidéo est très pédagogique.

Voici un résumé pour ceux qui ne maîtrisent pas l’anglais.

Enregistrer au dessus de 48kHz peut créer des problèmes d’aliasing avec les traitements non linéaires (compresseurs, distortions).
L’aliasing (repliement du spectre en français) se manifeste comme des harmoniques indésirables apparaissant dans le spectre audible.

Les fonctions de suréchantillonnage (oversampling) des plugins permettent de calculer les traitements à des fréquences d’échantillonnage plus élevées et revenir à la fréquence d’échantillonnage du projet en éliminant cet aliasing.
Les aliasing générés dans les différents cas de figure exposés (fréquence d’échantillonnage trop faible ou trop élevée) sont très subtils voire parfois difficilement audibles.

La conclusion est qu’il ne faut pas attacher d’importance à la fréquence d’échantillonnage.
Ce qui sous-entend aussi que cela ne vaut pas le coup de travailler à 96 kHz (et plus), cela génère des fichiers deux fois plus gros et demande deux fois plus de puissance de calcul à l’ordinateur lors du mix.
La réponse à la question initiale Samplerates : the higher the better, right ? (fréquences d’échantillonnage , est ce vrai que le plus élevé est le mieux ?) est donc non.

La dernière conclusion de la vidéo est que 48kHz offre un léger gain par rapport à 44.1 kHz

Liste des publications ici avec notamment :

A quelle fréquence d’échantillonnage travailler

Numérisation audio

La résolution