Rubrique : Démos trucs et astuces

Latence et station audio numérique

Démos trucs et astuces

studio-la-boite-a-meuh-latence-2Petit article à destination des néophytes qui sont nombreux à se lancer dans des enregistrements à la maison et qui sont confrontés aux problèmes de latence.

Qu’est-ce que la latence  avec laquelle il faut composer dans votre STAN, comment contourner le problème ?

STAN, Station Audio Numérique est l’acronyme de Digital Audio Workstation en anglais (abréviation DAW).
C’est un système d’enregistrement et de mixage audio composé d’un ordinateur avec un logiciel séquenceur audio et une carte son.

Vous découvrez quand vous enregistrez que le son de ce que vous entendez à travers votre STAN arrive en décalage avec le son direct.
Ce délai résulte de la latence du STAN.

Définition

La latence est le temps nécessaire à l’ordinateur pour traiter les données audio.
Elle dépend de la puissance du processeur de l’ordinateur et du nombre de tâches qu’il doit gérer en même temps.

studio-laboite-a-meuh-reglage-latenceLa latence est fixée par un réglage dans le driver ASIO de la carte son.
Par ce réglage, le driver impose un temps de traitement à l’ordinateur.

Lorsque le temps de traitement est trop court par rapport aux capacités de calcul de l’ordinateur, des craquements et coupures apparaissent dans le son.

En augmentant le temps de traitement dans les réglages du driver ASIO on soulage le processeur.
Ce temps de traitement se traduit par un délai entre le son émis par le musicien et le son entendu via le séquenceur.
Il peut devenir gênant quand il est trop élevé.

 

Fonctionnement de la latence

Les données audio sont traitées par paquets et stockées dans une mémoire tampon appelée buffer en anglais.

studio-la-boite-a-meuh-latence-enregistrement-Ce buffer stocke le nombre d’échantillons (samples en anglais) définis par le réglage du driver ASIO puis les transmet.
Le nombre d’échantillons stockés détermine le temps alloué à l’ordinateur pour traiter le son.

La fréquence d’échantillonnage de travail fixe le rythme de stockage des échantillons.
Elle représente le nombre d’échantillons prélevés en une seconde.
44,1 kHz = 44100 échantillons par seconde.
Un échantillon est pris toutes les 0,0223 ms à 44,1 kHz ou toutes les 0,0208 ms à 48 KHz

studio-la-boite-a-meuh-latence-midiLe buffer se règle en multiple de 16 que l’on double à chaque fois : 16 samples, 32, 64, 128, 256, 1024, 2048, 4096

Le flux audio dans l’ordinateur passe par un buffer en entrée et en sortie.
Par conséquent, un son présent sur une entrée et écouté à travers le séquenceur subit deux fois la latence du réglage de buffer.

En augmentant la fréquence d’échantillonnage, on diminue la latence mais on augmente la charge sur le processeur.

Pour y voir plus clair sur le choix de la fréquence d’échantillonnage de travail, vous pouvez aller voir cet article sur le site :
A quelle fréquence d’échantillonnage travailler ?

Rôle du format du port utilisé entre la carte son et l’ordinateur

Plusieurs formats sont disponibles : Thunderbolt, Firewire 400 ou 800, USB 2 ou 3 (l’USB 1 est obsolète).

D’énormes progrès ont été réalisés.
Impensable il y a quelques années, certaines interfaces son passent 128 canaux dans de l’USB 2, exemple la RME Madiface USB : 64 in / 64 out.

Le délai de traitement des données audio est fixé par le driver ASIO indépendamment du format de port utilisé.
Celui-ci joue plus à travers son taux de transfert de données sur le nombre de pistes qu’on peut traiter simultanément.

  • USB 2 : 400 Mbits/s
  • USB 3 : 5 GBits/s
  • Firewire 400 : 400 MBits/s mais solicite moins le processeur que l’USB 2
  • Firewire 800 : 800 Mbits/s
  • Tunderbolt 10 Gbits/s
  • l’USB C n’est pas un format mais une connectique différente qui peut accueillir de l’USB 2 ou 3 ou du Thunderbolt

La qualité des drivers joue donc un rôle plus important que le format du port pour les performances de latence.

Pour ceux qui veulent approfondir : le forum Audiofanzine ou cet article de l’importateur La Boîte Noire du Musicien.

Perception de la latence

Un réglage moyen de buffer de 256 échantillons à 48 kHz représente 256/48000 = 5,33 ms (ou 256 x 0,0208 ms) de latence.

On obtient donc une latence totale de 2 x 5,33 = 10,66 ms lorsqu’on écoute sa piste en enregistrement à travers le séquenceur.

Pour bien faire, il faudrait ajouter les délais de traitement des convertisseurs.

studio-la-boite-a-meuh-perception-delaiLe temps de traitement pour un convertisseur (A/N ou N/A) va de quelques samples à quelques dizaines de samples.
Soit de moins de 0,2 ms à 48 kHz à plus de 2 ms en fonction des marques et des générations.

Le délai entre deux ondes acoustiques identiques devient bien perceptible à partir d’une dizaine de mètres de distance entre elles (ondes reçues avec une trentaine de millisecondes d’écart).
Mais le seuil de perception de la latence est encore inférieur lorsqu’on chante ou qu’on joue d’un instrument.
Certains y sont sensibles à partir d’une dizaine de millisecondes.

Lorsqu’on utilise un instrument virtuel (plugin dans le séquenceur) commandé par un clavier en midi on ne subit que la latence du buffer de sortie.
Celle-ci peut se constater par le décalage entre l’action sur une touche du clavier et l’arrivée du son.

Comment contourner le problème

Pour palier aux problèmes liés à la latence, on évite d’écouter les pistes en cours d’enregistrement à travers le séquenceur.
Soit en utilisant les fonctions de monitoring direct de la carte son, soit en passant par une console de mixage pour gérer l’écoute.

studio-la-boite-a-meuh-latence-enregistrement-monitoring-direct-        studio-la-boite-a-meuh-latence-enregistrement-monitoring-console
L’écoute en monitoring direct envoie les entrées de la carte son aux sorties de la carte son sans passer à travers l’ordinateur.
Sur des cartes son élaborées, le monitoring direct se fait après conversion numérique à l’aide d’une interface de mixage logicielle propre à la carte (ex RME et Totalmix).
Sinon le direct monitoring se fait en analogique.

Il n’y a pas de solution similaire pour les instruments  virtuels (commandés par un clavier midi), on ne peut les écouter qu’à travers la STAN.
Il faut descendre le buffer à la plus petite latence supportée par le système.
Si la latence reste trop élevée,  pendant l’enregistrement, on peut choisir d’écouter via les entrées un son interne du clavier proche de celui de l’instrument virtuel .
On enregistre en midi et on pourra affecter ensuite le plugin d’instrument désiré.
Ce n’est pas idéal car l’interprétation dépend aussi de la réaction de l’instrument joué; si on n’écoute pas le bon…

C’est la raison pour laquelle il faut des ordinateurs puissants pour gérer des instruments virtuels.
Une machine avec un processeur performant et beaucoup de RAM pour les grosses banques de sons.

 

Liste des publications du site ici.

studio-la-boite-a-meuh-test-yamahiko

Yamahiko pour piano – Test rapide

Démos trucs et astuces

Il y a peu d’infos et tests sur les capteurs Yamahiko pour piano.
Quelques ingés son m’ont sollicité après avoir vu qu’il y avait un Yamahiko CPS-PF1R au studio.

Voici un petit test comparatif enregistré vite fait lors d’une séance d’accordage.
On y écoutera une paire d’Oktava mk012 cardioïdes en couple ORTF placés dans le creux à l’extérieur du piano et le  Yamahiko CPS-PF1R brut et égalisé.

 

studio la boite à meuh - audio-technica AT8449

Réparation de suspension Audio-Technica AT8449

Démos trucs et astuces

studio la boite à meuh - audio-technica AT8449 studio la boite à meuh - audio-technica AT8449 
La suspension Audio-Technica AT8449 est conçue pour être utilisée avec les micros AT4033, 4040, 4047/SV (2 exemplaires au studio) et MP, 4050 et 4080.

studio la boite à meuh - audio-technica AT8449Tout repose sur un élastique plat, pas des plus faciles à positionner dans lequel vient se loger le micro.
Lorsqu’il casse c’est la galère.

Bien que cela ne paraisse pas évident à première vue, cet élastique peut se changer.
C’est une bonne nouvelle car il coûte 3,49€ chez Thomann (je ne l’ai trouvé que chez eux sous le nom Audio-Technica AT8449 rubber) alors que la suspension coûte 88€.

studio la boite à meuh - audio-technica AT8449Pour l’installer, il faut enlever la suspension élastique.

Ce long fil élastique est fermé par une pièce de métal noire repliée dans laquelle il est serti.

Il faudra donc réussir à déplier la patte métallique pour libérer un des deux brins du fil.

On pourra ensuite retirer le fil puis placer l’élastique plat.

studio la boite à meuh - audio-technica AT8449

studio la boite à meuh - fréquence d'échantillonnage

A quelle fréquence d’échantillonnage travailler

Démos trucs et astuces

Cette question revient souvent : à quelle fréquence d’échantillonnage travailler ?
Vaste débat à l’heure ou de nombreux convertisseurs analogiques/numériques proposent jusqu’à 192 kHz.

studio la boite à meuh - fréquence d'échantillonnageNumérisation audio

Petits rappels pour ceux qui ne sont pas à l’aise avec la technique.

Un son est caractérisé par :

  • sa fréquence mesurée en hertz (Hz)
  • son amplitude, mesurée en décibels (dB) en acoustique ou en volts (V) lorsqu’il est enregistré avec des appareils électriques analogiques.

Pour rappel, un micro est un capteur qui transforme des ondes acoustiques en courant électrique.

studio la boite à meuh - fréquence d'échantillonnageLa résolution

Pour numériser un son, on mesure l’amplitude d’un signal  analogique à intervalles réguliers fixes que l’on code sur un certain nombre de bits numériques.
Cela s’appelle l’échantillonnage.
Plus il y a de bits plus on peut coder précisément la valeur de l’échantillon.
Un bit a deux valeurs possibles, 0 ou 1.
Un mot numérique de 16 bits est donc une succession de 0 et de 1.
Le nombre de bits est appelé résolution, on parle par exemple de résolution 16 bits.

Son-numeriseLa dynamique

Sur un bit on a du son ou on n’en a pas.
Sur deux cela fait quatre valeurs (ou paliers) possibles, sur trois cela en fait huit etc.
Chaque bit rajouté double le nombre de valeurs possibles.
Sur 16 bits on a 2 puissance 16 valeurs soit 65536 paliers.
Sur 24 bits cela en fait 16777216.

En son, on exprime les niveaux en décibel (dB).
Chaque fois qu’on double le niveau sonore (quand on ajoute un bit en numérique), on ajoute 6 dB.

Donc pour 16 bits on a 16 x 6 dB = 96 dB de dynamique.
Pour 24 bits on obtient 24 x 6 dB =144 dB de dynamique.

La dynamique est la différence entre le niveau le plus fort et le plus faible.

La fréquence d’échantillonnage

L’intervalle auquel on prend ces mesures est la fréquence d’échantillonnage exprimée en hertz (Hz).

1 Hz = 1 intervalle ou cycle par seconde.
44,1 kHz = 44100 Hz soit 44100 mesures par seconde ou une mesure toutes les 0,023ms.

Théorème de Nyquist

Ce théorème nous dit qu’il faut échantillonner un son au double de sa plage de fréquence utile pour le reproduire de manière optimum.
La plage de fréquence utile est la fréquence max moins la fréquence min.
L’oreille humaine peut percevoir les sons de 20Hz jusqu’à 20 kHz.
Il faut donc échantillonner au delà de 2 x 20 kHz soit au delà de 40 kHz pour coder l’ensemble du spectre audible.

Formats utilisés

A l’arrivée des produits numériques, les acteurs de l’industrie du disque et de l’audiovisuel se sont mis d’accords sur deux standards :

  • 44,1 kHz 16 bits pour le CD audio
  • 48 kHz 16 bits pour l’audio accompagnant des vidéos (TV, DVD, vidéos internet etc)

De nouveaux standards dits haute définition (HD) commencent à apparaître.
Ils consistent à travailler à une résolution plus élevée et/ou une fréquence d’échantillonnage plus élevée :

  • 32 ou 24 bits au lieu de 16
  • 96 ou 192 kHz au lieu de 44,1/48 kHz

Ces standards haute définition sont rendus possibles par les performances des convertisseurs modernes.
Ils travaillent maintenant en 24 bits et peuvent proposer des fréquences d’échantillonnage jusqu’à 192 kHz.

Au début de la démocratisation du numérique, les convertisseurs ne proposaient que du 16 bits 44,1 kHz ou 48 kHz.

Quelle fréquence d’échantillonnage ?

Echantillonnage 44k1 ou 48k

Il est important de choisir dès le début la fréquence d’échantillonnage en fonction de l’utilisation finale des fichiers audio.
44,1 kHz pour du CD et 48kHz pour de la vidéo.

La conversion entre 44,1k et 48k ne permet pas toujours de resynchroniser correctement des fichiers entre eux :

  • convertir un fichier enregistré en 44k1 vers du 48k pour le placer sur une vidéo ne permet pas forcément de le synchroniser correctement avec l’image
  • diffuser un enregistrement 44k1 (un CD par exemple) en analogique et enregistrer un instrument additionnel en 48k ne permet pas forcément de synchroniser les deux ensemble si on les importe dans le même projet en convertissant un des deux à la fréquence de l’autre.

A notre époque de musique dématérialisée et de réseaux sociaux, l’image a pris beaucoup d’importance.
De nombreuses vidéos sont tournées de manière réfléchies et anticipées ou pas (téléphone portables) et leur utilisation par la suite nécessitera une synchronisation avec l’audio enregistré.

Echantillonnage HD

Augmenter la fréquence d’échantillonnage et la résolution d’un fichier audio après enregistrement n’apportera pas de gain qualitatif.
Idem pour un son enregistré à des valeurs plus élevées qui auraient été réduites aux standards habituels après mixage et mastering et qu’on voudrait ensuite repasser en HD.

Si on veut travailler à des fréquences plus élevées, il vaut mieux choisir un multiple de deux du standard final.
Cela facilitera la conversion finale sans perte de synchronisation.

Tous les professionnels et scientifiques ne sont pas d’accords sur le gain de qualité d’un échantillonnage à 88,2 kHz (double du format CD), 96 kHz (double du format vidéo) ou plus.
Certains n’y voient que du marketing pour vendre des produits plus chers.

Une chose est certaine, une majorité de studios et de projets fonctionnent encore en 44,1 ou 48 kHz même s’ils ont la capacité de faire plus.

Bien avoir en tête que travailler au double des fréquences d’échantillonnage standards :

  • consomme deux fois plus de stockage disque
  • fait travailler deux fois plus les processeurs des ordinateurs lors du traitement du son (deux fois moins de plugins ouverts lors du mixage).
  • double le débit dans les connexions numériques.

Doubler le débit divise par deux le nombre de canaux disponibles dans certains types de connexions numériques :

  • un port ADAT pouvant véhiculer 8 canaux en 44,1 ou 48 kHz n’en passera que 4 en 96k et 2 en 192k
  • un port MADI pouvant véhiculer 64 canaux en 48k passera à 32 en 96k et 16 en 192k
Latence

L’augmentation du débit réduit la latence des ordinateurs ce qui est positif à conditions qu’ils aient la puissance de calcul nécessaire pour y faire face.
La latence est le temps nécessaire au processeur pour traiter les données audio.
Elles se règle dans les drivers de la carte son.
Lorsque le processeur n’arrive pas à traiter correctement l’audio, cela se traduit par des clics numériques, des craquements ou des coupures de son.
On augmente alors la latence pour laisser le temps au processeur de traiter les données audio.

24bits / 192 kHz Music downloads …and why they make non sense

Pour ceux qui maîtrisent bien l’anglais et la technique, voici les liens vers un article et deux vidéos de « Monty » Montgomery.

Christopher « Monty » Montgomery est le créateur américain du format de conteneur Ogg Free Software et du codec audio Vorbis, entre autres, et le fondateur de The Xiph.Org Foundation, qui promeut les codecs multimédia du domaine public. (Wikipedia)

Bien qu’extrêmement pédagogiques ces vidéos de vulgarisation font appel à des notions physiques et mathématiques assez pointues.
Elles sont néanmoins passionnantes.

Article : 24bits / 192 kHz Music downloads …and why they make non sense

Les vidéos disposent en haut de leur fenêtre de trois menus permettant de choisir la taille, d’aller directement au chapitre voulu et d’afficher des sous-titres dont le français.
Je suis bien content de m’en rendre compte maintenant après m’être tout farci en anglais sans sous-titres!

Vidéo 1 : A Digital Media Primer for Geeks

Vidéo 2 : Digital Show & Tell

Samplerates : the higher the better, right ?

Vidéo en anglais non sous-titrée publiée par le concepteur de plugins FabFilter .
Au delà de la pub pour leurs plugins, cette vidéo est très pédagogique.

Voici un résumé pour ceux qui ne maîtrisent pas l’anglais.

Enregistrer au dessus de 48kHz peut créer des problèmes d’aliasing avec les traitements non linéaires (compresseurs, distortions).
L’aliasing (repliement du spectre en français) se manifeste comme des harmoniques indésirables apparaissant dans le spectre audible.

Les fonctions de suréchantillonnage (oversampling) des plugins permettent de calculer les traitements à des fréquences d’échantillonnage plus élevées et revenir à la fréquence d’échantillonnage du projet en éliminant cet aliasing.
Les aliasing générés dans les différents cas de figure exposés (fréquence d’échantillonnage trop faible ou trop élevée) sont très subtils voire parfois difficilement audibles.

La conclusion est qu’il ne faut pas attacher d’importance à la fréquence d’échantillonnage.
Ce qui sous-entend aussi que cela ne vaut pas le coup de travailler à 96 kHz (et plus), cela génère des fichiers deux fois plus gros et demande deux fois plus de puissance de calcul à l’ordinateur lors du mix.
La réponse à la question initiale Samplerates : the higher the better, right ? (fréquences d’échantillonnage , est ce vrai que le plus élevé est le mieux ?) est donc non.

La dernière conclusion de la vidéo est que 48kHz offre un léger gain par rapport à 44.1 kHz

Liste des publications ici avec notamment :

 

 

 

 

 

studio la boîte à meuh - régie mobile enregistrement 64 pistes

Enregistrement 64 pistes avec Behringer X32

Démos trucs et astuces

studio la boîte à meuh - régie mobile enregistrement 64 pistesstudio la boîte à meuh - régie mobile enregistrement 64 pistesstudio la boîte à meuh - régie mobile enregistrement 64 pistes

 

 

 

 

 

Le studio peut réaliser des enregistrements multipistes mobiles grâce à ses consoles Behringer X32, X32 Compact et X32 Core.
32 pistes via la carte X-USB et la prise usb d’un ordinateur portable ou 64 avec la configuration suivante :

Un enregistrement 64 pistes est possible en combinant les possibilités d’enregistrement 32 pistes de deux consoles équipées chacune d’une carte d’extension X-MADI.
Les deux consoles reliées entre elles en MADI envoient l’ensemble des pistes via un câble MADI (coaxial ou optique) sur un PC équipé d’une carte MADI RME.

 

Plusieurs combinaisons sont possibles :

La X32 Core envoie des pré-mixes d’écoute sur les entrées aux (6 mono ou 3 stéréo) via une liaison AES50 (RJ45) entre les deux consoles.studio la boîte à meuh - régie mobile enregistrement 64 pistesstudio boite à meuh mobileL’ensemble du matériel pour un enregistrement 64 pistes tient dans la Meuhmobile :

  • Consoles Behringer X32, X32 Compact et X32 Core et boîtiers de scène Midas DL32, Behringer S16 et SD8
  • Enceintes monitoring Digidesign RM1
  • 13 Contrôleurs de monitoring personnel Behringer P16-M et 3 routeurs P16-D
  • Amplis casques SAMSON S-Phone et SM Pro HP6E
  • Casques Senheiser HD280 pro, 380, 25, 25 SP, Audio Technica ATH-M50, ATH-M50X
  • le parc de plus de 150 micros et DI du studio
  • Les pieds de micros et le câblage
  • un PC portable avec carte RME Madiface USB et Nuendo Live 2

Au delà des explications techniques,  on peut donc retenir qu’avec cette configuration, l’enregistrement multipistes sur site (concerts lieux de répétition) devient accessible financièrement.
studio la boite a meuh-enregistrement mobileMême pour des projets imposants en nombre de musiciens comme des orchestres philharmoniques, harmonies etc.

Devis en fonction des projets.

 

Le studio partage les trucs qu’il trouve lorsqu’il résoud un problème auquel il est confronté.
Retrouvez l’ensemble des publications du studio classées par rubriques ici.

 

Dernière actualité
  • Capteur piézo, mise en oeuvre.

    Voici quelques réfléxions et informations sur la mise en oeuvre de capteurs piézo. Elles sont pour parties issues des publications sur les derniers capteurs acquis par le studio : Le Harley Benton HB-T et le K&K Big Shot. Principe de fonctionnement et historique rapides Piézo, diminutif de Piézoélectrique. Transducteur ou capteur qui transforme l’énergie mécanique […]

Suivez-moi aussi sur…
facebook
%d blogueurs aiment cette page :