Fréquence d'échantillonnage (Sample Rate) et profondeur de bits (Bit Depth) dans le monde de l'audio numérique

Dans le monde de la production musicale numérique, il existe de nombreux aspects techniques qui sont souvent considérés comme allant de soi, mais qui ont néanmoins une influence décisive sur le produit final. Deux de ces éléments souvent négligés, mais néanmoins critiques, sont le taux d'échantillonnage et la profondeur de bits. Ce sont les architectes invisibles qui ont une influence déterminante sur la qualité de la musique.
Table des matières

Lorsque l'on commence à produire de la musique, on s'intéresse d'abord à l'apprentissage du DAW, aux différents effets comme l'égaliseur ou le compresseur, à l'enregistrement, à l'écriture du MIDI... Mais peu s'intéressent aux notions de taux d'échantillonnage et de profondeur de bits.

Et pourtant, ce sont deux aspects si importants dans le monde de l'audio numérique, qui ne sont pas vraiment difficiles à comprendre - et une fois que tu les as compris, la vie te sera beaucoup plus facile, au plus tard lorsque tu exporteras tes projets. Ou lorsque tu importeras des échantillons dans ton projet.

La faute en revient en partie aux DAWs modernes comme Ableton Live, qui rendent le concept de fréquence d'échantillonnage (taux d'échantillonnage) et de profondeur de bits si simple que les producteurs n'ont même plus besoin de s'en occuper - car Live convertit automatiquement les fichiers audio à la fréquence d'échantillonnage du projet, sans le signaler. Avec Pro Tools, par exemple, il faut convertir activement les échantillons avant même de pouvoir les importer.

Pour comprendre le concept, nous devons d'abord examiner le processus de conversion des signaux audio analogiques en signaux audio numériques.

Qu'est-ce que l'audio numérique ?

L'audio numérique est un son qui a été enregistré dans un format numérique. Cela signifie que le signal audio est représenté par une série de chiffres qui peuvent être stockés et traités par des appareils numériques tels que des ordinateurs, des lecteurs audio numériques et des stations de travail audio numériques.

Dans le cas de l'audio numérique, l'onde sonore du signal audio est échantillonnée (enregistrée) à intervalles réguliers et une valeur numérique est attribuée à chaque échantillon. Ce processus est appelé conversion analogique-numérique (CAN).

Voici comment les ondes sonores sont converties d'analogique en numérique
Voici comment les ondes sonores sont converties d'analogique en numérique

La qualité des signaux audio numériques est déterminée par deux facteurs : la fréquence d'échantillonnage (le nombre d'échantillons enregistrés par seconde) et la profondeur de bits (la quantité d'informations stockées dans chaque échantillon).

Convient à cet effet : ADAT - Tout sur l'interface dans les appareils audio digitaux

Qu'est-ce que le taux d'échantillonnage exactement ?

Le taux d'échantillonnage numérique (sample rate) indique le nombre de fois par seconde que le signal analogique est enregistré pour produire un signal numérique. Plus le taux d'échantillonnage est élevé, plus le signal est "précis" (c'est-à-dire plus souvent). Cependant, il faut aussi plus de mémoire, car plus d'informations sont enregistrées.

Le schéma montre clairement la différence d'un taux d'échantillonnage plus élevé
Le schéma montre clairement la différence d'un taux d'échantillonnage plus élevé

La fréquence d'échantillonnage est indiquée en kHz et peut être réglée dans le DAW. Si tu connectes plusieurs interfaces ou autres appareils audio numériques, tu dois régler tous les appareils sur le même taux d'échantillonnage - mais la plupart des interfaces audio USB et Thunderbolt adaptent automatiquement leur taux d'échantillonnage à celui du DAW.

En règle générale, les taux d'échantillonnage suivants sont disponibles : 44,1 kHz, 48 kHz, 96 kHz, 192 kHz. Ces chiffres ne sont pas choisis au hasard, mais ont une raison d'être.

44,1 kHz

Cette fréquence d'échantillonnage a été choisie à la fin des années 1970 pour le format du Compact Disc (CD). La raison de ce choix est un peu compliquée. Il est lié à la fréquence la plus élevée qui peut être reproduite avec précision (la fréquence Nyquist, qui correspond à la moitié de la fréquence d'échantillonnage).

La fréquence la plus élevée que la plupart des gens peuvent entendre se situe autour de 20 kHz, de sorte qu'une fréquence d'échantillonnage de 40 kHz serait théoriquement suffisante. Cependant, un filtre est utilisé pour éviter l'aliasing, et ce filtre n'est pas parfait - il a besoin d'une largeur de bande de transition. C'est pourquoi on choisit 44,1 kHz au lieu de 40 kHz, afin d'avoir une certaine marge de manœuvre pour le filtre.

La technologie vidéo de l'époque (utilisée dans le processus de mastering pour les CD) avait une norme de 13,5 MHz, et 44,1 kHz est 1/294 de cette fréquence, ce qui en faisait un choix pratique qui répondait aux exigences techniques.

48 kHz

Cette fréquence d'échantillonnage est devenue la norme pour l'audio dans les productions vidéo professionnelles, y compris la télévision numérique, la vidéo numérique, les DVD et le son des films numériques. La raison exacte du choix de 48 kHz n'est pas tout à fait claire, mais il est probable qu'il s'agit d'une fréquence plus élevée qui permet encore une quantité raisonnable de stockage de données et de puissance de calcul et qui offre un peu plus de place pour les filtres anti-aliasing que 44,1 kHz.

96 kHz et 192 kHz

Ils sont simplement des multiples de 48 kHz et sont utilisés dans les formats audio haute résolution. L'idée est que des taux d'échantillonnage plus élevés peuvent reproduire des fréquences plus élevées et fournir une représentation plus précise du signal analogique original. Il est toutefois controversé de savoir si ces fréquences plus élevées sont réellement audibles pour l'homme.

Également intéressant : Les 8 meilleurs microphones pour les rappeurs et les chanteurs en 2023

Quel est le taux d'échantillonnage qui me convient le mieux ?

Le choix de la bonne fréquence d'échantillonnage dépend de plusieurs facteurs :

  1. 44,1 kHz: Si tu produis de la musique pour des CD ou si tes enregistrements sont principalement destinés au streaming sur Internet, 44,1 kHz est un bon choix. Il s'agit du taux d'échantillonnage standard pour les CD et la plupart des plateformes de distribution de musique en ligne.
  2. 48 kHz: Si tu produis de l'audio pour la vidéo, 48 kHz est le taux d'échantillonnage standard. C'est également un taux d'échantillonnage courant pour les podcasts et les livres audio.
  3. 96 kHz ou 192 kHz: Si tu produis de l'audio haute résolution, par exemple pour le Blu-ray ou des publications audio haut de gamme spéciales, tu pourrais envisager l'un de ces taux d'échantillonnage plus élevés. Cependant, les enregistrements dans de tels formats nécessitent tellement de mémoire et de puissance de calcul que cela n'en vaut pas la peine pour la plupart des applications.
44,1 kHz48 kHz96 kHz192 kHz
100 MO109 MO218 MO436 MO
500 MO545 MO1,09 GO2,18 GO
1 GO1,09 GO2,18GB4,36GB
Voici la taille d'un même fichier audio dans les différents taux d'échantillonnage

Je recommande à tous les producteurs de musique et techniciens du son de toujours travailler en 48kHz, car c'est un bon compromis entre qualité et puissance de calcul. En théorie, le 44,1 kHz suffit amplement, car le CD et Spotify & Co. fonctionnent de toute façon en 44,1 kHz, mais on est tout simplement plus flexible, car on peut toujours downsampler plus tard de 48 kHz à 44,1 kHz - l'inverse n'est pas possible.

Peut-on entendre la différence à des taux d'échantillonnage plus élevés ?

C'est un sujet très controversé dans le monde de l'audio - le fait est que notre ouïe humaine n'entend de toute façon que jusqu'à 20 kHz et que 44,1 kHz sont largement suffisants pour cela. Des taux d'échantillonnage plus élevés peuvent être un avantage dans certains cas lors du traitement audio, mais dans le mixage final, il n'y a pas de différence audible par rapport au 44,1 kHz.

Vaut-il la peine d'utiliser des taux d'échantillonnage plus élevés ?

Dans certains cas, cela peut valoir la peine, mais je ne recommanderais à personne d'enregistrer un grand projet complet en 192 kHz, car l'espace de stockage nécessaire serait énorme. Mais il y a certains cas où cela peut effectivement être avantageux.

Normalement, l'abaissement de la fréquence d'un échantillon de 44,1 kHz entraîne la perte de la majeure partie des hautes fréquences de l'échantillon, car au-delà de 22,1 kHz, il n'y a de toute façon plus d'informations à abaisser pour combler le nouveau vide dans les aigus.

Cependant, si l'échantillon a un taux d'échantillonnage de 96kHz, il contient des informations allant jusqu'à 48kHz - et beaucoup plus de hautes fréquences sont conservées lorsque l'échantillon est "pitché" vers le bas, car ces fréquences "ultra-hautes" remplissent alors la plage de 15-20kHz.

Qu'est-ce que la profondeur de bit (Bit Depth) ?

La profondeur de bit indique le nombre de valeurs dynamiques possibles que chacun des échantillons peut enregistrer. Plus le débit binaire est élevé, plus la dynamique du morceau est enregistrée avec précision. Il s'agit d'une mesure de la résolution ou de la précision avec laquelle le signal audio analogique d'origine est numérisé.

La différence entre 8 bits et 16 bits - une résolution beaucoup plus élevée
La différence entre 8 bits et 16 bits - une résolution beaucoup plus élevée

Dans la pratique, les profondeurs de bits les plus courantes dans l'enregistrement audio numérique sont 16 bits et 24 bits.

  • 16 bits (65 536 valeurs): Il s'agit de la profondeur de bit standard pour les CD et de nombreux formats audio numériques. Une profondeur de 16 bits permet une plage dynamique théorique d'environ 96 décibels (dB). Cela signifie que le signal le plus fort qui peut être enregistré est environ 96 dB plus fort que le signal audible le plus faible.
  • 24 bits (16.777.216 valeurs) : Il s'agit de la profondeur de bits standard pour les enregistrements audio professionnels et certains formats audio haute résolution. Une profondeur de bits de 24 bits permet d'obtenir une gamme dynamique théorique d'environ 144 dB, ce qui est bien supérieur à la gamme dynamique que l'oreille humaine peut percevoir dans la pratique. Cela signifie que davantage de détails peuvent être conservés dans les parties les plus faibles de l'enregistrement, que l'on n'entend peut-être pas directement, mais seulement lorsque l'on augmente le volume. Cela donne une plus grande marge de manœuvre lors de l'édition et du mixage de l'enregistrement - il n'est plus nécessaire d'enregistrer "fort" comme auparavant, car le bruit est si faible.

Le problème, cependant, est que l'onde numérique ne peut jamais avoir la forme de l'onde analogique à 100 %, quelle que soit la profondeur de bit. Lorsque nous convertissons des sons réels en un format numérique, nous essayons de capturer une onde sonore régulière et fluide avec une série de valeurs individuelles. Mais parfois, la valeur exacte dont nous avons besoin n'est pas disponible, nous devons donc arrondir à la valeur la plus proche. Ce processus s'appelle la quantification.

Voici à quoi ressemble la quantification lors de la conversion d'un signal audio analogique en numérique
Voici à quoi ressemble la quantification lors de la conversion d'un signal audio analogique en numérique

Cet arrondissement permet d'introduire un petit peu de hasard dans le son numérique. Nous entendons ce caractère aléatoire sous la forme d'un très léger bruit de fond, semblable au léger bruissement que tu peux entendre dans une pièce calme. C'est ce que l'on appelle le bruit de fond.

Parfois, la manière dont nous échantillonnons le son peut créer des motifs répétitifs dans ce bruit, ce qui le rend plus perceptible à certaines fréquences. C'est ce que l'on appelle le bruit corrélé.

Pour éviter ces modèles, nous pouvons ajouter une taille aléatoire supplémentaire lors de l'arrondissement des valeurs. Ce processus est appelé dithering et permet de répartir le bruit de manière plus homogène et de le rendre moins visible.

Le niveau de ce bruit de fond détermine le son le plus faible que nous pouvons enregistrer - car notre signal doit toujours être plus fort que ce bruit de fond pour qu'il reste propre.

D'autre part, il y a une limite au son le plus fort que nous pouvons enregistrer avant qu'il ne commence à se déformer. Cette plage entre le son le plus faible et le son le plus fort est la plage dynamique mentionnée précédemment.

Quand a-t-on besoin de quelle profondeur de bits ?

Le 24 bits est très pratique pour les enregistrements, car on ne doit pas se soucier des niveaux. La plage dynamique est si large et le noise floor si bas que l'on peut enregistrer sans problème à -15 dB, car il suffit d'ajouter beaucoup de volume par la suite. Et on s'assure que le signal n'est pas déformé.

Auparavant, avec les appareils d'enregistrement 16 bits, il fallait toujours veiller à enregistrer le plus fort possible pour que le bruit de fond ne soit pas audible - et il y avait alors toujours un risque de saturation. Avec le 24 bits, ce problème n'existe plus.

Tu devrais donc toujours enregistrer et travailler en 24 bits, mais une fois que le morceau est masterisé, tu devrais exporter le master final en 16 bits, car c'est la norme pour les CD et les services de streaming.

Peut-on entendre la différence entre 16 bits et 24 bits ?

Non, on n'entend pas la différence quand on écoute un morceau entièrement masterisé. Il n'y a guère de morceaux de musique dont la gamme dynamique est supérieure à 96 dB (peut-être la musique classique), donc cela n'a de toute façon aucun sens de proposer une gamme dynamique plus large.

La musique pop, rock, R&B, hip-hop et country entièrement produite a généralement une gamme dynamique relativement modeste. typiquement autour de 10 dB - de sorte qu'en théorie, 8 bits seraient également suffisants. Cela s'explique notamment par le fait que la musique est fortement comprimée pendant la production (avec des compresseurs ou des limiteurs), ce qui réduit la plage dynamique de la chanson.

C'est pourquoi tous les services de streaming travaillent encore en 16 bits - et bien sûr pour des raisons de place. Le seul avantage du 24 bits par rapport au 16 bits est la plus grande plage dynamique et donc un noise floor plus faible lors de l'enregistrement.

Quelle est donc la meilleure combinaison de fréquence d'échantillonnage et de profondeur de bits ?

Pour les productions musicales, il est recommandé d'utiliser un taux d'échantillonnage de 48 kHz avec une profondeur de 24 bits, car cela représente un bon compromis entre la qualité et la taille du fichier. On dispose ainsi d'une très grande plage dynamique pour travailler et d'une plage de fréquences pratiquement illimitée vers le haut jusqu'à 24 kHz - bien plus que ce que nous pouvons même entendre.

Et cela nous donne toutes les possibilités d'exporter plus tard pour tous les médias - et notre fichier audio final, que nous mettons ensuite sur les plateformes de streaming, devrait avoir 44,1 kHz à 16 bits. C'est le format attendu par les services de streaming et les CD.

Partager cet article

Nous recherchons, testons, examinons et recommandons les meilleurs produits en toute indépendance. Si tu achètes quelque chose via nos liens, nous recevons éventuellement une commission.

Plus de contributions
Actualités
Étude : les chansons et les riffs les plus joués au monde
Quelles sont les chansons que les musiciens du monde entier veulent le plus souvent jouer ? Nous nous sommes penchés sur cette question passionnante et avons recherché quels accords de chansons et riffs de guitare ...
Lire la suite →
Les meilleures villes allemandes pour les musiciens
Pour artistes
Étude : les meilleures villes allemandes pour les musiciens
Dans quelle ville allemande les musiciens vivent-ils le mieux ? Nous nous sommes penchés sur cette question et avons réalisé une étude sur les 40 plus grandes villes d'Allemagne.
Lire la suite →
Gear
Classement des guitares : Quelles sont les guitares électriques qui ont la meilleure valeur de revente ?
Nous avons étudié les prix d'occasion des 40 guitares électriques les plus vendues et les avons comparés aux prix du neuf. Nous montrons quelles guitares électriques sont les plus vendues sur le marché de l'occasion et quelles ...
Lire la suite →
Pour artistes
Les marques de synthétiseurs les plus populaires dans chaque pays
Nous avons analysé les recherches Google des 6 marques de synthétiseurs les plus populaires dans 118 pays et évalué les résultats. Les résultats sont très intéressants et montrent surtout ...
Lire la suite →
Les meilleures pédales de réverbération
Gear
Les meilleures pédales de réverbération pour les guitaristes et les producteurs
Une pédale de réverbération peut donner à la guitare une profondeur incroyable et enrichir énormément le son. Que ton ampli ait déjà une réverbération intégrée ou non ...
Lire la suite →
Les meilleures pédales de chorus
Gear
Les 8 meilleures pédales de chorus pour les guitaristes et les producteurs
Les pédales de chorus étaient particulièrement populaires dans les années 80 et des légendes comme Kurt Kobain ou John Frusciante les ont rendues encore plus populaires dans les années 90. Aujourd'hui, ...
Lire la suite →