Le grand mythe audio: pourquoi vous n’avez pas besoin de ce DAC 32 bits

Auteur: Randy Alexander
Date De Création: 1 Avril 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
TUTO: Nettoyer son PC
Vidéo: TUTO: Nettoyer son PC

Contenu


Comme vous vous en êtes probablement rendu compte, l’industrie des smartphones a désormais tendance à inclure des puces audio de «qualité studio» dans les smartphones phares modernes. Bien qu'un convertisseur numérique-analogique (DAC) 32 bits avec prise en charge audio de 192 kHz ait l’air beau sur la fiche technique, il n’est tout simplement pas avantageux de l’augmentation de la taille de nos collections audio.

Je suis ici pour expliquer pourquoi cette profusion de bits et de taux de bits est un exemple supplémentaire de l’industrie du son tirant parti du manque de connaissances des consommateurs et même des audiophiles sur le sujet. Enfilez vos casquettes de nerd, nous abordons quelques points techniques sérieux pour expliquer les tenants et les aboutissants de l'audio professionnel. Et j'espère que je vous prouverai également pourquoi vous devriez ignorer l'essentiel du battage publicitaire.


Entends-tu cela?

Avant de plonger, ce premier segment offre quelques informations de base requises sur les deux concepts principaux de l'audio numérique, de la résolution et de la fréquence d'échantillonnage.

La fréquence d'échantillonnage fait référence à la fréquence à laquelle nous allons capturer ou reproduire les informations d'amplitude concernant un signal. Essentiellement, nous découpons une forme d'onde en un grand nombre de petites parties pour en apprendre davantage à un moment donné. Le théorème de Nyquist indique que la fréquence la plus élevée possible pouvant être capturée ou reproduite correspond exactement à la moitié de la fréquence d'échantillonnage. C'est assez simple à imaginer, car nous avons besoin des amplitudes pour le haut et le bas de la forme d'onde (ce qui nécessiterait deux échantillons) afin de connaître avec précision sa fréquence.


L'augmentation de la fréquence d'échantillonnage (en haut) génère des échantillons supplémentaires par seconde, tandis qu'une profondeur de bits plus grande (en bas) fournit davantage de valeurs possibles pour l'enregistrement de l'échantillon.

Pour l’audio, nous ne nous intéressons qu’à ce que nous pouvons entendre et la grande majorité des personnes qui entendent n’entendent que 20 kHz. Maintenant que nous connaissons le théorème de Nyquist, nous pouvons comprendre pourquoi les fréquences d’échantillonnage courantes sont 44,1 kHz et 48 kHz, puisqu’elles représentent un peu plus de deux fois la fréquence maximale que nous pouvons entendre. L'adoption de normes de qualité studio de 96 kHz et 192 kHz n'a rien à voir avec la capture de données de fréquence supérieure, cela serait inutile. Mais nous allons plonger dans plus de cela dans une minute.

Comme nous examinons les amplitudes dans le temps, la résolution en bits fait simplement référence à la résolution ou au nombre de points disponibles afin de stocker ces données d'amplitude. Par exemple, 8 bits nous offre 256 points différents, les résultats 16 bits en 65 534 points et 32 ​​bits de données nous donnent 4 294 967 294 points de données. Bien évidemment, cela augmente considérablement la taille des fichiers.

Il serait peut-être facile de penser immédiatement à la résolution en bits en termes de précision d'amplitude, mais les concepts les plus importants à comprendre ici sont ceux du bruit et de la distorsion. Avec une résolution très basse, nous risquons de manquer des morceaux d’informations de faible amplitude ou d’isoler les sommets des formes d’ondes, ce qui introduit une imprécision et une distorsion (erreurs de quantification). Fait intéressant, cela ressemblera souvent à du bruit si vous lisiez un fichier à faible résolution, car nous avons effectivement augmenté la taille du plus petit signal possible pouvant être capturé et reproduit. Cela revient à ajouter une source de bruit à notre forme d'onde. En d'autres termes, réduire la profondeur de bits diminue également le bruit de fond. Il pourrait également être utile de penser à cela en termes d’échantillon binaire, où le bit le moins significatif représente le bruit de fond.

Par conséquent, une plus grande profondeur de bits nous donne un bruit de fond plus grand, mais la limite pratique de la pratique est réelle. Malheureusement, il y a du bruit de fond partout, et je ne parle pas du bus qui passe dans la rue. Des câbles à votre casque, en passant par les transistors d'un amplificateur et même les oreilles dans votre tête, le rapport signal / bruit maximum dans le monde réel est d'environ 124 dB, ce qui correspond à environ 21 bits de données.Jargon Buster:

DAC- Un convertisseur numérique-analogique prend des données audio numériques et les transforme en un signal analogique à envoyer au casque ou aux haut-parleurs.

Taux d'échantillonnage- Mesuré en hertz (Hz), il s’agit du nombre d’échantillons de données numériques saisis chaque seconde.

SNR- Le rapport signal sur bruit est la différence entre le signal souhaité et le bruit de fond du système. Dans un système numérique, cela est directement lié à la résolution en bits.

À titre de comparaison, la capture sur 16 bits offre un rapport signal sur bruit (différence entre le signal et le bruit de fond) de 96,33 dB, tandis que celle sur 24 bits offre 144,49 dB, ce qui dépasse les limites de la capture matérielle et de la perception humaine. Ainsi, votre DAC 32 bits ne pourra en réalité que produire au maximum 21 bits de données utiles et les autres bits seront masqués par le bruit de circuit. En réalité, la plupart des équipements à prix modérés obtiennent un RSB de 100 à 110 dB, car la plupart des autres éléments de circuit introduiront leur propre bruit. Clairement, les fichiers 32 bits semblent déjà plutôt redondants.

Maintenant que nous avons compris les bases de l’audio numérique, passons à certains points plus techniques.

Stairway to Heaven

La plupart des problèmes liés à la compréhension et à la méconnaissance de l'audio sont liés à la manière dont les ressources pédagogiques et les entreprises tentent d'expliquer les avantages à l'aide de signaux visuels. Vous avez probablement tous vu le son représenté sous la forme d'une série de marches d'escalier pour les lignes de profondeur de bits et rectangulaires pour la fréquence d'échantillonnage. Cela n’a certainement pas l’air très bon si vous le comparez à un signal analogique lisse, il est donc facile de sortir des escaliers plus lisses et plus «lisses» pour représenter un signal de sortie plus précis.

Bien que cela puisse être une vente facile au public, cette analogie de précision «d'escalier» courante est un énorme détournement de direction et ne permet pas de comprendre le fonctionnement réel de l'audio numérique. Ignore le.

Cependant, cette représentation visuelle déforme le fonctionnement de l'audio. Bien que cela puisse paraître compliqué, mathématiquement, les données en dessous de la fréquence de Nyquist, soit la moitié du taux d’échantillonnage, ont été parfaitement capturées et peuvent être reproduites parfaitement. Imaginez ceci, même à la fréquence de Nyquist, qui peut souvent être représentée par une onde carrée plutôt que par une onde sinusoïdale lisse, nous disposons de données précises sur l’amplitude à un moment donné, c’est tout ce dont nous avons besoin. Nous, les humains, regardons souvent à tort l'espace entre les échantillons, mais un système numérique ne fonctionne pas de la même manière.

La résolution en bits est souvent liée à la précision, mais en réalité elle définit les performances du système en matière de bruit. En d'autres termes, le plus petit signal détectable ou reproductible.

En ce qui concerne la lecture, cela peut devenir un peu plus compliqué, en raison du concept facile à comprendre des CNA «maintien d'ordre zéro», qui basculeront simplement entre les valeurs à une fréquence d'échantillonnage définie, produisant ainsi un résultat progressif. Ce n’est pas vraiment une représentation juste de la façon dont fonctionnent les CNA audio, mais pendant que nous sommes ici, nous pouvons utiliser cet exemple pour prouver que vous ne devriez pas vous inquiéter de ces escaliers de toute façon.

Un fait important à noter est que toutes les formes d'onde peuvent être exprimées sous la forme de la somme de plusieurs ondes sinusoïdales, d'une fréquence fondamentale et de composants supplémentaires aux multiples harmoniques. Une onde triangulaire (ou une marche) est constituée d'harmoniques impairs à d'amplitudes décroissantes. Donc, si nous avons beaucoup de très petites étapes se produisant à notre fréquence d'échantillonnage, nous pouvons dire qu'il y a un contenu supplémentaire harmonique ajouté, mais cela se produit à une fréquence double de notre fréquence audible (Nyquist) et probablement quelques harmoniques au-delà, donc nous avons gagné 's pas capable de les entendre de toute façon. De plus, cela serait assez simple de filtrer en utilisant quelques composants.

Si nous séparons les échantillons DAC, nous pouvons facilement voir que notre signal souhaité est parfaitement représenté avec une forme d'onde supplémentaire à la fréquence d'échantillonnage DAC.

Si cela est vrai, nous devrions pouvoir l'observer avec une expérience rapide. Prenons une sortie directement d’un CNA à maintien d’ordre de base et transmettons également le signal à un signal très simple.Dakota du Nord commandez un filtre passe-bas à la moitié de notre taux d'échantillonnage. En fait, j’ai utilisé ici uniquement un signal 6 bits, afin que nous puissions voir la sortie sur un oscilloscope. Un fichier audio 16 bits ou 24 bits aurait beaucoup moins de bruit sur le signal avant et après le filtrage.

Un exemple assez grossier, mais cela prouve que les données audio sont parfaitement recréées dans cet escalier en désordre.

Et comme par magie, la marche en escalier a presque complètement disparu et la sortie est «lissée», simplement en utilisant un filtre passe-bas qui n’interfère pas avec notre sortie en onde sinusoïdale. En réalité, tout ce que nous avons fait est de filtrer des parties du signal que vous n’auriez pas entendues de toute façon. Ce n'est vraiment pas un mauvais résultat pour quatre composants supplémentaires qui sont fondamentalement libres (deux condensateurs et deux résistances coûtent moins de 5 pence), mais il existe en fait des techniques plus sophistiquées que nous pouvons utiliser pour réduire davantage ce bruit. Mieux encore, ceux-ci sont inclus en standard dans la plupart des CAD de bonne qualité.

Traitant d'un exemple plus réaliste, tout DAC à utiliser avec l'audio comportera également un filtre d'interpolation, également appelé échantillonnage supérieur. L'interpolation est tout simplement une façon de calculer des points intermédiaires entre deux échantillons. Votre DAC effectue donc lui-même une bonne partie de ce «lissage», et bien plus que de doubler ou quadrupler le taux d'échantillonnage. Mieux encore, il ne prend pas d’espace de fichier supplémentaire.

Les filtres d’interpolation que l’on trouve couramment dans les CAD dont la qualité est suffisante sont une bien meilleure solution que de transporter des fichiers avec des taux d’échantillonnage supérieurs.

Les méthodes pour ce faire peuvent être assez complexes, mais essentiellement, votre DAC modifie sa valeur de sortie beaucoup plus souvent que ne le suggère la fréquence d'échantillonnage de votre fichier audio. Cela repousse les harmoniques inaudibles des marches d'escalier loin de la fréquence d'échantillonnage, ce qui permet d'utiliser des filtres plus lents, plus facilement réalisables et moins ondulés, préservant ainsi les bits que nous voulons réellement entendre.

Si vous souhaitez savoir pourquoi nous voulons supprimer ce contenu que nous ne pouvons pas entendre, la simple raison est que la reproduction de ces données supplémentaires plus loin dans la chaîne du signal, par exemple dans un amplificateur, entraînerait un gaspillage d’énergie. En outre, en fonction d'autres composants du système, ce contenu «ultra-sonique» à fréquence plus élevée peut en réalité conduire à des quantités plus importantes de distorsion d'intermodulation dans des composants à bande passante limitée. Par conséquent, votre fichier 192 kHz causerait probablement plus de tort que de mal, s’il existait du contenu ultrasonore dans ces fichiers.

Si vous avez besoin de preuves supplémentaires, j’afficherai également la sortie d’un CNA de haute qualité utilisant le Circus Logic CS4272 (illustré en haut). Le CS4272 comporte une section d'interpolation et un filtre de sortie intégré raide. Tout ce que nous faisons pour ce test consiste à utiliser un microcontrôleur pour alimenter le DAC avec deux échantillons haute et basse 16 bits à 48 kHz, nous donnant ainsi la forme d'onde de sortie maximale possible à 24 kHz. Aucun autre composant de filtrage n'est utilisé, cette sortie provient directement du DAC.

Le signal de sortie 24 kHz (en haut) de ce composant de CNA de qualité studio ne ressemble certainement pas à la forme d’onde rectangulaire associée au matériel de marketing habituel. La fréquence d'échantillonnage (Fs) est affichée au bas de l'oscilloscope.

Notez que l’onde sinusoïdale de sortie (en haut) correspond exactement à la moitié de la vitesse de la fréquence (en bas). Il n'y a pas d'escalier visible et cette forme d'onde à très haute fréquence ressemble presque à une onde sinusoïdale parfaite, pas à une onde carrée qui ressemble à un bloc que le matériel de marketing ou même à un aperçu occasionnel des données de sortie suggérerait. Cela montre que même avec seulement deux échantillons, la théorie de Nyquist fonctionne parfaitement dans la pratique et que nous pouvons recréer une onde sinusoïdale pure, sans contenu harmonique supplémentaire, sans une très grande profondeur de bits ou un taux d'échantillonnage élevé.

La vérité sur 32 bits et 192 kHz

Comme pour la plupart des choses, il y a une vérité cachée derrière tout le jargon et l'audio 32 bits, 192 kHz est quelque chose qui a une utilisation pratique, mais pas dans la paume de votre main. Ces attributs numériques sont vraiment utiles lorsque vous vous trouvez dans un environnement de studio, d’où l’affirmation d’amener «l’audio de qualité studio sur mobile», mais ces règles ne s’appliquent tout simplement pas lorsque vous souhaitez mettre la piste finie dans votre poche.

Tout d’abord, commençons par le taux d’échantillonnage. Un avantage souvent présenté par une résolution audio supérieure est la conservation de données ultra-sonores que vous ne pouvez pas entendre mais qui ont un impact sur la musique. Déchets, la plupart des instruments tombent bien avant les limites de fréquence de notre audition, le microphone utilisé pour capturer un effet de réduction dans l’espace, tout au plus autour de 20 kHz, et les écouteurs que vous utilisez ne vont certainement pas s’étendre aussi loin. Même s’ils le pouvaient, vos oreilles ne peuvent tout simplement pas le détecter.

La sensibilité auditive humaine typique atteint 3 kHz et commence rapidement à baisser après 16 kHz.

Cependant, l'échantillonnage à 192 kHz est très utile pour réduire le bruit (ce mot-clé encore) lors de l'échantillonnage des données, permet de simplifier la construction des filtres d'entrée essentiels et est également important pour les effets numériques à haute vitesse. Le suréchantillonnage au-dessus du spectre audible nous permet de moyenner le signal pour abaisser le niveau de bruit. Vous constaterez que la plupart des convertisseurs analogiques-numériques (ADC) les plus performants ont aujourd'hui un sur-échantillonnage 64 bits intégré, voire davantage.

Chaque ADC doit également supprimer les fréquences au-dessus de sa limite de Nyquist, sinon vous obtiendrez un horrible repliement du spectre lorsque les fréquences les plus hautes seront «repliées» dans le spectre audible. Le plus grand écart entre la fréquence de coupure de filtre de 20 kHz et la fréquence d’échantillonnage maximale est plus adapté aux filtres du monde réel, qui ne peuvent tout simplement pas être aussi raides et stables que les filtres théoriques requis. Il en va de même du côté du CAD, mais comme nous en avons discuté, l’intermodulation peut très efficacement pousser ce bruit jusqu’à des fréquences plus élevées pour faciliter le filtrage.

Plus le filtre est raide, plus il y a d'ondes dans la bande passante. L'augmentation de la fréquence d'échantillonnage permet d'utiliser des filtres «plus lents», ce qui permet de conserver une réponse en fréquence uniforme dans la bande passante audible.

Dans le domaine numérique, des règles similaires s'appliquent aux filtres souvent utilisés dans le processus de mixage en studio. Des taux d'échantillonnage plus élevés permettent des filtres à action plus forte et plus rapide qui nécessitent des données supplémentaires pour fonctionner correctement. Rien de tout cela n'est nécessaire en ce qui concerne la lecture et les CNA, car nous ne sommes intéressés que par ce que vous pouvez réellement entendre.

En 32 bits, quiconque a déjà tenté de coder des mathématiques complexes à distance comprendra l'importance de la résolution en bits, qu'il s'agisse de données à nombre entier ou à virgule flottante. Comme nous en avons discuté, plus il y a de bits, moins il y a de bruit, ce qui est d'autant plus important lorsque nous commençons à diviser ou à soustraire des signaux dans le domaine numérique en raison d'erreurs d'arrondi et d'éviter les erreurs d'écrêtage lors de la multiplication ou de l'ajout.

Une profondeur de bits supplémentaire est importante pour préserver l'intégrité d'un signal lors de l'exécution d'opérations mathématiques, telles que celles d'un logiciel audio de studio. Mais nous pouvons jeter ces données supplémentaires une fois le mastering terminé.

Voici un exemple, prenons un échantillon de 4 bits et notre échantillon actuel est 13, soit 1101 en binaire. Maintenant, essayez de diviser ce chiffre par quatre et nous nous retrouvons avec 0011, ou tout simplement 3. Nous avons perdu 0,25 supplémentaire, ce qui représentera une erreur si nous essayions de faire des calculs supplémentaires ou de transformer notre signal en une forme d'onde analogique.

Ces erreurs d’arrondi se traduisent par de très petites quantités de distorsion ou de bruit, qui peuvent s’accumuler sur un grand nombre de fonctions mathématiques. Cependant, si nous étendons cet exemple 4 bits avec des bits d'informations supplémentaires à utiliser comme faction ou point décimal, nous pouvons continuer à diviser, ajouter et multiplier pendant beaucoup plus longtemps grâce aux points de données supplémentaires. Ainsi, dans le monde réel, échantillonner à 16 ou 24 bits, puis convertir ces données au format 32 bits pour le traitement, permet de réduire les bruits et les distorsions. Comme nous l’avons déjà dit, 32 bits, c’est énormément de points de précision.

Il est tout aussi important de reconnaître que nous n’avons pas besoin de cette marge supplémentaire lorsque nous revenons dans le domaine analogique. Comme nous l'avons déjà mentionné, environ 20 bits de données (-120 dB de bruit) constituent le maximum absolu détectable, ce qui permet de reconvertir en une taille de fichier plus raisonnable sans affecter la qualité audio, malgré le fait que les «audiophiles» sont probablement déplorer ces données perdues.

Cependant, nous allons inévitablement introduire des erreurs d’arrondi lorsqu’on passe à une résolution inférieure, il y aura donc toujours une très petite quantité de distorsion supplémentaire, car ces erreurs ne se produisent pas toujours de manière aléatoire. Bien que ce ne soit pas un problème avec l'audio 24 bits, car il s'étend déjà bien au-delà du bruit de fond analogique, une technique appelée "dithering" résout parfaitement ce problème pour les fichiers 16 bits.

Exemple de comparaison de la distorsion introduite par la troncature et le dithering.

Cela s'effectue en randomisant le bit le moins significatif de l'échantillon audio, en éliminant les erreurs de distorsion, mais en introduisant un bruit de fond aléatoire très silencieux qui est réparti sur les fréquences. Bien que l’introduction de bruit puisse sembler contre-intuitive, cela réduit en fait la quantité de distorsion audible en raison du caractère aléatoire. De plus, en utilisant des modèles spéciaux de dithering en forme de bruit qui abusent de la réponse en fréquence de l'oreille humaine, l'audio dither de 16 bits peut en réalité conserver un bruit de fond perçu très proche de 120 dB, juste aux limites de notre perception.

Les taux de données 32 bits et 192 kHz présentent des avantages notables en studio, mais les mêmes règles ne s’appliquent pas à la lecture.

Autrement dit, laissez les studios encombrer leurs disques durs avec ce contenu haute résolution. Nous n’avons tout simplement pas besoin de toutes ces données superflues pour une lecture de haute qualité.

Emballer

Si vous êtes toujours avec moi, ne considérez pas cet article comme un rejet complet des efforts visant à améliorer les composants audio des smartphones. Même si le nombre de ventes peut être inutile, des composants de qualité supérieure et une meilleure conception de circuit constituent toujours un excellent développement sur le marché de la téléphonie mobile, nous devons simplement nous assurer que les fabricants concentrent leur attention sur les bonnes choses. Le DAC 32 bits du LG V10, par exemple, semble incroyable, mais vous n’avez pas besoin de vous embêter avec d’énormes tailles de fichiers audio pour en tirer parti.

La capacité à piloter des écouteurs à basse impédance, à conserver un bruit de fond faible bruit du convertisseur DAC au jack et à offrir une distorsion minimale est une caractéristique beaucoup plus importante pour l'audio pour smartphone que la résolution ou le taux d'échantillonnage pris en charge théoriquement, et nous espérons pouvoir le faire. de plonger dans ces points plus en détail dans le futur.

La gamme d’ordinateur portable XP de Dell et l’une de plu connue du ecteur. Le modèle XP 13 et XP 15 ont la réputation d'être le moteur de ordinateur portable profeionnel, offrant d...

Dell était occupé au Computex 2019, en annonçant un certain nombre de nouveaux ordinateur portable conçu pour le bureau, le jeux et le loiir. La ociété a également d...

Assurez-Vous De Lire