Il grande mito audio: perché non è necessario che il 32-bit DAC

Come avrete probabilmente notato, c’è una nuova tendenza nel settore smartphone di includere chip audio “qualità da studio” all’interno moderni smartphone di punta. Mentre un 32-bit DAC (convertitore digitale-analogico) con supporto audio 192kHz sembra certamente bene sul foglio delle specifiche, semplicemente non c’è alcun beneficio per spingendo verso l’alto le dimensioni delle nostre collezioni audio.

I ‘ Sono qui per spiegare il motivo per cui questa profondità bit e frequenza di campionamento vanto è solo un altro esempio del settore audio approfittando della mancanza di consumatori e di conoscenza anche audiofilo sull’argomento. Don vostre protezioni secchione, stiamo andando in alcuni punti seriamente tecnico per spiegare i pro ei contro del pro audio. E spero di dimostrare anche a voi perché si dovrebbe ignorare la maggior parte della campagna pubblicitaria.

Lo senti?

Prima di tuffarsi in, questo primo segmento offre alcuni obbligatori informazioni di base sui due concetti principali di audio digitale, profondità di bit e frequenza di campionamento.

La frequenza di campionamento si riferisce a quanto spesso ci accingiamo a catturare o riprodurre le informazioni di ampiezza di un segnale. In sostanza, abbiamo tritare una forma d’onda in lotti di piccole parti per saperne di più in un punto specifico nel tempo. Il teorema di Nyquist afferma che la frequenza più alta possibile che può essere catturato o riprodotto è esattamente la metà della frequenza di campionamento. Questo è abbastanza semplice da immaginare, come abbiamo bisogno le ampiezze per la parte superiore e inferiore della forma d’onda (che richiederebbe due campioni) per conoscere con precisione la frequenza.

Aumentando la frequenza di campionamento (top) comporta ulteriori campioni al secondo, mentre una grande profondità di bit (inferiore) fornisce valori più possibile registrare il campione a

Audacity L’aumento della frequenza di campionamento (in alto) si traduce in altri campioni al secondo, mentre una più grande profondità di bit ( in basso) fornisce i valori più possibile registrare il campione a.

Per l’audio, siamo solo preoccupati di ciò che siamo in grado di ascoltare e la stragrande maggioranza delle udito delle persone code fuori appena prima di 20kHz. Ora che sappiamo del teorema di Nyquist, possiamo capire perché 44.1kHz e 48kHz frequenze di campionamento sono comuni, in quanto sono poco più del doppio della frequenza massima possiamo sentire. L’adozione di standard 96kHz e 192kHz di qualità in studio non ha nulla a che fare con l’acquisizione di frequenza superiore i dati, che sarebbe inutile. Ma ci immergeremo in più che in un minuto.

Mentre stiamo guardando ampiezze nel corso del tempo, la profondità di bit si riferisce semplicemente alla risoluzione o il numero di punti disponibili per memorizzare questi dati di ampiezza. Ad esempio, 8-bit ci offre 256 punti diversi per arrotondare a, i risultati a 16 bit a 65.534 punti, e vale la pena a 32 bit di dati ci dà 4,294,967,294 punti dati. Anche se, ovviamente, questo aumenta notevolmente le dimensioni di tutti i file.

96kHz

dimensioni del file PCM Stereo al minuto
(circa. non compresso)
48kHz 192kHz
a 16 bit 11.5MB 23.0MB 46.0MB
24- bit 17.3MB 34.6MB 69.1MB
a 32 bit 23.0MB 46MB 92.2MB

Potrebbe essere facile pensare subito di profondità di bit in termini di precisione di ampiezza, ma i concetti più importanti per capire che qui ci sono di rumore e distorsione. Con una risoluzione molto bassa, ci sarà probabilmente perdere pezzi di minore ampiezza informazioni o tagliare le cime di forme d’onda, che introduce inesattezza e distorsione (errori di quantizzazione). È interessante notare che questo spesso suona come rumore se si dovesse riprodurre un file a bassa risoluzione, perché abbiamo effettivamente aumentato la dimensione del più piccolo segnale possibile che possono essere catturate e riprodotte. Questo è esattamente lo stesso come l’aggiunta di una fonte di rumore alla nostra forma d’onda. In altre parole, abbassando il bit-profondità diminuisce anche il rumore. Potrebbe anche aiutare a pensare a questo in termini di un campione binario, dove il bit meno significativo rappresenta il rumore di fondo.

Pertanto, una maggiore profondità di bit ci dà un grande rumore di fondo, ma c’è un limite finito per come questo è pratica nel mondo reale. Purtroppo, non c’è rumore di fondo ovunque, e non mi riferisco al bus passando per la strada. Dai cavi alle cuffie, i transistor in un amplificatore, e anche le orecchie all’interno della vostra testa, il massimo segnale di rumore nel mondo reale è di circa 124dB, che funziona a valore di circa 21-bit di dati.

Jargon Buster:

DAC – un convertitore digitale-analogico prende dati audio digitali e la trasforma in un segnale analogico per inviare alle cuffie o altoparlanti
<. span>

Sample Rate – misurata in Hertz (Hz), questo è il numero di campioni di dati digitali catturati ogni e. ogni secondo

SNR – segnale-rumore è la differenza tra il segnale desiderato e il rumore del sistema di fondo. In un sistema digitale di questo è collegato direttamente alla profondità di bit.

Segnale mondo reale di rumore

Per confronto, 16 bit di cattura offre un rapporto segnale-rumore (la differenza tra il segnale e rumore di fondo) di 96.33dB, mentre il 24-bit offre 144.49dB, che superi i limiti della cattura hardware e percezione umana. Così il vostro 32 bit DAC è in realtà sempre e solo sarà in grado di emettere al massimo 21-bit di dati utili e gli altri bit saranno mascherati dal rumore del circuito. In realtà, però pezzi, la maggior parte a prezzi moderati di attrezzature top con un SNR di 100 a 110 dB, come la maggior parte degli altri elementi di circuito presenteranno il proprio rumore. E ‘chiaro poi, i file a 32 bit sembrano già piuttosto ridondante.

Ora che abbiamo le basi del digitale audio capito, passiamo ad alcuni dei punti più tecnici

Cellulari vantano audio di altissimo livello:.

Stairway to Heaven

La maggior parte delle questioni che circondano la comprensione e malinteso di audio è legato al modo in cui le risorse educative e le aziende cercano di spiegare i vantaggi utilizzando segnali visivi. Avete probabilmente visto tutti audio rappresentato come una serie di scale per profondità di bit e rettangolari linee che cercano per la frequenza di campionamento. Questo certamente non sembra molto buono quando si confronta con una forma d'onda analogica aspetto liscio, quindi è facile per tirar fuori più fine cercando, "fluide" scale per rappresentare una più accurata forma d'onda in uscita.

Anche se potrebbe essere un facile vendere al pubblico, questo comune" scala "precisione analogia è un enorme disinformazione e non riesce ad apprezzare l'audio come digitale funziona realmente. ignorarlo.

Tuttavia, questa rappresentazione visiva travisa opere come audio. Anche se possono sguardi disordinato, matematicamente i dati al di sotto della frequenza di Nyquist, che è la metà della velocità di campionamento, è stato catturato alla perfezione e può essere riprodotto perfettamente. Picture questo, anche alla frequenza di Nyquist, che può spesso essere rappresentato come un'onda quadra, piuttosto che una sinusoide, abbiamo dati precisi per l'ampiezza in un punto specifico nel tempo, il che è tutto abbiamo bisogno. Noi esseri umani sono spesso erroneamente guardando lo spazio in-tra i campioni, ma un sistema digitale non funziona allo stesso modo

Profondità bit è spesso legata alla precisione, ma in realtà definisce prestazioni di rumore del sistema. In altre parole, il più piccolo segnale rilevabile o riproducibile.

Quando si tratta di riproduzione, questo può diventare un po 'più complicato, a causa della facile comprensione concetto di "Hold ordine zero" DAC, che sarà semplicemente passare tra i valori ad una frequenza di campionamento insieme, producendo una scala risultato intensificato. Questo non è in realtà una rappresentazione veritiera di come DAC audio lavorare, ma mentre noi siamo qui possiamo utilizzare questo esempio per dimostrare che non si deve essere preoccupati per quelle scale comunque.

Un fatto importante da notare è che tutte le forme d'onda possono essere espressi come la somma di più onde sinusoidali, una frequenza fondamentale e componenti aggiuntivi in ​​multipli armonici. Un onda triangolare (o di un gradino) è costituito da armoniche dispari a ampiezze decrescenti. Quindi, se abbiamo un sacco di piccoli passi che si verificano nella nostra frequenza di campionamento, si può dire che ci sia un contenuto armonico in più ha aggiunto, ma avviene a doppio nostra acustico (Nyquist) frequenza e probabilmente alcuni armoniche al di là di questo, così abbiamo vinto 't essere in grado di sentire comunque. Inoltre, questo sarebbe abbastanza semplice da filtrare utilizzando pochi componenti

.

Se separiamo i campioni DAC, possiamo facilmente vedere che il nostro segnale desiderato è perfettamente rappresentata con una forma d'onda addizionale alla frequenza di campionamento DAC.

Se questo è vero, abbiamo dovrebbe essere in grado di osservare questo con un rapido esperimento. Prendiamo una uscita direttamente da una base presa di ordine zero DAC e anche inviare il segnale attraverso un semplice 2 o ordinare filtro passa-basso fissato a metà della nostra frequenza di campionamento. In realtà ho usato solo un segnale a 6 bit qui, proprio in modo da poter effettivamente vedere l'uscita su un oscilloscopio. Un file a 16-bit o 24-bit audio avrebbe molto meno rumore sul segnale sia prima che dopo il filtraggio

filtro di uscita del DAC

Un esempio piuttosto grezzo, ma questo dimostra il punto che i dati audio è perfettamente ricreato all'interno di questo disordinato scala cercando.

E come per magia, la scala passo quasi del tutto scomparso e l'uscita è "spianato", semplicemente utilizzando un filtro passa-basso che non interferisce con la nostra uscita sinusoidale. In realtà, tutto quello che abbiamo fatto è filtrata parti del segnale che non avreste sentito comunque. Che non è davvero un cattivo risultato per un extra di quattro componenti che sono fondamentalmente liberi (due condensatori e due resistenze costano meno di 5 pence), ma ci sono in realtà tecniche più sofisticate che possiamo utilizzare per ridurre ulteriormente questo rumore. Meglio ancora, questi sono inclusi come standard in DAC più di buona qualità.

Trattare con un esempio più realistico, qualsiasi DAC per l'uso con l'audio sarà presente anche un filtro di interpolazione, noto anche come up-sampling. L'interpolazione è semplicemente un modo di calcolare punti intermedi tra due campioni, in modo che il DAC è in realtà facendo un sacco di questo "livellamento" per conto suo, e molto di più che raddoppiare o quadruplicare la frequenza di campionamento sarebbe. Meglio ancora, non occupa alcuno spazio extra file

.  filtri di interpolazione che si trovano comunemente in ogni DAC degno sono una soluzione molto migliore che portare in giro i file con frequenze di campionamento più elevate.

Ni Filtri di interpolazione che si trovano comunemente in ogni DAC degno sono una soluzione molto migliore di portare in giro i file con una maggiore frequenze di campionamento.

I metodi per fare questo può essere molto complesso, ma essenzialmente il vostro DAC sta cambiando il suo valore di produzione molto più spesso di quanto la frequenza di campionamento del file audio suggerirebbe. Questo spinge le armoniche passo scala inaudibili molto al di fuori della frequenza di campionamento, consentendo l'uso di lenti, filtri più facilmente realizzabili che hanno meno ondulazione, quindi conservando i bit che in realtà vogliamo sentire.

Se 're curioso di sapere perché vogliamo rimuovere questi contenuti che non possiamo sentire, la semplice ragione è che riprodurre questi dati aggiuntivi a valle della catena del segnale, dice in un amplificatore, sarebbe sprecare energia. Inoltre a seconda di altri componenti del sistema, questo contenuto frequenza superiore "ultra-sonic" potrebbe effettivamente portare ad una maggiore quantità di distorsione di intermodulazione in componenti di banda limitata. Pertanto, il file 192 kHz sarebbe probabilmente causare più male che bene, se ci fosse in realtà alcun contenuto ultrasuoni contiene all'interno di tali file.

Se fosse bisogno di una prova più, te lo mostrerò anche un'uscita da un DAC di alta qualità con il Circo Logic CS4272 (nella foto in alto). Il CS4272 dispone di una sezione di interpolazione e ripida costruito nel filtro di uscita. Tutto quello che stiamo facendo per questo test utilizza un micro-controllore per alimentare il DAC due campioni a 16 bit ad alta e bassa a 48kHz, dandoci la forma d'onda di uscita massimo possibile a 24kHz. Non vi sono altre componenti di filtraggio utilizzate, questa uscita arriva direttamente dal DAC

.  Uscita codec CS4272

Il segnale di uscita 24kHz (in alto) da questo componente grado DAC studio di certo non assomiglia rettangolare Wave associato con il materiale di marketing usuale. La frequenza di campionamento (Fs) viene visualizzato nella parte inferiore dell'oscilloscopio.

Si noti come l'onda sinusoidale di uscita (in alto) è esattamente la metà della velocità del clock di frequenza (in basso). Non ci sono scale evidenti e questa forma d'onda molto alta frequenza sembra quasi come un'onda sinusoidale perfetta, non un blocchi cercando un'onda quadra che il materiale di marketing o addirittura uno sguardo casuale ai dati di uscita suggerirebbero. Questo dimostra che anche con solo due esempi, la teoria di Nyquist funziona perfettamente in pratica e possiamo ricreare un onda sinusoidale pura, assente di qualsiasi contenuto armonico aggiuntivo, senza una profondità di bit o campione tasso enorme.

Il verità circa a 32 bit e 192 kHz

Come molte altre cose, c'è qualcosa di vero nascosto dietro tutto il gergo e 32-bit, 192 kHz audio è qualcosa che ha un uso pratico, non solo nel palmo della tua mano. Questi attributi digitali davvero tornare utile quando si è in un ambiente di studio, quindi le richieste per portare "studio qualità audio a mobile", ma queste regole semplicemente non si applicano quando si vuole mettere la traccia finita in tasca.

Prima di tutto, cominciamo con frequenza di campionamento. Uno dei vantaggi di una maggiore spesso propagandato audio risoluzione è la conservazione dei dati ultra-sonic che non si può sentire, ma urta la musica. Spazzatura, maggior parte degli strumenti cadere ben prima che i limiti del nostro udito frequenza, microfono utilizzato per catturare uno spazio roll off al massimo intorno 20kHz, e le cuffie che si sta utilizzando di certo non si estenderà che lontano. Anche se potessero, le orecchie semplicemente non può rilevarlo

.  tipici picchi di sensibilità dell'udito umano a 3 kHz e comincia rapidamente a roll off dopo 16kHz.

Antonine Istruzione tipici picchi di sensibilità dell'udito umano a 3 kHz e rapidamente comincia a rotolare fuori dopo 16 kHz.

Tuttavia, il campionamento 192 kHz è abbastanza utile a ridurre il rumore (che termine ancora una volta) durante il campionamento dei dati, consente una semplice realizzazione di filtri di ingresso essenziali, ed è importante anche per effetto digitale ad alta velocità. sovracampionamento sopra spettro udibile ci permette di mediare il segnale di abbassare la rumore di fondo. Scoprirete che più buoni ADC (convertitori analogico-digitale) in questi giorni venire con costruito in 64 bit sovracampionamento o più.

Ogni ADC ha anche bisogno di rimuovere le frequenze di sopra del suo limite di Nyquist, o si finirà con orribile suono aliasing come le frequenze più alte sono "ripiegati" nello spettro udibile. Avere un divario più ampio tra il nostro 20 kHz frequenza di taglio del filtro e la frequenza di campionamento massima è più accomodante ai filtri del mondo reale che semplicemente puo ' t essere ripido e stabile come i filtri teorici necessari. Lo stesso è vero, alla fine DAC, ma come abbiamo detto intermodulazione può molto efficacemente spingere questo rumore fino a frequenze più alte per una più facile il filtraggio

larghezza

Il ripido filtro più ripple in banda passante. Aumentando la frequenza di campionamento consente l'utilizzo di filtri "lenti", che aiuta a mantenere una risposta in frequenza piatta nella banda passante udibile.

Nel dominio digitale, norme analoghe valgono per i filtri che vengono spesso utilizzati nel processo di miscelazione studio. frequenze di campionamento più elevate consentono più ripida, filtri ad agire più rapidamente che richiedono dati supplementari al fine di funzionare correttamente. Nessuno di questo è necessario quando si tratta di riproduzione e DAC, in quanto siamo solo interessante in quello che si può sentire.

Passando a 32-bit, chiunque abbia mai tentato di codificare qualsiasi matematica remoto complesso sarà capire l'importanza di profondità di bit, sia con i dati interi e in virgola mobile. Come abbiamo discusso, più i bit meno rumore e questo diventa più importante quando si inizia dividere o sottraendo i segnali nel dominio digitale a causa di errori di arrotondamento e per evitare errori di clipping quando si moltiplicano o l'aggiunta.

 binario Math

Ulteriori profondità di bit è importante per preservare l'integrità di un segnale quando si eseguono operazioni matematiche, come all'interno di software audio studio. Ma possiamo buttare via questi dati aggiuntivi una volta che la masterizzazione è terminata.

Ecco un esempio, diciamo che prendiamo un campione di 4 bit e il nostro campione corrente è 13, che è 1101 in binario. Ora cerchiamo di dividere che per quattro e ci ritroviamo con 0011, o semplicemente 3. Abbiamo perso un extra 0,25 e questo rappresenterà un errore se abbiamo cercato di fare matematica supplementare o girare il nostro segnale di nuovo in una forma d'onda analogica.

Questi errori di arrotondamento si manifestano come piccole quantità di distorsione o rumore, che può accumularsi su un gran numero di funzioni matematiche. Tuttavia, se abbiamo esteso questo campione a 4 bit con bit di informazioni aggiuntive da utilizzare come una fazione o punto decimale allora possiamo continuare a dividere, aggiungere e multiple per molto più a lungo grazie ai punti di dati aggiuntivi. Così nel mondo reale, il campionamento a 16 o 24 bit e quindi converte questi dati in un formato a 32 bit per l'elaborazione di nuovo aiuta a risparmiare sul rumore e distorsione. Come abbiamo già detto, a 32 bit è un sacco di punti di accuratezza.

Ora, qual è altrettanto importante riconoscere è che non abbiamo bisogno di questo margine di altezza in più quando torneremo in dominio analogico. Come abbiamo già discusso, in tutto 20-bit di dati (-120dB del rumore) il massimo assoluto che può eventualmente rilevare, in modo che possiamo riconvertire ad un file di dimensioni più ragionevole senza compromettere la qualità audio, nonostante il fatto che "audiofili" sono probabilmente lamentando questa perdita di dati.

Tuttavia, inevitabilmente introdurre alcuni errori di arrotondamento nel passare ad una profondità di bit inferiore quindi ci sarà sempre qualche piccola quantità di distorsione extra come questi errori non sempre si verifica in modo casuale. Anche se questo non è un problema con audio a 24 bit in quanto estende già ben oltre la soglia del rumore analogico, una tecnica chiamata "dithering" risolve ordinatamente questo problema per file a 16 bit.

 Un confronto esempio della distorsione introdotta per troncamento e dithering.

Wikipedia Un confronto esempio della distorsione introdotta da troncamento e dithering.

Questo è fatto casualizzazione il bit meno significativo del campione audio, eliminando gli errori di distorsione, ma l'introduzione di alcuni molto tranquilla rumore di fondo casuale che si sviluppa attraverso le frequenze. Sebbene l'introduzione di rumore può vedere contro intuitivo, questo riduce effettivamente la quantità di distorsione udibile a causa della casualità. Audio Inoltre, utilizzando speciali modelli di dithering a forma di rumore che abusano la risposta in frequenza dell'orecchio umano, a 16 bit retinata può effettivamente mantenere un livello di rumore percepito molto vicino a 120dB, proprio ai limiti della nostra percezione.

dati a 32 bit e frequenze di campionamento 192 kHz hanno notevoli benefici in studio, ma le stesse regole non valgono per la riproduzione.

Shutterstock 32-bit di dati e frequenze di campionamento 192 kHz hanno notevoli benefici in studio, ma le stesse regole non valgono per la riproduzione.

In poche parole, lasciare che gli studi intasare loro hard disk con questo contenuto ad alta risoluzione, noi semplicemente non abbiamo bisogno di tutti quei dati superflua quando si tratta di riproduzione di alta qualità.

avvolgere

Se siete ancora con me, non interpretare questo articolo come un rigetto completo di tali sforzi per migliorare i componenti audio dello smartphone. Anche se il numero touting può essere inutile, componenti di qualità più elevata e una migliore progettazione di circuiti è ancora un ottimo sviluppo nel mercato della telefonia mobile, abbiamo solo bisogno di assicurarsi che i produttori concentrano la loro attenzione sulle cose giuste. Il 32-bit DAC in LG V10, per esempio, sembra incredibile, ma non c'è bisogno di perdere tempo con enormi dimensioni dei file audio a

Bibliography ►
Phoneia.com (January 19, 2016). Il grande mito audio: perché non è necessario che il 32-bit DAC. Recovered from https://phoneia.com/it/il-grande-mito-audio-perche-non-e-necessario-che-il-32-bit-dac/