Volume, guadagno, clip, decibel: un pout-pourri di teoria


La prossima settimana uscirà la prima di un articolo in due parti dedicato alla compressione della voce. È un argomento esteso, difficile da spiegare bene e semplicissimo da spiegare male («Comprimi che si sente meglio!»), e mentre preparavo la prima stesura mi sono reso conto che molte cose mi sarebbero venute più semplici se prima avessi affrontato un po’ di teoria. Niente di esagerato, ma qualche tassello fondamentale per poterci poi librare come libellule libere e smanettare consapevolmente con la compressione. E non solo la compressione: quello di cui parliamo oggi tornerà più e più volte, a ogni lezione o video in cui si affronta un argomento tecnico.

Pertanto imprimiamoci nel cervello questi concetti, ci farà solo bene. Prenditi il tuo tempo, e non ti preoccupare se certe cose non te le ricordi: è normale, finché non ci hai a che fare spesso. Puoi anche tenerti questo articolo salvato nei preferiti, e tirarlo fuori quando hai bisogno di rinfrescare la memoria: potessi, lo farei anche io! 🙃

Non so se hai mai notato che nei mixer o nelle DAW si usano termini diversi per indicare cose che sembrano essere identiche: volume, guadagno, gain, che differenza c’è? Ecco, a volte non c’è differenza, altre c’è ed è profondissima. La cosa più straniante è che quello di cui parliamo adesso sono tre o quattro argomenti diversi, che però usano termini molto simili se non proprio gli stessi; come se non bastasse usano le stesse unità di misura, partendo però da basi leggermente diverse. Insomma, parlare di decibel quando si registra è un casino.

Mettiti comoda, che iniziamo da

Cos’è il volume

Papale papale: è quanto è forte un suono alla sua riproduzione dopo che è stato manipolato ed elaborato in fase di editing e mastering. La riproduzione può avvenire sul tuo telefono, un preamplificatore, un computer, una cassa, un impianto hi-fi: qualsiasi cosa. Quando riproduci dell’audio e alzi o abbassi il volume, tendenzialmente intervieni su quanto è forte o debole quel suono – quel podcast, quella canzone, quelle cose lì – e non vai a modificare il timbro, il “come suona” qualcosa.

I decibel

Tutto questo si esprime in decibel, che sono un decimo del bel, un’unità di misura non compresa nel Sistema internazionale, ma che si usa per misurare l’intensità di qualcosa: nel nostro caso, del suono.

Bel e decibel sono misure logaritmiche, il che significa che tra i loro valori c’è un’intervallo di valore 10, non di 1: cioè un suono che ‘misura’ 2 decibel è 10 volte più intenso di un suono a 1 decibel. Un rumore misurato a 10 decibel è 100 volte più intenso di uno a 1 decibel, eccetera.

Quando parliamo di volumi usiamo i decibel, più che i bel, perché sono più piccoli e ci aiutano a definire meglio le differenze tra i suoni. Questo perché un suono appena percettibile dal nostro orecchio equivale a un suono di zero decibel; per sentire la minima differenza udibile tra quel suono e uno appena un po’ più forte è necessario che tra i due ci sia un decibel di differenza (cioè il secondo suono sia dieci volte più forte del primo).

Ricapitolando, e mettendo le cose in scala: il rumore più debole che possiamo sentire noi umani sta a 0dB, una stanza silenziosa sta intorno ai 40dB, una conversazione normale sta grossomodo a 60 decibel, un’automobile con motore a scoppio che ti passa accanto può arrivare a 90dB, un aereo in decollo come minimo fa 120dB, un concerto dei Manowar può raggiungere o superare i 129,5dB

Sostenere volumi oltre i 100 decibel per lungo tempo porta a danni permanenti all’udito.

Ovviamente se finisse così non ci sarebbe bisogno di altri 6mila caratteri qui di seguito: è che la questione s’ingarbuglia più volte. Perché un conto è l’intensità dei suoni del mondo reale, un conto è l’intensità dei suoni in fase di registrazione. È per quello che abbiamo bisogno di:

Headroom

No, i Queen cantavano Headlong, qui invece accenniamo al concetto di “headroom”, margine, (letteralmente: “spazio a disposizione sopra la testa”). Ovvero: quando registri è sempre opportuno lasciare un po’ di margine operativo, in modo tale da poter operare delle modifiche in post-produzione. Negli studi di registrazione analogici si cercava di registrare a volumi relativamente alti, senza esagerare; se esageravi era il sistema stesso che tagliava il tuo suono quando arrivavi a una determinata soglia di volume (quando succede si dice: clippare).

Il volume “giusto” per registrare dipendeva ovviamente dalla sensibilità della consolle, ma tendenzialmente iniziavi già a esagerare quando superavi 0dB. Questo limite era stato stabilito attraverso un po’ di analisi e calcoli fatti con i VU meter, degli apparecchi che servono a misurare l’intensità dei volumi. Stabilito così che 0dB è il limite massimo di riproduzione senza incappare in distorsioni, gli apparecchi di registrazione analogici potevano andare fino a +22 o +26dB prima che l’audio clippasse. Avere venti decibel di margine sopra alla soglia ottimale significava poter entrare molto forti con chitarre, bassi, ma anche con la voce, prima di avere dei problemi.

Quando è arrivato il digitale si è ribaltato tutto.

I decibel “full scale”

Ribaltato? Ebbè. Non so se hai mai notato che sulle diverse DAW il massimo segnale raggiungibile non è 129,5dB, ma 0. Zero?

Non va in conflitto con quello che ti ho appena spiegato: nonostante i ragionamenti sulla grandezza dell’intensità – sulla base logaritmica – siano i medesimi, nell’audio digitale si usano i dBFS, i decibel Full Scale. Indicano l’intensità che il sistema può sopportare, dal minimo al massimo, con -infinito come minimo e 0 come massimo. Pertanto non è strano che nel registrare una traccia vocale tu veda gli indicatori del mixer o della DAW stare tra i -18dB e i -10dB. Quando raggiungi lo 0, sei al massimo volume possibile. Quando lo superi, allora stai clippando.

Nella pratica è l’opposto di quanto succede nella vita normale: lì lo zero indicava il punto più debole che possiamo sentire, qui il più forte. Una volta avevo trovato un video in cui si parlava di 0dB Full Scale come la superficie dell’acqua: c’è solo da immergersi e raggiungere il fondo marino, nell’audio digitale.

E il guadagno?

Più conosciuto come “gain”, è un termine usato per indicare due o tre cose diverse, e cioè: (a) il volume di uscita, chiamandolo semplicemente in un altro modo, e purtroppo non ci possiamo fare niente; (b) il volume di linea, di entrata di uno strumento: nel nostro caso, quanto è “forte” un microfono collegato a una scheda audio, ma pensa anche anche alle chitarre; (c) a proposito delle chitarre, la distorsione. Quest’ultimo caso non ci interessa.

Se consideri quanto l’uso della distorsione ha cambiato la percezione della chitarra, e ha visto la nascita di nuovi generi musicali, capisci bene che contrariamente al volume, giocare col guadagno cambia irrimediabilmente il tono del tuo segnale, spesso rendendolo più caldo (prima di mandarlo a quel paese).

Sii cosciente del fatto che lavorando con DAW e plugin vari potresti trovare il termine gain utilizzato per tutti e tre gli esempi, prima in un senso e poi nell’altro. Ma è nell’accezione di “livello di ingresso di uno strumento“, che lo consideriamo.

Facendo podcast, e utilizzando strumentazione digitale c’è meno pericolo di generare problemi di guadagno in fase di registrazione: soprattutto se usi un microfono usb, che normalmente sfoggia pochi controlli: devi proprio tirarlo a cannone per distorcerlo. Però se stai mettendo a frutto quel mixer che avevi comprato quando giravi i locali facendo cover dei Savatage, e il microfono del tuo vecchio cantante, e tutti quei cavi, e quel trasformatore da analogico a digitale come pezzo finale della catena: be’, in quel caso devi stare molto più attenta, perché potresti inserire, all’interno della catena che lega i vari segnali, dei guadagni troppo bassi, e quindi rendere quello che registri inintelligibile e rovinare la vita di chi si occupa della post-produzione. Oppure potrebbero essere troppo alti, rovinando ugualmente la vita a chi si occupa della post-produzione perché non avrebbe granché da fare. Ricordati che non devi mai:

Clippare, che il più grave dei peccati

Clippare è la distorsione, quella che succede quando gridi e sei troppo vicina al microfono, quella che infastidisce le tue ascoltatrici se non poni un minimo di rimedio. È il peccato più grave che puoi compiere, perché risolvere questo problema è praticamente impossibile: puoi al massimo limitare i danni.

Questa immagine mostra cosa succede a un’onda sonora quando clippa:

Vedi quando l’onda arriva a toccare il bordo dell’immagine e diventa piatta? Vuol dire che ha superato 0dB, il limite massimo che la tua DAW può processare. Quando il tuo suono è troppo forte e supera questo limite, il sistema non riesce più a fare niente, l’audio va in distorsione e all’atto pratico tu perdi parte di quel segnale. Ci sono dei software che limitano i danni oppure riescono addirittura a ricostruire qualcosa, ma non farci eccessivo affidamento: l’arma migliore contro il clipping è non clippare.

Un accenno a quello che verrà: i LUFS

Non mi dilungherò troppo, in questa sede, a parlare di LUFS: perché sono solo tangenziali a questi discorsi, e perché questo articolo è un’introduzione a un’introduzione alla compressione della voce, quindi c’entra davvero poco. Ma visto che parliamo di decibel, di volumi, di livelli e quant’altro, è importante sapere che esistono anche loro.

LUFS, o Loudness units relative to full scale, è un’unità di misura che si usa nel broadcasting, che sia di radio, TV, o oggi anche i servizi di musica in streaming. Esprime il volume al quale le radio, le televisioni, i servizi in streaming diffondono i loro contenuti, e si indica in decibel: 1 LUFS equivale a 1dB.

È importante sapere qual è il limite di volume cui il tuo podcast verrà trasmesso, in modo da non esportare file troppo silenziosi, oppure non eccedere troppo. Spotify trasmette tutto a -14LUFS, come anche YouTube. Anche Apple Music punta ai -14LUFS, il che mi fa presupporre che Apple Podcast faccia lo stesso.

Se il file che proponi loro è più basso o più alto, nemo problema: compensano automaticamente, aumentando o diminuendo il volume generale. Ma adesso si spalancherebbero le porte di un capitolo enorme, quello della normalizzazione (e, per supplemento, anche le guerre del volume). Presto preparerò un articolo per affrontare meglio tutto il cucuzzaro e spiegare come essere sicura di avere un podcast a -14LUFS (o giù di lì). Intanto, prendi questo paragrafo come un’introduzione alla normalizzazione, separato ovviamente dall’introduzione alla compressione.

Ricapitolando (piccolo manualetto da sfoderare alla bisogna)

• Il volume è l’intensità di un suono, quanto forte lo senti: va considerato il volume di uscita da un sistema di casse di qualche tipo.

• L’intensità dei suoni si misura in decibel (dB): nella vita di tutti i giorni viviamo in ambienti tra i 30/40dB e i 90dB, quando ci va male anche di più. Il minimo suono percepibile sta a zero decibel, una conversazione attorno ai 60dB.

• Nell’audio digitale, quello che usiamo ormai tutti, i dB vanno al contrario, ovvero da 0dB che è il volume più alto che i nostri computer possono reggere, fino a scendere all’infinito (con un intervallo operativo ottimale tra i -18 e i -10dB).

• Il guadagno invece è il volume in ingresso di uno strumento (in un mixer o scheda audio). Ovviamente si misura in decibel.

Se esageri con il volume d’ingresso il tuo software di registrazione non ti segue più e il tuo audio clippa, cioè nei punti più alti viene distorto e all’atto pratico tu perdi parte del segnale. La qualità ne risente e in fase di post-produzione è quasi impossibile salvare la situazione.

• Per esportare i tuoi podcast invece devi ragionare in LUFS, che pure si misurano in decibel, e l’output ottimale per i servizi di streaming di podcast (Apple Podcast, Spotify) è -14LUFS.

Puff pant. Dalla prossima settimana ci possiamo dedicare alla compressione. Se ti è rimasto qualche dubbio, o hai qualche domanda: dimmi tutto nei commenti!