SOFTWARE
COS'E'
E COME FUNZIONA L'MP3
MP3
(ovvero MPEG1-Layer3) è un formato audio digitale molto compresso, tale da
poter essere scaricato velocemente da internet. Questa compressione, che non
comporta alcuna conseguenza in termini di qualità del suono percepibile da
orecchio umano, si ottiene sfruttando l’algoritmo MPEG 1 Layer-3. Questo
algoritmo sfrutta in parte la ridondanza informativa dei dati (meccanismo usato
dagli algoritmi di compressione tipo ZIP) ma soprattutto le teorie della
psicoacustica (elimina cioè i suoni che vengono coperti da altri in
quell’istante e tutti quelli che sono su frequenze non percepibili
dall’orecchio umano). In pratica se una volta un minuto di suono in qualità
Cd 44.100kHz, stereo a 16 bit occupava circa 10 MB ora con la codifica Layer 3 -
sempre conservando la stessa qualità - si può ottenere una riduzione fino ad
un fattore 12 conservando praticamente inalterate le caratteristiche del suono
all'orecchio umano.
Negli
ultimi anni sono stati fatti notevoli progressi sulla compressione audio e video
in relazione all’enorme crescita della rete internet. Tutto questo ha portato
alla nascita dello standard MPEG (Motion Picture Coding Experts Group).
Il problema di base è stato quello di cercare degli algoritmi molto efficaci
per il trattamento del segnale video e audio che potessero, in poche parole,
permettere di avere dei file di dimensioni non eccessivamente grandi: si pensi
ad esempio che un file audio di qualità CD (campionamento a 44.100 Hz, 16 bit
stereo di 5 minuti) occupa circa 50 Mb.
MPEG:
è nato del gennaio del 1988 presso i laboratori CSELT di Torino con
l’esigenza di sviluppare uno standard mondiale per la rappresentazione di
immagini in movimento, di audio, di immagini e audio combinati insieme. I vari
passi hanno portato alla nascita di versioni successive:
MPEG1: codifica del segnale audiovisivo combinato ad un bit-rate di circa
1.5 Mb/s con qualità minore della TV. Come occupazione siamo intorno a 1,2 Mb/s
per il video e 0,3 Mb/s per l’audio stereofonico.
Specifiche audio:
-
Frequenza
di campionamento: 32, 44.1 e 48 kHz
-
Numero
canali: 1 o 2
-
Modi
di funzionamento: mono, dual-mono, stereo, joint-stereo
-
Bit-rate:
32-224 kb/s per canale
-
Bit-rate
per buona qualità: 192 kb/s
-
Tre
livelli, comunemente chiamati layers, di compressione:
-
Layer
I: è il più semplice (bit-rate > 128 kb/s, poca compressione)
-
Layer
II: più complesso (bit-rate = 128 kb/s)
-
Layer
III: il più complesso (bit-rate = 64 kb/s, molta compressione)
^
On Top
MPEG2:
codifica generica di fotogrammi in movimento con audio associato ad un bit-rate
di circa 6 Mb/s con qualità TV. Viene introdotta la gestione dei canali in
surround, cioè 5 canali audio (sinistro, centrale, destro, sinistro surround,
destro surround) più un canale supplementare per i subsuoni.
MPEG3:
pensato per l’introduzione della televisione ad alta definizione, non è stato
sviluppato perché assorbito dalle specifiche di MPEG2.
MPEG4:
codifica ad oggetti. Le immagini così come l’audio vengono ora visti come
composti da diversi oggetti, questo per permettere la comunicazione
multimediale. L’utente può così decidere di ascoltarsi un concerto
ambientato al mare, in montagna, nel suo salotto e può inoltre decidere
l’angolatura della ripresa e quali suoni mettere in risalto sugli altri o
addirittura eliminarli tutti tranne uno. MPEG4 è ancora in fase di sviluppo ed
è prevista la sua definitiva standardizzazione entro fine 1999.
Oggi si sente anche parlare di MPEG7 e MPEG13… solo voci o nuove idee? Ci
vorrà ancora un po’ di tempo per saperlo. Ad oggi solo MPEG1 è stato
completamente standardizzato.
Le codifiche che hanno portato alla nascita dei vari standard di cui si è
appena parlato sono compatibili gerarchicamente, ossia MPEG2 è compatibile con
MPEG1 e non viceversa.
Ma allora, alla fine di tutto: MP3 da dove salta fuori? MP3 non sta per MPEG3
bensì per MPEG1 Layer 3.
La compressione audio
Per capire come è possibile raggiungere delle compressioni così elevate
bisogna fare un cenno sulla psicoacustica. Il segnale audio è ciò che
possiamo udire; le capacità percettive dipendono quindi da individuo ad
individuo ma con buona approssimazione l’udito umano è sensibile alle
frequenze comprese tra i 20 Hz ed i 20 kHz con maggior risalto tra i 2 e i 4 kHz.
Dagli studi effettuati facendo ascoltare dei suoni a un campione di test è
emerso che se si emette un suono ad una determinata frequenza, con una certa
energia, l’udito non sarà capace di percepire le frequenze immediatamente
prossime anche se queste hanno volumi appena inferiori. Questo fenomeno è noto
come mascheramento. In altre parole ad ogni frequenza è associata una campana
di mascheramento (banda critica) che varia da frequenza a frequenza, ed in
particolare aumenta con il suo aumentare. La psicoacustica occupa un ruolo molto
importante nella codifica MPEG: la sola compressione, quella usata dai
compattatori più famosi, non basta per ottenere dei risultati così notevoli,
questo perché c’è poca ridondanza nei dati in un file audio (cosa opposta si
ottiene ad esempio in un file di World per Windows, dove con la sola ridondanza
informativa dei dati si possono ottenere compressioni del 70% e più).
L’algoritmo di compressione per quanto riguarda MPEG1 ha una struttura di base
comune, cambia il calcolo del modello psicoacustico e delle subbande da layer a
layer. La prima fase consiste nella suddivisione del segnale campionato in
sottobande, procedimento noto sotto il nome di time-frequency mapping. La
seconda fase consiste nell’implementazione del modello psicoacustico tramite
FFT (Trasformata Veloce di Fourier) che fornisce informazioni dettagliate sul
segnale che viene diviso in tonale e non tonale. Vengono quindi individuate le
maschere sonore tonali e non tonali e le soglie di percettibilità delle singole
maschere vengono combinate per generare una soglia di mascheramento globale.
Questa viene rapportata al livello del massimo segnale rilevato nelle
sottobande, ottenendo un rapporto segnale/mascheramento (SMR = Signal to Masker
Ratio) che costituisce il dato di partenza per la quantificazione dei dati da
comprimere. La terza fase consiste nella quantizzazione e codifica di ciascun
campione di ogni sottobanda calcolando un coefficiente necessario per
rappresentare in scala il rapporto segnale-rumore. L’ultima fase è quella
della generazione del file compresso: il brano digitalizzato viene suddiviso in
frame.
^
On Top
Per quel che riguarda MP3 (ricordiamo: MPEG1-Layer3) si è cercato di ridurre al
minimo il flusso di dati, questo ha portato ad una struttura più complessa
rispetto al layer 1 e layer 2, con tempi di codifica più lunghi. Dal punto di
vista dell’algoritmo le caratteristiche più importanti sono:
-
oltre
alla FFT viene aggiunta un’altra trasformata (DCTF = Discrete Cosine
Transform Filter) che consente di implementare un modello psicoacustico
assai più fedele e performante
-
nella
fase di preparazione dei frame viene aggiunto un sofisticato algoritmo che
consente di variare le dimensioni dei frame stessi. Viene inoltre aggiunto
un bit riservato, simile a quello presente nella codifica video MPEG. Questo
bit serve per risolvere situazioni critiche e distorsioni che potrebbero
intervenire nella codifica del campione.
Non
ha quindi senso chiedersi quale sia l’encoder migliore: la risposta spetta a
te in relazione alle tue esigenze. Puoi scegliere tra encoder veloce e lento,
fare paragoni con mp3 ottenuti da encoder diversi a parità di bit-rate. Ricorda
che più un encoder è ‘veloce’ e più perdi in fedeltà audio: questo è
difficile da percepire ascoltando MP3 dalle casse del tuo computer. Prova a
metterti un bel paio di cuffie e le piccole distorsioni introdotte dalla
compressione verranno a galla sicuramente.
Il bit-rate
Se poi devi creare MP3 con basso bit-rate il nostro consiglio è di utilizzare
encoder ‘lenti’ (non sicuramente Xing e famiglia). Il bit-rate è un
parametro molto importante nella fase di compressione perché, insieme alla
frequenza di campionamento, ai bit di dimensione di campionamento e ai canali
usati, sono i principali parametri che influiscono sulla dimensione finale del
file e sulla sua qualità audio, legando queste 2 caratteristiche in maniera
inversamente proporzionale ovvero:
^
On Top
IL
TUO COMPUTER E' PRONTO PER MP3?
Non occorre avere un computer particolarmente potente per ascoltare musica MP3,
ma è importante che sia multimediale, cioè che abbia una scheda audio e delle
casse: è sufficiente quindi un 486 con una scheda sonora. Tuttavia se non si
vuole scendere a qualche compromesso tipo rinunciare alla stereofonia dei brani
per limitare il lavoro della cpu è consigliabile disporre perlomeno di un PC
Pentium dotato di una buona scheda audio tipo Soundblaster, oppure di un Mac di
pari requisiti. E' poi importante avere a disposizione spazio sul proprio disco
fisso per poter salvare i propri file musicali. Ogni brano musicale normalmente
occupa dai 3 ai 5 MB di spazio disco (approssimativamente 1MB per ogni minuto di
canzone con bit-rate a 128.000). Ricorda che un file MP3 è molto compresso e
quindi quando lo ascolti il computer deve decomprimerlo in tempo reale, quindi
più il computer è potente e più è in grado di farlo senza per questo
interferire con l'utilizzo contemporaneo di altri software che stai utilizzando.
Anche se sono allo studio schede audio in grado di aprire i file MP3 senza
software aggiuntivi, attualmente è indispensabile disporre anche di un
programma in grado di aprire i file MP3, il ‘Player’. Ne esistono molti
gratuiti o shareware. Per Windows ti consigliamo Winamp, per Mac puoi provare
Macamp, per Linux Xmms e se utilizzi altri Unix ti consigliamo Xaudio.
Esistono inoltre altri formati per cui ti serve un player. In particolare ti
consigliamo anche di installare sul tuo computer Realplayer, il software che
consente di ascoltare il diffusissimo formato di trasmissione via Internet: il
formato Real Audio.
^
On Top
COME
CREARE FILE MP3
La creazione di un buon MP3 si può dividere in due fasi: la prima è quella di
ottenere un file audio in formato WAV. La seconda è quella di comprimere questo
file in formato MP3.
Sicuramente un file WAV sarà di qualità superiore se si è ottenuto partendo
da una fonte digitale, come ad esempio un cd, ma naturalmente lo si può
ottenere anche partendo da una cassetta o da un lp. In questo secondo caso sarà
necessario collegare l’apparecchio col quale si riproduce il brano alla
propria scheda audio con un normale cavo stereo che abbia ad una estremità un
jack piccolo maschio, da inserire nella presa Line In della scheda audio, e
all'altra un jack o una spina RCA da inserire nell'uscita della sorgente sonora,
come ad esempio l'uscita AUX di un mixer o di un amplificatore. Bisogna quindi
registrare in formato WAV la o le tracce musicali usando un editor di suoni come
CoolEdit 96 o GoldWave od anche il normale Registratore di Suoni incluso con
Windows. Questo metodo genera tuttavia risultati di qualità abbastanza bassa,
in quanto il suono viene acquisito per via analogica e campionato dalla scheda
audio.
Nel caso invece, più frequente ormai, che si debba partire da un cd audio per
creare il relativo MP3 non si ha nessuna perdita di qualità nella prima fase,
la conversione cioè da traccia audio cd a file WAV. Esistono diversi programmi
che possono svolgere questa funzione, ognuno con le sue caratteristiche e pregi,
ma sostanzialmente si equivalgono.
La fase successiva è quella di passare dal file WAV al file MP3. Per la verità
molti dei programmi che svolgono questa funzione sono anche in grado di
realizzare direttamente un file MP3 partendo dal cd saltando la fase intermedia
della creazione del relativo file WAV (o meglio, se ne occupa il programma
stesso automaticamente facendo un file temporaneo WAV e poi cancellandolo),
semplificando così di molto la vita di noi utenti.
Anche in questo caso esistono diversi programmi con diversi pregi e più o meno
veloci a seconda di quale algoritmo usino per realizzare i file MP3. In generale
vale la regola d’oro che più il programma è lento migliore sarà la qualità
finale della codifica.
Programmi come MP3 Compressor, MP3 Producer, MusicMatch Jukebox e Mpeg Encoder
utilizzano l’algoritmo ‘Fraunhofer’, che salva quasi tutti i suoni fino ai
20 Khz , e fanno quindi parte di quelli "lenti". Programmi invece come
Xing MP3 Encoder, Xing MPEG Encoder e Xing Audiocatalyst utilizzano
l’algoritmo ‘Xing’ sviluppato dalla stessa XingTech, che elimina tutti i
suoni al di sopra dei 16 Khz, facendo così parte di quelli più
"veloci".
Per finire un piccolo glossario: tutti i programmi che permettono di salvare
tracce audio in file WAV si chiamano "Ripper", mentre quelli che
comprimono i file WAV in MP3 si chiamano "Encoder". "Grabbare"
un cd od un brano significa trasformarlo da traccia audio in un file audio
compresso, quindi tutti quei software che sono in grado di permetterci questo
evitandoci di dovere prima realizzare il file WAV sono anche chiamati "Grabber".
^
On Top
SOFTWARE
Clikkando
sul sistema operativo al quale sei interessato verrai collegato alle pagine
relative al s.o. prescelto di vitaminic.it da dove potrai acquisire nozioni su
vari programmi per MP3. Troverai software per vari utilizzi (rippare, grabbare e
encoder).
Seleziona
il tuo sistema operativo:
Buon
divertimento
^
On Top
|