Una comparativa entre Mp3, WMA, AAC, VQF y Ogg Vorbis

2008-04-19 22:26:14 -0700

Resumen

Este artículo (bastante viejo, ya que data del 2001) hace una comparativa entre los formatos Mp3, WMA, AAC, VQF y Ogg Vorbis. Mis pruebas subjetivas demuestran que AAC y Vorbis son los que presentan la mejor calidad de compresión, aunque Vorbis presenta mayores ventajas prácticas para su uso en la distribución en Internet.

Artículo relacionado: Ogg Vorbis: ¿El sucesor de Mp3?

Comparativa

Advertencia

Primero, esta comparativa está dirigida principalmente a comparar distintos formatos para el almacenaje en Cds y distribución de canciones en internet en altos bitrates (superiores a 96 kpbs, inclusive). Por lo tanto, para efectos de distribución de canciones en internet por streaming los resultados serán distintos.

Segundo, la comparación no está realizada desde un punto de vista técnico, sino más bien de percepción subjetiva.

Tercero, la música utilizada en las pruebas fue rock, principalmente por la amplia utilización de frecuencias altas (platillos), las cuales son las que más problemas generan en la compresión de audio. De todos modos, también se realizaron algunas pruebas con música de clásica.

Si quieres tener otras opiniones, puedes revisar algunos links que he encontrado con comparativas.

Introducción

En mis pruebas, he comprimido el mismo trozo musical en Mp3, Vorbis, WMA (Windows Media Audio), ACC y VQF en distintos niveles de compresión, para ver las diferencias. La muestra utilizada corresponde a una canción rock de 1:47 minutos, que incluye variadas secciones de instrumentos en solitario (ritmos programados, guitarras, pianos), junto a secciones con los instrumentos en conjunto, con bastante uso de los platillos(hi-hat y ride).

Se utilizó para las pruebas un Pentium III de 450 KHz. Para los distintos formatos, fueron usados los siguientes programas:

Entendiendo que la percepción de audio es bastante subjetiva y que la opinión de otra personas podría ser diferente, presento los resultados preliminares:

96 kbps

Esta tasa es una de las menores que pueden ser usadas si se pretende tener una calidad de escucha relativamente buena.

Para un archivo de 17Mb (1:43 segundos) de música rock, tuve los siguientes tiempos de codificación y tamaño de archivo:

  Tiempo Tamaño
Mp3 1:05 minutos 1,17 Mb
VQF 2 minutos 1,17 Mb
WMA 15 segundos 1,19 Mb
AAC 2:17 minutos 1, 18 Mb
Ogg Vorbis 1 minuto

1,39 Mb

Ogg Vorbis tiene la particularidad de ser, preferentemente, de bitrate variable por sobre fijo, de modo tal que aunque esté fijado a 96 kbps su tasa, tiende a ocupar un poco más en aquellos pasajes donde lo requiere.

Como vemos, el más rápido es el codificador WMA, después el de Vorbis, seguido por el de Mp3, el VQF y el más lento es el de AAC.

En cuanto a la calidad de audio, lejos el peor fue el de Mp3. Aparte de disminuir la frecuencia de muestreo total de 44.1 KHz a 32 KHz y alargar los agudos, se escuchan muchos artefactos en todas las frecuencias, especialmente en las agudas (platillos) - ese conocido 'glitch-glitch' licuoso, junto a distorsiones en el campo estereo, como aparición de frecuencias específicas en lugares del campo donde no deberían estar.

En el caso de VQF, lo tiende a hacer un poco mejor, ya que no se producen artefactos tan fuertes; los tonos medios y bajos suenan bien, aunque los agudos se alargan bastante - los hi-hat suenan como panderos-, sin distorsionarse tanto como los Mp3 con los artefactos "glitch" ; el campo estereo permanece bastante fiel.

WMA tiene una calidad un tanto inferior al de VQF, ya que en una sección donde había una secuencia hit-hat muy breves(tipo 808), producía pequeños cortes en el sonido y produce artefactos similares a los de Mp3 en los rides, aunque de menor fuerza; también se producen distorsiones en el campo estéreo.

Con Vorbis, se alargan algo los agudos, pero no tanto como en el VQF; el resto de las frecuencias aparecen bastante fieles, aunque los agudos suenan un tanto más brillante que los originales. No se presentan efectos notables de tremolo.

AAC tiende producir un poco más o menos de glitch que el Vorbis en ciertas secciones, aunque la diferencia es muy pequeña. Aparece menos brillo artificial que en Vorbis, pero más distorsión en las frecuencias medias.

A título personal, el orden de calidad sería el siguiente: Vorbis y AAC (poca diferencia, aunque el AAC es más pequeño), VQF, WMA y Mp3.

128 kbps

Esta es la tasa más usada de compresión en Mp3, así que le prestaremos especial atención.

El formato VQF ya no puede ser ocupado a esta tasa, ya que la máxima tasa de compresión es de 44 kbps por canal (98 kbps en estereo).

Los resultados de la codificación son los siguientes

  Tiempo Tamaño
Mp3 30 segundos 1,57 Mb
WMA 20 segundos 1,58 Mb
AAC 2:40 segundos 1,57 Mb
Ogg Vorbis 1:40 minutos 1,56 Mb

Tiempo de codificación

Como se observa, el tiempo de codificación para el Mp3 se reduce drásticamente, probablemente por la no necesidad de conversión de 44.1 KHz a 34 KHz. En el caso de Vorbis, el tiempo de compresión aumenta ligeramente en comparación con el minuto y medio a 96 Kbps. El tiempo de codificación de WMA sigue siendo asombroso (20 segundos!), en tanto que el AAC sigue siendo el más lento, disminuyendo un tanto la velocidad.

Tamaños de archivos

En cuanto al tamaño del archivo, los cuatro formatos ocupan casi el mismo tamaño, aunque el Vorbis ocupa un poco menos, debido a su uso de la tasa variable de compresión para las secciones menos complejas (silencios).

Calidad

Como resumen, los formatos se ordenan en el siguiente orden: AAC y Vorbis (muy poca diferencia), WMA y Mp3.

AAC tendía a aumentar la separación de algunas secciones y agrega un poco de glitch (casi imperceptible) a los platillos. Vorbis lo hace igual de bien, aunque agrega un poco más de glitch y brillo a los agudos. Es difícil percibir la diferencia entre ambos.

WMA tuvo más problemas, específicamente en las partes donde un instrumento quedaba como solista. Primero, tiene el típico efecto VQF de alargar los agudos, haciendo que los hit-hat en solitario suenen como panderos; peor se comportó con una línea de hi-hat tipo 808, ya que produjo mucha distorsión en el campo estereo, junto a un notable tremolo (cortes en el sonido). En las secciones con más intrumentos tuvo un mejor desempeño, aunque igual tendía a alargar los agudos y a producir en los rides un sonido de tipo "Shhiii" más que glitch.

Con respecto al Mp3, produce artefactos en las frecuencias medias cuando suenan muchos instrumentos a la vez. Además, es notable el efecto de "glitch" con el hi-hat tipo 808 y el resto de los platillos suena con un poco de glitch y más brillo del original. También se presenta distorsión del campo estereo, cuando uno de los canales tiene mucho menor volumen que el otro.

Conclusión

Los mejores formatos resultan ser, a todas luces, AAC y Vorbis. Los sigue WMA, VQF y Mp3, en último lugar.

AAC y Vorbis son los que presentan mejor calidad de audio. AAC tiende a distorsionar más las frecuencias medias y a abrir más el campo estereo, en tanto que Vorbis afecta más las frecuencias altas, produciendo un poco más de glitch y brillo.

Ahora bien, dos factores juegan en contra de AAC: el tiempo de codificación es mayor que el de Vorbis y es difícil encontrar los codificadores y los reproductores para usar el formato.

Podría recomendarse AAC para el uso individual (almacenaje de canciones en CD), si bien Vorbis se presenta como muy buena alternativa frente al Mp3 tanto para la distribución en Internet de canciones en altos bitrates como el ripeo de discos y el almacenamiento de canciones para uso personal.

Links

Algunos sitios muy buenos con comparativas con distintos tipos de formato son: