Aclarando conceptos.

Mucho se ha dicho y escrito respecto a terminologías de video y audio digital ... lo triste es que se ha dicho en muchos idiomas, y muy poco en idioma español. La siguiente recopilación pretende sintetizar y aclarar varios de los términos más utilizados en este ámbito.

 

.1 (punto 1): se refiere al canal de efectos de baja frecuencia en formatos de sonido surround de 5.1 y 6.1 canales.

En un sistema de Home Theater, el subwoofer es el encargado de reproducir las profundas bajas frecuencias LFE, que van de 3 a 120Hhz

 

2-pass. (o Multi-pass): En pocas palabras, el "multipass" es el mejor formato de codificación de audio y video conocido hasta ahora. Utilizar esta técnica al codificar un video a otro formato, significa básicamente que el codificador de video (o video encoder) analiza el video múltiples veces, desde el comienzo hasta el final, antes del proceso de codificación propiamente tal. Mientras escanea el archivo, el encoder escribe información acerca del video original en su propio logfile y utiliza esta información para determinar la mejor manera posible de calzar el video dentro de los límites de bitrate que el usuario ha configurado para el proceso de codificación. Esto explica porqué la codificación multipass solo es utilizada en codificaciónes con VBR (Variable Bitrate ) (la codificación vía CBR -Bitrates Constantes- no ofrece ninguna flexibilidad al encoder para determinar el bitrate de cada frame). La mejor manera de entender porqué se utiliza este método es pensar en una película -- cuando existen tomas que son total y absolutamente negras (cambios de escena por ejemplo) la codificación de 1 pasada (1-pass) CBR utiliza exactamente la misma cantidad de datos para dicha parte, que la que utilizaría para una escena de acción compleja. Utilizando VBR y Multi-pass, el encoder "sabe" qué escenas permanecen Ok con bajos bitrates, y los bitrates que pueden ser usados en escenas más complejas, logrando así una mejor calidad para escenas que requieren un mayor bitrate. SuperVCD y DivX4 son 2 populares formatos que utilizan este método de codificación.

5.1 canales: se refiere a formatos de sonido surround que utilizan 5 canales (designación de "5") de sonidos de alta frecuencia, y un canal (designación de "1") para efectos de baja frecuencia (LFE). Ejemplos de formatos de sonido surround de 5.1 canales son Dolby Digital y DTS.

Disposición ideal de parlantes, para disfrutar de un sistema de 5.1 canales

525/60: Sistema de escaneo de 525 lineas por cuadro (o frame), y 60 campos (o fields) entrelazados (30 cuadros) por segundo. Es utilizado por la televisión estandard NTSC.

 

6.1 canales : se refiere al formato de sonido Extended Surround, como el THX Surround EX y el DTS-ES 6.1 Matrix, que tienen un canal de sonido surround posterior, para obtener efectos de 360 grados. Para ser justos, DTS-ES Discrete 6.1 es el único formato de sonido surround de 6.1 canales.

7.1 canales: se refiere a algoritmos cuyo sonido posterior está basado en dos parlantes. (Back surround).

16:9 widescreen/aspect ratio: se refiere a pantallas de televisión con aspecto de 16:9 o DVDs publicados con aspecto de 16:9.


Comparación entre el campo visual de una imagen en formato standard (4:3) con otra amplia en formato Widescreen (16:9)


AC-3: Diminutivo de Audio Encoding 3, un algoritmo de Dolby Laboratories. Es el nombre original de lo que conocemos por Dolby Digital.

Agudos (Treble) Es la parte alta del rango de frecuencias de audio, aproximadamente es arriba de 10,000Hz.

AIFF: ( .aif, .aifc, .aiff) (Audio Interchange File Format) formato de archivos de audio desarrollado por Apple Computer. Se utiliza para almacenar sampleos de alta calidad de audio.

Aliasing: Es una distorsión (artifact) durante la reproducción de video o audio digital, que aparece cuando la frecuencia de la señal es más del doble que la frecuencia de muestreo. La resolución es insuficiente, ya que admite ruido adicional que no está presente en la onda original.

Análogo (Analog) Una señal analógica es una en la cual el voltaje variable es análogo (similar) a la forma de onda acústica, que es continuamente variable.

Artefacto: (Artifact). Efecto no-natural, que no está presente en el video o audio original, y que es producido por una acción o agente externo.

Anamorphic Widesecreen: Término referido a Video DVD codificado en un formato widescreen de 16:9 (aspect ratio). El video DVD puede ser acomodado a aspect ratios de 4:3 y 16:9

ASF: Advanced Streaming Format: Este formato de archivos almacena información de audio y video, y fué especialmente diseñado para trabajar en redes, como Internet. La información es descargada como un flujo continuo de datos, y por ende, no es necesario esperar la descarga completa del archivo para poder reproducirlo.(ejemplo de Microsoft)

Aspect Ratio: El "ratio" es la razón entre el ancho y alto de la pantalla, o "ancho:alto". De esta manera, "4:3" significa que el tamaño horizontal es un tercio mayor que el tamaño vertical. El aspect ratio de la televisión estandard es de 4:3 (o 1,33:1).

AVI: Audio Video Interleave: formato de video digital desarrollado por Microsoft. Tanto el video como el audio son comprimidos en forma conjunta, y define cómo están unidos, con el fin de preservar la sincronía de ambos. Un archivo AVI puede utilizar diferentes codecs y formatos.

Baja Frecuencia (Low Frecuency) Cualquier frecuencia más baja que 160Hz.

Bitrate: Término bastante utilizado al hablar de calidades de video y audio. Define cuánto (o el promedio) de espacio físico (en bits) toma un segundo de audio o video. Por ejemplo, 3 minutos de audio MP3 a 128kBit/sg CBR, toma 2,81 MegaBytes de espacio físico (1,024 x 128 / 1,024 / 1,024 x 180 / 8).

en donde:

128kbit = 128 x 1024 bits
1 byte = 8 bits
1 kilobyte = 1,024 bytes
1 megabyte = 1,024 kilobytes
3 minutos = 180 segundos.

Algunos ejemplos:

MP3 cerca de 128 kbps (kilobits por segundo)
VCD cerca de 1374 kbps
DVD cerca de 4500 kbps
DV cerca de 25 Mbps (megabits por segundo).

 

CBR: Constant Bitrate (Bitrate Constante): Básicamente es un término que describe cómo es codificado el audio y el video, en donde el bitrate no varía a lo largo del clip de audio o video. (Ver VBR: variable Bitrate). El VCD standard contiene MPG video y audio de bitrate constante, al igual que el MP3.

CD (Compact disc) Formato de grabación digital inventado por Philips y Sony, cuantificado a 16 bits y 44.1kHz de frecuencia de muestreo.

Closed Caption : señal de video de texto sobrepuesto, que no es visible (en contraposición al open caption, que es parte permanente de la imagen). Normalmente, es la representación de audio hablado. En los EEUU, el estandard oficial NTSC de Closed Caption requiere que todo televisor mayor de 13 pulgadas incluya circuitos para decodificar cualquier tipo de información sobrepuesta almacenada en la linea 21 del video digital. El DVD puede proveer de datos closed caption, pero se prefiere el formato de imágen de bitmap sobrepuesta por su versatilidad.

El closed caption es de gran ayuda, por ejemplo, para aquellas personas que sufren problemas de audición.

 

Codec: Acrónimo de "codificación/decodificación", un codec es un algoritmo o programa de computación especializado que codifica o reduce el número de bytes consumidos por archivos y programas grandes. Los archivos codificados con un codec específico requieren el mismo codec para ser decodificados. Algunos codecs conocidos son Divx, MPEG-1, MPEG-2, Xivd, DV type 1 y type 2 para video, y MP3 para audio.

Component Video:(video por componentes) Un sistema de video que contiene tres señales de componente separadas por color; rojo,verde,azul (red, green blue RGB) o diferencias de chroma/color (YCbCr, YPbPr, YUV) en forma análoga o digital. El sistema de codificación MPEG-2 utilizado por DVDs, está basado en componente de video digital de diferencias de color. Solo algunos televisores tienen entradas de video por componentes.

Deinterlace: El proceso de crear un frame único a partir de 2 fields entrelazados de un frame de video. Esta técnica es utilizada principalmente para remover artefactos entrelazados si se requiere un nuevo frame o si el video está siendo utilizado a un rate diferente al que fue creado.

Digital TV: Es el nuevo estandard norteamericano para la televisión digital. Consiste en no menos de 18 formatos distintos de imágen, incluyendo los formatos de definición standard (SDTV) y de alta definición (HDTV). Ver más en este el artículo.

Demultiplexar: Dividir el audio y el video en archivos separados. También se conoce como "Demux".

Discreto: se refiere a un canal de audio o señal que es independiente de cualquiera de los otros canales. Dolby Digital 5.1 y DTS 5.1 son ejemplos de sistemas de sonido de multi-canales discretos.

Divx: Digital Video Express. Una variación del DVD basado en el sistema pay-per-view, de corta vida. No confundir con DivX;) .

DivX;): sistema de codificación (codec) desarrollado por un grupo de hackers, en particular por un tipo llamado gej. Está basado en la tecnología MPEG-4 de Microsoft, conocida como Windows Media Video V3. Basicamente, los encoders de Microsoft no permiten al usuario salvar streams MPEG-4 a la estructura del formato AVI, en vez de ello fuerzan a los usuarios a utilizar ASF. Esto trajo algunas limitaciónes, que fueron "corregidas" por DivX;), que también agrega soporte para otras tecnologías de codificación de Windows Media Audio, permitiendo a los usuarios utilizar MP3s en sus películas. El año 2001, los desarrolladores originales de este codec "ilegal" realizaron una versión legal del DivX;), llamada DivX4. DivX4, sin el emoticón ;) , soporta películas con el antiguo formato DivX;) y agrega nuevas capacidades y eventualmente una compresión de mayor calidad. El nombre, DivX;) proviene del desaparecido sistema de DVD por Pay Per View llamado DIVX. Con DivX;) es posible almacenar entre 50 y 120 minutos de relativa buena calidad de video en un CD (740MB) . La mayoría de las películas en formato DivX;) pueden almecenarse en un CD ( a diferencia de un VCD o un SVCD ). A partir del segundo semestre del 2004, comienzan a comercializarse los primeros DVD Players de escritorio, con soporte para DivX.

 

Dolby Digital, Dolby Surround: sistema de codificación de audio desarrollado por Dolby Laboratories y aceptado como un estandard internacional. Es la forma más común de decodificar audio para el DVD Video y es el sistema de codificación obligado para discos con sistema NTSC (525/60). ver más aquí.

Dolby ProLogic: Técnica (o circuito que aplica la técnica) de extraer audio de sonido surround de una señal de audio de codificación matricial. El Dolby ProLogic es tan solo una técnica de decodificación, pero usualmente es , erróneamente, utilizado para referirse al sistema de codificación Dolby Surround.

Dual Layered: (dos capas) se refiere a discos de DVD con dos capas en un mismo lado. Los reproductores de DVD pueden leer datos de video u audio en ambas capas con tan solo reenfocar el laser. UN DVD de una cara y de doble capa puede almacenar hasta 4 horas de video y audio y es conocido como DVD-9. Un DVD de doble cara y doble capa puede almacenar hasta 8 horas de video y audio (DVD-18).

DTS: Digital Theater Sound: Sistema de codificación de audio desarrollado para salas de cine. Un competidor de Dolby Digital y un formato de audio opcional para el DVD-Video y el DVD-Audio.

DVD: son las siglas correctas de Disco Versátil Digital (originalmente Digital Video Disc). Los DVDs pueden contener una o dos caras, cada una con una o dos capas. Dependiendo de su construcción, pueden tener diversas capacidades. Existen varios formatos de DVD, como el DVD-Video para películas y otros títulos de video; el DVD-Audio que posee múltiples canales de audio digital, y el DVD-ROM para almacenamiento de datos en el computador. Los reproductores de DVD que reproducen tanto DVD-Video como DVD-Audio son conocidos como DVD-Universal.

EDTV: Enhanced Definition Television, un subconjunto del nuevo formato de televisión digital (Digital TV). El formato EDTV define 480 lineas de resolución en escaneo progresivo (o 480p).

Encode: (codificar) Método que permite transformar los datos para su almacenamiento o transmisión, eliminado redundancias y reduciendo su complejidad. La mayoría de los métodos de compresión se basan en uno o más métodos de codificación.

Frecuencia: El espectro de sonido es caracterizado por su rango de frecuencias. Esta puede medirse en ciclos por segundo o hertz. El oido humano puede oir entre los 20Hz (bajos) a 20.000Hz. A medida que envejecemos, el rango de frecuencias se vuelve más estrecho. La siguiente tabla ilustra los rangos de frecuencia en una banda sonora:

Tambores - menos de 30 Hz
Guitarra (Bajo) - 30 Hz a 200 Hz
Voz Humana - 100 Hz a 1,700 Hz
Piano - 25 Hz a 3,600 Hz
Címbalos - sobre los 15,000 Hz

Los equipos de audio y video tienen frecuencias que van de los 20 a los 20 mil hertz, con mejor respuesta a las anchas frecuencias. Frecuencias menores a los 20 Hz se traducen normalmente en vibraciónes.

Full motion video: video que se ejecuta a treinta cuadros por segundo (29,97 para ser exacto) en NTSC o 25 frames por segundo (en PAL).

HDTV: Hight Definition Television o Televisión de Alta Definición, parte de la nueva especificación de la ATSC de Televisión Digital (Digital TV). HDTV se refiere normalmente a los formatos 1080i o 720p. El formati 1080i consiste en 1080 lineas de resolución de escaneo interlazado, mientras que el formato 720p se refiere a 720 lineas de resolución en escaneo progresivo. El estandar integro que define a la televisión digital posee no menos de 18 formatos de imágen.

Hi-Fi VHS: se refiere al formato VHS estandard con Dolby Surround Pro-Logic codificado en canales de audio stereo.

Home Theater: ver aquí.

Horizontal lines of resolution: lineas de resolución horizontales: el número de líneas de escaneo horizontal que define a una imagen de video. La mayoría de los reproductores de DVD poseen una salida de 480 lineas de resolución horizontal. En comparación, el VHS standard ofrece 260 lineas, y la televisión análoga estandard aproximadamente 330 lineas de resolución horizontal. Un mayor número de lineas horizontales generalmente significa mayor nitidez de la imágen.

Todo el mundo se confunde con el termino "lineas de resolucion horizontal", también llamadas LoHR o TVL, puesto que es una medida subjetiva. Siendo un sobrante del video analógico, es medido y anunciado inconsistentemente por los fabricantes, pero hemos de aguantar con esto hasta que el video sea digital y la resolución se mida en pixeles.

Interlace: es un sistema de escaneo de video basado en la transmisión de lineas alternadas, de modo que con cada barrido de pantalla se muestra la mitad de la imágen. Un frame "entrelazado" está generado, por ende, por dos campos (o fields).

Interleave: es un sistema utilizado para ordenar datos en trozos alternados, de modo de poder seleccionar las partes a ser extraidas y visualizadas y seleccionar aquellas que se van a "saltar". En DVD, es utilizado para implementar cámaras multi-ángulo o el material de seleccion alternativa para una misma escena.

Interpolate : interpolación; sistema que permite crear pixeles adicionales al escanear lineas o imágenes, promediando pixeles, lineas o frames adyacentes. Generalmente, esto causa un efecto de suavizado en imágenes detenidas y un efecto de blur en imágenes en movimiento.

Inverse Telecine: Telecine Reverso (IVTC); proceso de edición de video que consiste, básicamente, en volver a adecuar el framerate original de una película NTSC de 29,97 a 24 cuadros por segundo.

LaserDisc: es un formato de video análogo basado en discos grandes (8 u 12 pulgadas). Las últimas versiones de LaserDiscs soportan audio codificado con sonido Dolby Digital o DTS surround. El formato DVD es superior al LaserDisc, puesto que es digital, posee video codificado en MPG-2 de mayor calidad y mayor espacio de almacenamiento. El LaserDisc a sido desplazado por la popularidad del DVD. Muy pocos reproductores de DVD ofrecen compatibilidad con LaserDisc.

Low Frecuency Effects (LFE): se refiere a los efectos de baja frecuencia (bajos profundos), representados por el ".1" de los 5.1 o 6.1 canales de sonido surround. En palabras sencillas, hace la explociónes más explosivas y dan a las pisadas de dinosaurios en Jurassic Park un efecto más impactante. Para lograr reales efectos de baja frecuencia, se recomienda usualmente la utilización de subwoofers. Sin embargo, puedes obtener resultados similares si posees parlantes que puedan reproducir frecuencias entre los 20 y 30 Hz, y tu receptor puede dividir la señal LFE a los parlantes principales.

MPEG: Moving Pictures Expert Group. Comité internacional que desarrolló la familia de sistemas de compresión de audio y video MPEG.

MPEG-1: algoritmo de compresión de video, que es parte del standard del VideoCD. Este algoritmo fue desarrollado por el Motion Pictures Experts Group (MPEG). MPEG-1 efectivamente, comprime una imagen de video a cerca del 1/40 de su tamaño original.

MPEG-2: algoritmo de compresión de video, que es parte del standard del DVD-Video, Digital Broadcast Satellite y de Digital TV (incluyendo HDTV). Este algoritmo fue desarrollado por el Motion Pictures Experts Group (MPEG). MPEG-2 comprime una imagen de video a cerca del 1/40 de su tamaño original, pero su calidad es superior a la lograda por MPEG-1.

MP3: MPEG-1 Layer III audio. Algoritmo perceptual de codificación de audio . No es soportado por los formatos DVD-Video o DVD-Audio.

MPEG audio: audio comprimido de acuerdoal sistema de codificación perceptual MPEG. El audio MPGE-1 provee dos canales, que pueden ser formato Dolby Surround. El MPEG-2 audio agrega datos para proveer audio de multicanales discretos. El MPEG stereo es el sistema de compresión de audio obligado para el sistema de DVD-Video 625/50 (PAL/SECAM).

MPEG video: compresión de video de acuerdo al sistema de codificación MPEG. Típicamente, el MPEG-1 es utilizado para bajas tasas de transmisión de datos (data rate) como en el Video CD. El MPEG-2 es utilizado para obtener mejor calidad en el video, especialmente para video de tipo entrelazado (interlaced), como el DVD o la HDTV.

Multiplexar: combinar múltiples señales o cadenas de datos en una única señal o cadena. Usualmente se utiliza para entrelazar (interleaving) a bajo nivel.

NTSC: Comité de Normas de Televisión Nacional (National Television Standard Committee) Es un grupo de asesores de un comité establecido en los años 40 que recomendó el sistema de transmisión actual de 525 líneas, 60 campos. Este sistema es usado en América del Norte y Sur mientras que en Europa y Asia se utiliza el sistema PAL. Cabe mencionar que estos 2 sistemas no son compatibles.

PCM: "Modulación por Código de Pulsos" (Pulse Code Modulation) Un método para representar una señal de audio como una serie de muestras digitales. Este modo proporciona grabación digital de alta fidelidad sin ninguna señal de compresión.

Progressive scan: el escaneo progresivo es la habilidad para generar una imagen en una pasada (como lo hace el monitor del computador). El escaneo entrelazado convencional requiere dos pasadas para generar una imagen, la primera para las lineas impares. La televisión análoga convencional que conocemos, posee escaneo entrelazado (interlaced) con una imagen completa que se refresca 30 veces por segundo.

RCA: El conector más popular en el mercado, creado por RCA Victor.

Reverberación: (Reverberation) Es el lapso de tiempo en el que un sonido es audible por reflexiones dentro de un lugar cerrado. Es una serie de ecos espaciados pero suficientemente cercanos en tiempo que se mezclan con una señal de audio.

Surround Sound: sonido surround, generalmente se refiere a canales de audio multicanal y múltiples parlantes, que permiten recrear un sonido tridimensional para reproducir la banda sonora de cine y música. Ver más.

S-Video: (Y/C Video): es un tipo de señal de video utilizado en formatos de videocintas S-VHS y Hi-8. Transmite la luminancia y el color como componentes separados, evitando la combinación de ambos y la consecuente pérdidad de calidad al componer un video.

S-VHS: "Super VHS" Es una mejora del formato VHS que produce una mejor resolución de imagen al separar la chroma, luminancia y los pulsos de sincronía vertical y horizontal por separado. La resolución de imagen llega hasta 400 líneas cuando en un VHS normal es aproximadamente 240.

Television Standards: Actualmente existen tres estandares para señales de televisión análoga, tanto para broadcast y aplicaciones de videotape. Los tres formatos son: PAL, NTSC y SECAM, que tienen significantes diferencias. Todas comparten una característica en común: cada frame o imagen completa se compone de dos fields o barrido de lineas alternadas. PAL se mueve a 25 frames por segundo (fps) y 625 lineas de escaneo; utiliza amplitud modulada (AM) en un ancho de canal de 8Mhz. El NTSC se mueve a 29.97 fps. con 525 lineas de escaneo y utiliza amplitud modulada (AM) en un ancho de canal de 6Mhz. SECAM utiliza el mismo frame rate y número de lineas que PAL pero utiliza frecuencia modulada (FM) sujeta a una banda de 8Mhz. En algunos paises de SudAmérica, existen sistemas hibridos (PAL-N, PAL-M), que combinan características de NTCS y PAL. NTSC es el estandard en la mayor parte de América Central, mientras que PAL predomina en el oeste de Europa. Algunos ejemplos:

NTSC: Estados Unidos, Canada, México, Japon, Korea del Sur, Filipinas, Chile.
PAL: Inglaterra, Alemania, España, India, China, Australia.
SECAM: Francia, Hungría, Polonia, Rusia,Arabia Saudita, Egipto.

THX:"Tomlinson Holman Experiment" Conjunto de patentes, tecnologías y criterios desarrollados por Lucas Film para la reproducción de películas, basada en el control del ambiente acústico y visual y en el sistema Dolby Surround. No es un decodificador, no necesita software THX (de hecho no existe) es un reproceso a la información decodificada, el dolby digital, pro-logic (MPEG en su caso) y DTS se benefician de este reproceso que logra dar más realismo al home theater creando un sonido trasero difuso, sin localización (multicanal) incrementa el rango dinámico, crea diálogos claros, el movimiento de sonido es natural y la respuesta de frecuencias es plana, el circuito THX se compone de Cinema Re-EQ, Timbre Match y decorrelación dinámica. Ver Más aquí.

Variable Bit Rate: (VBR): Es una tecnica de compresión de datos que produce streams de datos variables entre un rango máximo y un mínimo a través del tiempo. En palabras sencillas, esta técnica permite ir variando la calidad mientras la tasa de transmisión se mantiene constante.

VCD: Ver en Video CD.

Virtual surround: Cualquier algoritmo que simula un sistema de sonido surround con sólo los dos parlantes frontales. Ver más aquí.

Widescreen: se refiere a aspect ratios mayores que 1,33:1. Por ejemplo, 1,78:1; 1,85:1 y 2,35:1. Una mayor explicación e imágenes en detalle encuéntralas en la sección Widescreen: un reencuentro con la realidad.

YUV: Método que define a una señal de video que separa los componentes de luminancia (Y) y crominancia (UV). La visión humana es mucho más sensitiva a las variaciones de intensidad que a las variaciones de color. El proceso de codificación YUV toma ventajas de este fenómeno y provee un ancho de banda mayor para la información de luminancia que para la de crominancia. Individualmente, las letras YUV significan Intensity, Hue, y value. (Intensidad, matíz y valor). Ver más en "Component Video".