Pesquisar neste Blog

sexta-feira, 16 de abril de 2010

Sistemas de compressão - Ricardo Pizzotti



Para transmissão e o armazenamento de imagens, áudio e vídeo a compressão de dados é fundamental uma vez que eles necessitam de grande quantidade de dados para representar/armazenar e grande largura de banda para serem transmitidos.
O processo de compressão reduz a quantidade de dados armazenados eliminando bits iguais de sinais digitais, isto é, excluindo a porção repetida da imagem ou os bits menos significativos para a audição. A compressão possibilita o aumento do armazenamento e a diminuição da largura da banda de transmissão.
As técnicas de compressão de dados basicamente utilizam dois fatores: a redundância de dados a as propriedades da percepção humana.
- Redundância de dados: Geralmente amostras subseqüentes de sons e imagens de vídeo não são totalmente diferentes. Os valores visinhos em geral são relacionados. A remoção dessa redundância elimina a replicação de dados, não alterando seu significado.
-Propriedades da percepção humana: Como os sentidos humanos não são perfeitos, a versão comprimida não necessita ser exatamente igual à informação original, pois as diferenças não serão percebidas.
Existem várias técnicas de compressão que podem ser classificadas de diversas maneiras. Quanto ao resultado podemos dividi-las em compressão com perda e sem perda.
- Compressão com perda (lossy compression): técnicas utilizadas para compressão de áudio, imagens e vídeos em que algum dado é perdido durante a compressão da imagem. Essas técnicas são baseadas normalmente em estatísticas de dados e propriedades da percepção humana. Ex: fractal, JPEG, MPEG, etc.
- Compressão sem perda (lossless compression): método pelo qual a informação, após sua compressão, pode ser exatamente reconstruída. Nenhum dado é perdido durante o processo de compressão. Este método é denominado compressão com preservação da informação, pois preserva as informações que permitirão a reconstrução exata da imagem. Ex: codificação de Lempel-Ziv-Welch, algoritmo de Huffman e codificação aritmética.
A compressão de vídeo.
Para que o sinal de vídeo analógico possa ser manipulado por computador ele precisa ser primeiramente digitalizado. Como imagens precisam de muitos bytes para ser armazenadas, torna-se necessário comprimi-las.
A compressão digital reduz os dados de um quadro, eliminando dados duplicados e redundantes ou que o olho não consegue ver, ou salvando-os em forma reduzida. Quando a imagem é exibida, o processo de compressão é invertido.
A compressão se dá de duas formas:
A "compressão reversível" comprime pouco um arquivo - em geral para um terço do tamanho original. É utilizada quando a preservação de pequenos detalhes é necessária.
A "compressão Lossy" tem maior taxa de compressão, eliminando pixeis idênticos. Ela afeta mais a qualidade da imagem.
A compressão permite armazenar quantias grandes de imagens em disco rígido. Os tipos mais comuns de compressão são JPEG, Motion JPEG, MPEG, Fractals, DVI e Wavelets.
O processo de compressão é feito através de placas de digitalização ou por software.

A compressão de áudio.
Á semelhança do que acontece com o vídeo, também o áudio necessita de codificação para que só a informação relevante ao ouvido humano seja transmitida.
No método analógico, as vibrações do som são captadas mecanicamente e transformadas em sinais elétricos. No sistema digital, conversores analógicos para digital convertem as vibrações reais em números ou pacotes de dados que matematicamente representam estas vibrações. Estes conversores fazem amostragens do valor do sinal analógico ao longo do tempo sendo codificados em forma de números podendo então ser armazenados.Como um sinal analógico possui valores de amplitude que variam com o tempo, para codificá-lo é necessário medí-lo a intervalos regulares. A isto se dá o nome de amostragem.
Uma taxa de amostragem suficiente para capturar a faixa de voz humana é 8kHz e para capturar a faixa do ouvido humano é 40 kHz Na prática, as taxas de amostragem variam de 8 a 48 kHz.
Os valores amostrados representando a amplitude do sinal ao tempo da amostragem precisam ser quantizados em um número discreto de níveis. O número de níveis depende de quantos bits são usados para armazenar o valor amostrado. Para áudio digital, a precisão normalmente varia de 8 bits por amostra (256 níveis) a 16 bits por amostra (65536 níveis).
Para dados de áudio a forma mais básica de compressar/reduzir envolve a redução do número de bits e padrões de amostras de áudio.
Diferente de fotografia ou vídeo, os sinais de áudio são difíceis de compressar, existindo pouca relação entre amostras vizinhas ou quadros consecutivos. Os níveis de compressão práticos são, entretanto limitados para muito menos de 10:1 enquanto que a compressão de vídeo de 25:1 pode ser legivelmente produzida.
Para reconstruir o áudio, um conversor D/A (digital para analógico), busca na memória os códigos numéricos e recria o sinal original, ponto por ponto. Para que o sinal seja reconstruído corretamente, é preciso que o conversor D/A recoloque as amostragens ao longo do tempo com a mesma velocidade que foi usada pelo conversor A/D.
Principais formatos de áudio.
AIFF - O formato desenvolvido pela Apple e também usado pela Silicon Graphics.
Amiga IFF - Padrão de som da Amiga. Arquivos IFF são freqüentemente dados a extensão IFF. Contém apenas sons de 8 bits.
Creative - Formato da Sound Blaster. Tem a extensão VOC. WHAM pode negociar apenas com arquivos VOC não compressados.
RIFF Waveform Format - Formato de som Wave da Microsoft Windows. É usado para o sistema de som Windows.
Sun-Next - Padrão de arquivos de som para estações Sun e NeXT tradicionalmente tem a mesma extensão AU. Estes arquivos podem conter 8 ou 16 bits lineares ou amostras.

Nenhum comentário: