Áudio digital

Setembro 2017

O que é o som

O som é uma vibração do ar, isto é, uma sequência de pressões ascendentes e descendentes no ar em relação a uma média, que é a pressão atmosférica. Para testar isso, podemos colocar um objeto barulhento (despertador, por exemplo) debaixo duma cúpula vazia para perceber que o objeto inicialmente barulhento não emite nenhum som se não estiver rodeado de ar.


A maneira mais simples de reproduzir um som é fazer vibrar um objeto. Assim, um violino emite um som quando o arco faz vibrar as suas cordas, um piano emite uma nota quando se bate uma tecla já que o percutor bate numa corda e a faz vibrar.

De um modo geral, utilizam-se alto-falantes para reproduzir estes sons. Os alto-falantes são compostos de uma membrana conectada a um eletroímã; quando uma corrente elétrica passa rapidamente na frente e por trás do imã, ela causa vibrações no ar que o rodeia, a vibração é o som:


Desta forma, produzem-se as ondas sonoras que podem ser representadas num gráfico como as variações da pressão do ar (ou no nível da eletricidade do imã) em função do tempo. Obtém-se, então, a seguinte representação:


Este tipo de representação do som se chama modulação de amplitude (modulação da amplitude de um som em função do tempo). Por outro lado, um ultrassom representa as frequências sonoras em função do tempo. Podemos observar que um ultrassom mostra uma frequência fundamental, acima da qual se sobrepõem frequências mais elevadas, chamadas harmônicas:


Isto é o que permite distinguir várias fontes sonoras, ou seja, os sons graves terão frequências baixas, enquanto os sons agudos terão frequências elevadas.

Amostragem do som

Para reproduzir som em um computador, é preciso convertê-lo em um formato digital, já que este é o único tipo de informação com que os computadores podem trabalhar. Trata-se, assim, de anotar pequenas amostras de som (o que equivale a anotar as diferenças de pressão) em intervalos de tempos específicos. Isto se chama amostragem ou digitalização do som. O intervalo de tempo entre duas amostras é chamado de taxa de amostragem. Para reproduzir sons de áudio que pareça contínuo para os nossos ouvidos são necessárias amostras de cada 100 000i de segundo; por isso, é mais prático basear-se no número de amostras por segundo, expressas em Hertz (Hz). Veja alguns exemplos de taxas de amostragem mais comuns e qualidades de som associadas:


Taxa de amostragem Qualidade do som
44 100 Hzqualidade de CD
22 000 Hzqualidade de rádio
8 000 Hzqualidade de telefone

A taxa de amostragem de um CD de áudio, por exemplo, não é arbitrário, ela decorre do teorema de Shannon. A frequência de amostragem deve ser suficientemente alta, a fim de preservar a forma do sinal. O Teorema de Nyquist - Shannon estipula que a taxa de amostragem deve ser igual ou superior ao dobro da frequência máxima contida neste sinal. O nosso ouvido percebe os sons até cerca de 20 000 Hz, aproximadamente,. Assim sendo, para obter um nível de qualidade satisfatória, a taxa de amostragem deve estar, no mínimo, na ordem dos 40 000 Hz. Existem diversas taxas de amostragem padronizadas:

32 kHz: para rádios FM digitais (banda larga limitada a 15 kHz);
44.1 kHz: para áudio profissional e CDs;
48 kHz: para a gravação de faixas digitais gravadas separadamente e dispositivos de gravação de consumo (DAT, MiniDisc, etc.).

Representação informática do som

Cada amostra (que corresponde a um intervalo de tempo) está associada a um valor que determina o valor da pressão do ar nesse momento. Por conseguinte, o som não é representado como uma curva contínua com variações, mas como uma sequência de valores para cada intervalo de tempo:



Um computador trabalha com bits, por isso, é preciso determinar o número possível de valores que uma amostra possa ter. Isso equivale a definir o número de bits nos quais os valores da amostra se codificam. Com uma codificação de 8 bits, existem 28 (= 256) valores possíveis. Com uma codificação das 16 bits, tem-se 216 (= 65536) valores possíveis.

A segunda opção oferece claramente uma fidelidade de som maior, mas também requer mais memória do dispositivo.

Para terminar, a estereofonia requer dois canais com sons gravados individualmente para cada um deles. Um canal alimentará o alto-falante esquerdo, enquanto que o outro será transmitido pelo da direita.

No processamento informático, um som é representado por vários parâmetros, ou seja, a taxa de amostragem, o número de bits de uma amostra e o número de canais (um para mono, dois para estéreo e quatro para quadrofonia).

Memória necessária para armazenar um som

É fácil calcular o tamanho de uma sequência sonora não comprimida. Conhecendo o número de bits utilizados para codificar uma amostra, é possível saber o seu tamanho (já que o tamanho de uma amostra é o número de bits).


Para conhecer o tamanho de um canal, basta conhecer a taxa de amostragem, que vai nos ajudar a saber o número de amostras por segundo e, consequentemente, o espaço que ocupa um segundo de música. Assim, chegamos à seguinte operação:
Taxa de amostragem x Número de bits

Assim sendo, para saber o espaço memória que consome um extrato sonoro que dura vários segundos, basta multiplicar o valor precedente pelo número de segundos:
Taxa de amostragem x Número de bits x Número de segundos

Por último, para determinar o tamanho real do extrato, devemos multiplicar o valor anterior pelo número de canais (ele será, então, duas vezes mais importante em estéreo que em mono). Então, o tamanho em bits de um extrato sonoro é igual a:
Taxa de amostragem x Número de bits x Número de segundos x Número de canais</bold>

Veja também


Digital Audio
Digital Audio
Audio digital
Audio digital
Le son numérique
Le son numérique
Audio digitale
Audio digitale
Última modificação: 16 de junho de 2017 às 13:18 por ninha25.
Este documento, intitulado 'Áudio digital', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.