Opções de Formato :: Admirável Mundo Novo




Muito Bem Vindo

Prezado Leitor, a proposta desse Blog é compartilhar conhecimento com as pessoas que trabalham com Linux, Asterisk, OpenSER, e com tecnologia de voz sobre a rede IP em geral, através de tutoriais, dicas, howto, notícias entre outros assuntos.

Atente para termo de uso do conteúdo do blog no rodapé da página.

quarta-feira, 31 de dezembro de 2008

Opções de Formato





Opções de Formato:

Opções de formato afeta os arquivos de entrada ou de saída aos quais elas precedem imediatamente.

Os arquivos de entrada que se descrevem podem fornecer todas as informações de formato diretamente do cabeçalho e assim geralmente não precisa de opções de formato. Arquivos de entrada sem cabeçalho faltando dessa informação e, portanto das opções de formato precisam ser usados para informar ao SoX do tipo de dados do arquivo, taxa de amostragem, e número de canais.

Por padrão, o SoX tenta escreve os dados de áudio usando o mesmo tipo de dados, taxa de amostragem, e quantidade de canais que os dados do arquivo de entrada. Se o usuário desejar que o arquivo de saída seja de um formato diferente então as opções de formato podem ser usadas para especificar as diferenças.

Se um formato do arquivo de saída não suportar os mesmos tipos de dados, taxa de amostragem, o número de canais que do formato do arquivo de entrada, então o SoX vai auto selecionar valores mais próximos que ele dá suporte de sorte que os usuários não tenham que especificar aquelas alterações de opções de formatos manualmente.


-t filetype

Fornece o tipo do arquivo de som a ser amostrado. Útil quando a extensão do arquivo não for padrão ou não consegue ser determinado pela verificação do cabeçalho do arquivo.


-r rate

Fornece a taxa de amostragem em Hertz do arquivo. Para produzir o arquivo de saída é preciso se ter uma taxa de amostragem diferente daquela taxa do arquivo de entrada, inclua essa opção como parte das opções do formato de saída. Se os arquivos de entrada e de saída tiverem taxas diferentes então à taxa de amostragem vai alterar o efeito que precisa ser executado. Já que o SoX possui múltiplas efeitos de mudança de taxas, o usuário pode especificar qual efeito usar. Se nenhum efeito for especificado pela alteração da taxa de amostragem então um padrão será escolhido.


-v volume

Altera a amplitude (ponto flutuante); diminui menos de 1.0, aumenta mais de 1.0. Pode usar um número negativo para inverter a fase dos dados de áudio. É interessante observar que nós percebemos o volume de forma logarítmica, mas essa opção ajusta a amplitude linearmente. Como outras opções de formato, a opção de volume afeta o arquivo com o qual está especificado. Isso é útil quando processando arquivos de entrada onde o ajuste do volume de entrada possa ser especificado para cada arquivo de entrada ou simplesmente ajustando um único arquivo de saída. Isso pode ser comparado a um misturador de áudio onde você pode controlar o volume de cada entrada bem como um volume master (lado de saída).

O programa soxmix padroniza o valor da opção -v para cada arquivo de entrada para um valor 1/quantidade_de_arquivos_de_entrada. Isso significa que se você estiver misturando juntos dois arquivos então o volume de cada arquivo de entrada é ajustado para 0.5. Isso é feito para evitar clipagem dos dados do áudio durante a operação de mistura. Usuários muito provavelmente não ficariam felizes com um grande ajuste de volume e pode especificar a opção -v para sobrescrever esse valor padrão.

Obs.: Para o caso de não mistura, veja o efeito stat para informação sobre a busca do ajuste do volume máximo que pode ser conseguido com essa opção sem causar aos dados de áudio ser clipado.


-s/-u/-U/-A/-a/-i/-g/-f

A codificação das amostras de dados é linear com sinal (complemento de 2), linear sem sinal, u-law (logarítmico), A-law (logarítmico), ADPCM, IMA_ADPCM, GSM, ou ponto flutuante. O formato U-law (realmente a contração para mu-law) e A-law é padrão dos U.S. e internacional para compressão de som telefônico logarítmico. Quando não comprimido u-law possui aproximadamente a precisão de áudio PCM de 14-bits e A-law possui aproximadamente a precisão de áudio PCM de 13-bits.

Os dados no formato A-law e u-law são às vezes codificado usando uma ordem de bit reverso (ou seja, MSB torna-se LSB). Internamente, o SoX entende como trabalhar com essa codificação, mas atualmente não existe nenhuma opção de linha de comando para especificá-lo. Se você precisar desse suporte então você pode usar os tipos de pseudo arquivos de ‘.la’ e ‘.lu’ para informar ao SOX da codificação. Veja os tipos de arquivos suportados para mais informação.

O formato ADPCM é uma forma de compressão de som que possui um bom compromisso entre a boa qualidade de som e tempo rápido de codificação/decodificação. É usado para compressão de áudio para telefonia e lugares onde fidelidade total do áudio não seja algo tão importante. Quanto ao formato não comprimido possui aproximadamente a precisão de áudio PCM de 16 bits. Versões populares do ADPCM incluem o G.726, ADPCM MS e o ADPCM IMA. O flag -a possui diferentes significados para diferentes manipuladores de arquivos. Em arquivos ‘.wav’, ele representa arquivos MS ADPCM, em todos os outros ele significa G.726 ADPCM. O formato ADPCM IMA é uma forma específica da compressão ADPCM, ligeiramente mais simples e com fidelidade ligeiramente inferior ao do formato da Microsoft flavor do ADPCM. O codec ADPCM IMA é também chamado de ADPCM DVI.

O Codec GSM é um padrão usado para compressão de áudio para telefonia em países europeus e está ganhando popularidade por causa da sua qualidade. Ele normalmente consome bastante CPU para funcionar com dados de áudio GSM.

-b/-w/-l/-d

O tamanho da amostra de dados está em bytes, em palavras de 16 bits, em palavras longas de 32 bits ou palavras duplamente longas de 64 bits (o tipo long long).

-x

Os dados amostrados estão no formato XINU; os dados vêm de uma máquina com a ordem de palavra oposta ao que os seus dados estão e precisa ser invertido de acordo com o tamanho da palavra dado acima. Somente dados inteiros de 16 e de 32 bits podem ser invertidos. Dados de ponto flutuante em formato de máquina que não são portáveis.


-c channels

O número de canais de som no arquivo de dados. Isso pode ser 1, 2, ou 4; para mono, estéreo, ou quad para dados de som. Para fazer o arquivo de saída ter número de canais diferentes daquele número do arquivo de entrada, inclua essa opção com as opções do arquivo de saída. Se os arquivos de entrada e de saída tiverem um número de canais diferente então o efeito avg precisa ser usado. Se o efeito não for especificado na linha de comando ele será invocado internamente com parâmetros padrões.


-e

Quando especificado após o último nome de arquivo de entrada (de sorte que ele aplica ao arquivo de saída) ele permite a você evitar dar um nome ao arquivo de saída e não vai produzir um arquivo de saída. Ele aplicará quaisquer efeitos ao arquivo de entrada. Isso é principalmente útil com o efeito stat, mas que pode ser usado.








... Voltar                  Prossegue ...















Nenhum comentário:




Creative Commons License
Admirável Mundo Novo: Tudo Sobre Asterisk, OpenSER, Linux e Tecnologias de Voz sobre IP
by Cléviton Mendes de Araújo is licensed under a Creative Commons Atribuição 2.5 Brasil License.