Tipos de Arquivo
O SoX tenta determinar o tipo de arquivo dos arquivos de entradas automaticamente analisando o cabeçalho do arquivo de áudio. Quando ele conseguir detectar o tipo de arquivo ou se for um arquivo de saída então ele o usa a extensão de arquivo para determinar qual o tipo de manipulador de formato de arquivo ele deve usar.
Os arquivos de entrada e de saída podem ser lidos da entrada e da saída padrão. Isso é feito especificando ‘-‘ como o nome de arquivo.
Os formatos de arquivos que possuem cabeçalhos são verificados, se esse cabeçalho não parecer correto, o programa sai com uma mensagem apropriada.
Os formatos de arquivo seguintes são suportados:
.8svx
Formato de descrição de música instrumental 8SVX da Amiga.
.aiff
Arquivos AIFF usados nos Apple IIc/IIgs e SGI. Obs.: O formato AIFF suporta somente um chunk SSND. Ele não suporta múltiplos chunks de som, ou o formato de descrição de instrumento musical 8SVX. Arquivos AIFF são arquivos compactados multimídia e podem ter múltiplos áudio e chunks de figura. Você pode precisar de um arquivador separado para funcionar com ele.
.alsa
Driver de dispositivo ALSA /dev/snd/pcmCxDxp. Esse é um tipo de pseudo-arquivo e pode ser opcionalmente compilado dentro do SoX. Execute sox -h pra ver se você tem suporte para esse tipo de arquivo. Quando esse driver for usado ele permite você abrir o arquivo ALSA /dev/snd/pcmCxDxp e configure-o para usar o mesmo formato de dados que o passado ao SoX. Ele funciona tanto tocando quanto gravando amostras de som. Quando estiver tocando arquivos de som ele tenta ativar o driver ALSA para usar o mesmo formato que o arquivo de entrada. Sugere-se sobrescrever sempre os valores de saída para usar as amostras de mais alta qualidade que a sua placa de som pode tratar. Exemplo: sox infile -t alsa -w -s /dev/snd/pcmC0D0p.
.au
Arquivos AU SUN Microsystems. Existem aparentemente muitos tipos de arquivos ‘.au’; a DEC inventou o seu próprio com um número mágico e ordem de palavra diferentes. O tratador ‘.au’ pode ler esses arquivos mas não os escreverá. Alguns arquivos ‘.au’ possuem cabeçalhos AU validos e outros não. Os últimos são provavelmente amostras originais u-law 8000 Hz da SUN. Eles podem ser tratados usando o formato ‘.ul’ (veja abaixo).
.avr
Audio Visual Research. O formato AVR é produzido por inúmeros pacotes comerciais no Mac.
.cdr
CD-R. Os arquivos CD-R são usados em masterização de música nos Compact Disks. Os dados de áudio em um disco CD-R é um arquivo de áudio bruto com um formato estéreo com as amostras sinalizadas de 16-bits a um taxa de amostragem de 44 Khz. Existe um blocking/padding esquisito especial no final do arquivo de áudio e é o porquê ele precisa de seu próprio manipulador.
.cvs
Continuously Variable Slope Delta modulation. Usado para comprimir o áudio de fala para aplicações como voicemail.
.dat
Text Data files. Esses arquivos contem uma representação textual dos dados amostrados. Existe uma linha no começo que contem a taxa de amostragem. As linhas subseqüentes contem dois itens de dados numéricos: o tempo desde o começo da primeira amostra e o valor da amostra. Os valores são normalizados de sorte que o máximo e mínimo sejam 1.00 e -1.00. Esse formato de arquivo pode ser usado para criar arquivos de dados para programas externos como os analisadores FFT ou rotinas gráficas. O SoX pode também converter de volta um arquivo desse formato em um dos outros formatos de arquivos.
.gsm
GSM 06.10 Compressão da Fala com Minimização de Perdas nas Propriedades da Fala. Um padrão para compressão de fala que é usado no Global Standard for Mobil telecommunications (GSM). Ele é bom em sua finalidade, encolher o tamanho dos dados de áudio, mas ele introduzirá muito ruído quando uma dada amostra de som for codificada e decodificada múltiplas vezes. Esse formato é usado por algumas aplicações de voicemail. Ele é especialmente intensivo no uso de CPU. O GSM no SoX é opcional e requer acesso a uma biblioteca GSM externa. Para ver se existe suporte ao gsm execute sox -h e verifique o sob a lista de formatos de arquivos suportados.
.hcom
Arquivos HCOM da Macintosh. Esses são (aparentemente) arquivos FSSD da Mac com algumas variantes de compressão Huffman. A Macintosh possui formatos de arquivo estranhos e esse manipulador de formato aparentemente não trata todos aqueles que devem. Usuários Mac precisarão de seu arsenal usual de conversores de arquivos para tratar um arquivo HCOM sob UNIX ou DOS.
.maud
Um formato Amiga. Um tipo de arquivo de som em conformidade com a IFF, registrado pela MS MacroSystem Computer GmbH, publicado junto com a placa de som "Toccata" no Amiga. Permite o codec linear 8-bits, o codec linear 16-bits, A-Law, u-law em mono e em estéreo.
.mp3
Áudio comprimido em MP3. Arquivos de áudio MP3 vindo dos padrões MPEG para compressão de áudio e vídeo. Eles são uns formatos de compressão que remove informação não significativa dos dados para gerar arquivo compactado a uma taxa boa de compressão com a mínima perda das propriedades e qualidade do som. Também veja Ogg Vorbis para um formato similar. O suporte MP3 no SoX é opcional e requer acesso a uma das duas ou a ambas as bibliotecas externas libmad e libmp3lame. Pra ver se existe suporte para Mp3 execute o comando sox -h e repare-o sob a lista de formatos de arquivos suportados como "mp3".
.nul
Manipulador de arquivo Nulo. Esse é um falso manipulador de arquivo que age como se ele estivesse lendo uma stream de 0's a partir de um instante ou fazendo uma escrita falsa em um arquivo. Esse não é um manipulador de arquivo muito útil em muitos casos. Ele pode ser útil em alguns scripts onde você não deseja ler ou escrever a partir de um arquivo real, mas gastaria de especificar um nome de arquivo por consistência.
.ogg
Áudio Comprimido Ogg Vorbis. Ogg Vorbis é um CODEC aberto, livre de patente projetado para fazer compressão de música e streaming áudio. Ele é similar ao MP3, VQF, AAC, e outros formatos com compressão. O SoX pode decodificar todos os tipos de arquivos Ogg Vorbis, mas somente pode codificar a 128 kbps. O processo de decodificação é um tanto intensivo de CPU e codificação é muito intensivo de CPU. O codec Ogg Vorbis no SoX é opcional e requer acesso a bibliotecas Ogg Vorbis externas. Par ver se existe suporte para o Ogg Vorbis execute o comando sox -h e repare-o sob a lista de formatos de arquivos suportados aparece "vorbis".
ossdsp
Driver de dispositivo OSS /dev/dsp. Esse é um tipo de pseudo-arquivo e pode ser opcionalmente compilado dentro no SoX. Execute o comando sox -h pra ver se você tem suporte para esse tipo de arquivo. Quando esse driver for usado ele permite você abrir o arquivo OSS /dev/dsp e configurá-lo para usar o mesmo formato de dados que o passado ao SoX. Ele funciona tanto tocando quanto gravando amostras de som. Quando tocando arquivos de som ele tenta ativar o driver OSS para usar o mesmo formato que do arquivo de entrada. Sugere-se sempre sobrescrever os valores de saída para usar amostras de mais alta qualidade que sua placa de som pode tratar. Exemplo: sox infile -t ossdsp -w -s /dev/dsp.
.prc
Psion record.app. Usado em alguns dispositivos Psion para alarmes de Sistema. Esse formato é mais novo que o formato ‘.wve’ que é usado em alguns dispositivos Psion.
.sf
Arquivos de Som IRCAM. Arquivos de Som são usados pelo academic music software como o pacote CSound, e o editor de amostras de som MixView.
.sph
O SPHERE (SPeech HEader Resources) é um formato de arquivo definido pelo NIST (National Institute of Standards and Technology) e é usado com áudio de fala. O SoX pode ler esses arquivos quando eles contiverem dados u-law e PCM. Ele vai ignorar qualquer informação de cabeçalho que diz que os dados estão comprimidos usando compressão shorten e vai tratar os dados tanto como u-law ou PCM. Isso permitirá o SoX e o programa da linha de comando shorten ser executados conjuntamente usando pipes para descomprimir os dados e depois passar o resultado ao SoX para processamento.
.smp
Arquivos SampleVision Turtle Beach. Arquivos SMP são uso com o pacote SampleVision para PC-DOS da Turtle Beach Softworks. Esse pacote é para comunicação a vários amostradores MIDI. Todas as taxas de amostragem são suportadas pelo pacote, embora nem todas sejam suportadas pelos amostradores em si. Atualmente pontos de loop são ignorados.
.snd
Rodando sob o DOS, esse formato de arquivo é o mesmo que o formato ‘.sndt’. Rodando sob as demais plataformas ele é o mesmo que o formato ‘.au’.
.sndt
Arquivos SoundTool. Esse é um antigo formato de arquivo do DOS.
sunau
Driver de dispositivo /dev/audio da Sun. Esse é um tipo de pseudo-arquivo e pode ser compilado opcionalmente dentro do SoX. Execute o comando sox -h pra ver se você tem suporte para esse tipo de arquivo. Quando esse driver é usado ele permite você abrir um arquivo /dev/audio da Sun e configure-o para usar o mesmo tipo de dados que o passado ao SoX. Ele funciona tanto tocando quanto escrevendo amostras de som. Quando tocando arquivos de som ele tenta ativar o driver de áudio para usar o mesmo formato que o arquivo de entrada. É sugerido sempre sobrescrever os valores de saída para usar as amostras com qualidade mais alta que o seu hardware pode tratar. Exemplo: sox infile -t sunau -w -s /dev/audio ou sox infile -t sunau -U -c 1 /dev/audio para equipamentos sun antigos.
.txw
Amostrador TX-16W da Yamaha. Um formato de arquivo de um teclado de amostragem da Yamaha que escrevia no formato de disquetes 3.5 polegadas do PC IBM. Trata leitura de arquivos que não possuem o campo de taxa de amostragem definido para alguns dos valores esperados fazendo o exame de alguns outros bytes nos campos de tamanho attack/loop, e padroniza em 33 kHz se a taxa de amostragem ainda ficar desconhecido.
.vms
Mais informação está pra chegar. Usado para comprimir áudio de fala para aplicações como voicemail.
.voc
Arquivos VOC da Sound Blaster. Os arquivos VOC são multi-parte e contem partes de silêncio, looping, e diferentes taxas de amostragem para diferentes pedaços. Na entrada, as partes de silêncio são preenchidas, loops são rejeitados, e dados de amostras com uma nova taxa de amostragem é rejeitado. O Silêncio com uma taxa de amostragem diferente é gerada apropriadamente. Na saída, o silêncio não é detectado, e nem são impossíveis taxas de amostragem. Observe que, essa versão agora suporta tocar arquivos VOC com múltiplos blocos e suporta tocar arquivos contendo amostras u-law e A-law.
vorbis
Veja o formato ‘.ogg’.
.vox
Um arquivo sem cabeçalho com dados de áudio ADPCM da Dialogic/OKI normalmente vem com a extensão ‘.vox’. Esse dados ADPCM possuem precisão de 12 bits comprimido em somente 4 bits.
.wav
Arquivos RIFF ‘.WAV’ Microsoft. Esses formatos aparecem ser muito similares aos formatos dos arquivos IFF, mas não são iguais. Eles estão no formato nativo de arquivos de som do Windows. (Obviamente, o Windows se tornou incrivelmente de tal importância para a indústria computacional que ele naturalmente precisou ter seu próprio formato de arquivo de som). Normalmente, arquivos ‘.wav‘ possuem toda informação de formatação em seus cabeçalhos, e assim não precisam de quaisquer opções de formatos especificados para um arquivo de entrada. Se algum estiver, elas sobrescreverão o cabeçalho do arquivo, e você será avisado sobre esse efeito. Você deve saber o que você está fazendo! As opções de formato de saída farão uma conversão de formato, e o ‘.wav‘ escreverá apropriadamente. O SoX atualmente pode ler PCM, ULAW, ALAW, MS ADPCM, e IMA (ou DVI) ADPCM. Ele pode escrever tudo desses formatos incluindo a codificação ADPCM. Versões Big endian de arquivos RIFF, chamados RIFX, podem ser lidos e escritos também. Para escrever um arquivo RIFX, use a opção -x com as opções do arquivo de saída.
.wve
Psion 8-bits A-law. Estes são arquivos de som de 8 bits A-law 8khz usados no computador portátil tipo palmtop da Psion.
.raw
Arquivos Raw (sem cabeçalho). A taxa de amostragem, tamanho (byte, word, etc), e codificação (sinalizada, não sinalizada, etc.) do arquivo amostrado precisa ser fornecido. O número de canais é padronizado em 1.
.ub, .sb, .uw, .sw, .ul, .al, .lu, .la, .sl
Estes são vários sufixos que servem como um atalho para arquivos raw com um dado tamanho e codificação. Portanto, ub, sb, uw, sw, ul, al, lu, la e sl correspondem a "unsigned byte", "signed byte", "unsigned word", "signed word", "u-law" (byte), "A-law" (byte), ordem dos bits de "u-law" inversa, ordem dos bits de "A-law" inversa, e "signed long", respectivamente. A taxa de amostragem é padronizada em 8000 Hz se não for definido explicitamente, e o número de canais padronizado em 1. Existem bastante amostragens de ponto flutuante Sparc baseado no formato u-law sem cabeçalho e taxa de amostragem fixa de 8000 Hz. (Certos softwares de gerenciamento de som ignoram sem a menor preocupação os cabeçalhos). De modo similar, muitos arquivos de som Mac estão em formato byte não sinalizado com uma taxa de amostragem de 11025 ou 22050 Hz.
.auto
Esse é um ''meta-type'' e é o tipo de arquivo padrão se o usuário não especificar algum. Esse tipo de arquivo tenta imaginar o tipo verdadeiro buscando palavras mágicas no cabeçalho. Se o tipo não puder ser imaginado, o programa sai com uma mensagem de erro. A entrada precisa estar em um arquivo plano, e não um pipe. Esse tipo não pode ser usado para arquivos de saída.
... Voltar                  Prossegue ...
Nenhum comentário:
Postar um comentário