Como Funciona

in English

Como Funciona

    NAVEGAÇÃO DE ARQUIVO

     ANÁLISE

     MANIPULAÇÃO DE DADOS

     GRÁFICOS

     TOOLS


NAVEGAÇÃO DE ARQUIVO

Hierarquia

ANÁLISE - ARQUIVO - SEÇÃO - CANTO - PULSO

     O Sound Ruler lida com cinco níveis hierárquicos de tempo: análise, arquivo, seção, canto e pulso. Eles estão refletidos na forma com a qual o programa lida com o som, armazena e exibe os resultados e salva os dados.
     Análise: Cada vez que o Sound Ruler é aberto, é iniciada uma nova Análise. Todos os resultados de uma Análise são mantido na memória e podem ser navegados, mesmo após vários arquivos serem medidos. Uma Análise termina quando o Sound Ruler é fechado ou quando a função "File-Clear Data" é acionada. Ao selecionar "Clear Data", uma nova Análise é iniciada.
     Arquivo: Este é o arquivo de som .wav. Não é necessário editar as gravações para isolar os cantos ou produzir pequenos arquivos. O corte original de campo pode ser utilizado.
     Seção: Se o arquivo for longo, ele será quebrado em 'seções' de curta duração, para permitir uma melhor visualização e um processamento mais rápido. Uma seção é um segmento de som que o Sound Ruler lê do disco e mantém na memória RAM para filtrar, medir e fazer gráficos.
     Canto: A presença de 'cantos' é analisada em cada seção.
     Pulso: Cada canto contém um ou mais pulsos que são as unidades básicas do sinal medidas. 'Pulsos' são caracterizados por uma certa quantidade de modulação de amplitude no canto. Quando os dados são salvos em formato planilha, cada linha de dados representa um pulso.
     IMPORTANTE: Tenha em mente que 'Canto' e 'Pulso' são nomes sugestivos, mas para o Sound Ruler, eles são apenas dois nívels de medição e que não têm que corresponder às entidades acústicas produzidas pelos animais. Esses dois níveis podem ser utilizados para analisar cantos e pulsos, ou por exemplo grupos de cantos e cantos.

Volta ao topo | Página Inicial

Sem limite de tamanho de arquivo

     Editar e filtrar cantos requer tempo, espaço no disco rígido e organização, e cria oportunidades para erros humanos.
     Com o Sound Ruler, é possível digitalizar os cantos com, por exemplo, um corte por arquivo, e realizar todas as análises a partir daí. É possível analisar e re-analisar os arquivos originais usando diferentes resoluções, configurações de filtros FFT e parâmetros de medição. Os filtros são aplicados dinamicamente, à medida que os dados são lidos do disco, dispensando salvar as versões filtradas.
     Ao escolher um arquivo para ser aberto, o Sound Ruler pergunta quanto se deseja vizualizar de uma vez. O programa então lê mais informações na medida do necessário para exibir e analisar as partes desejadas do arquivo.
     OBSERVAÇÃO: Embora não haja limite do tamanho do comprimento de arquivo, a quantidade de memória RAM limitará o comprimento do som exibido na tela de cada vez. Se for necessário inspecionar minutos de som em um gráfico, baixe um programa de edição de som da internet.
     OBSERVAÇÃO: O sistema não foi testado com arquivos realmente longos, com horas de som. Contacte o autor se houver tal necessidade. Não deve haver problema, no entanto ajustes serão necessários para fazer com que seja prático navegar entre centenas de seções por arquivo.

Volta ao topo | Página Inicial

 

ANÁLISE

Mouse Log

     Ao ativar a função "Mouse Log" e clicar com o botão direito em qualquer arquivo, o Sound Ruler obtém as coordenadas da seta do mouse, determina os dados correspondentes ao ponto no gráfico e cola esse dados no TextPad. A resolução das medições será limitada por três fatores:
          1 - A resolução com a qual os gráficos foram gerados, que por sua vez é determinada pela suas configurações;
          2 - A resolução das coordenadas do mouse na tela. Ela é fixada em um pixel, mas ao mudar o tamanho da janena principal do Sound Ruler, o número de pixels ocupados por cada gráfico será alterado;
          3 - A resolução do mouse. É necessária uma quantidade mínima de movimento para que o mouse seja capaz de perceber e informar o computador. Isso depende da construção do mouse e de quão limpo ele está.

Volta ao topo | Página Inicial

Detecção de som

     O Sound Ruler detecta sinais baseado em amplitude. Ao invés de amostras individuals, ele baseia-se na soma dos quadrados (para evitar cancelar positivos com negativos) das amplitudes de um grupo de amostras (definido pelo parâmetro "Smooth"). Ele então avança um certo número de amostras (definido pela "Resolution") para obter a próxima soma.
     "Calls" são detectados dentro de uma seção em uma passagem, da esquerda para a direita.
     "Pulses" são detectados dentro de um canto em uma passagem dividida: do pico para o início e do pico para o fim.

      Finalmente, cada pulso é delineado em uma passagem dividida, do pico para os extremos.

Volta ao topo | Página Inicial

Reconhecimento do som

     O Sound Ruler reconhece e mede estruturas acústicas repetidas, com um nível de sub-componentes. As estruturas repetidas são chamadas "calls" e os sub-componentes são chamados "pulses". O usuário deve decidir como encaixar esses dois níveis aos sons a serem analisados. Por exemplo: uma seqüencia de sons simples, tonais, repetitivos pode ser analizada como uma sequência de "calls" com um "pulse" cada, ou como um "call" contendo vários "pulses".
     O processo de reconhecimento para cada nível será descrito nos próximos dois itens.

Volta ao topo | Página Inicial

"Calls"

     "Calls" são reconhecidos dentro de uma seção com base na sua amplitude ou também na duração e/ou intervalo.
     As configurações especificam os valores esperados e o intervalo aceitável em volta dos valores esperados.
     Os limites dos cantos não precisam ser reconhecidos com precisão em cada seção pois cada canto é re-analisado em maior detalhe no próximo passo. Pode-se utilizar qualquer um dos métodos disponíveis para o reconhecimento dos cantos dentro de uma seção (mesmo manual) sem influenciar os resultados.

Volta ao topo | Página Inicial

"Pulses"

     "Pulses" são reconhecidos dentro de um canto com base em sua amplitude ou também duração, intervalo e/ou frequência dominante. As configurações especificam os valores esperados e o intervalo aceitável ao redor dos mesmos. O ajuste inteligente dos valores esperados pode ser especificado para levar em conta a mudança gradual no envelope do canto. Existem cinco opções de ajuste inteligente, em ordem progressiva de complexidade:

Volta ao topo | Página Inicial

Delineação de pulso

     Após a sua detecção, o pulso é delineado. A partir do pico, a amplitude é medida em ambas as direções e a posição é obtida a 90%, 50% e 10%. O algorítimo continua até encontrar uma amplitude de 1% do pico ou um aumento em amplitude, o que ocorrer primeiro. No total, nove pontos são medidos, como ilustrado acima pelos pontos vermelhos no gráfico da esquerda.

Volta ao topo | Página Inicial

Medição das características espectrais

     As medidas de frequência são obtidas a partir dos dados do espectrograma correspondente. Tenha em mente que a resolução da frequência das medidas é determinada pelas configurações usadas para calcular o espectrograma e a taxa de amostragem do som. A frequência com maior energia é determinada para cada um dos nove pontos de amplitude medidos no canto. Além disso, a amplitude no momento de pico é medida em cada harmônico especificado pelo usuário. Essas medidas estão ilustradas acima pelos pontos azuis no gráfico central.
     As medidas de "tuning" são obtidas a partir do espectrograma, mas são ilustradas no Espectro de Potência, para facilitar a visualização. A largura do pico é medido na metade e em um décimo de amplitude (linhas verdes) e divididos pela frequência.
     O espectro de potência é calculado apenas para inspeção e suas configurações não afetam as medições, exceto para a análise de cross-correlation (ACC) de espectro de potência.

Volta ao topo | Página Inicial

MANIPULAÇÃO DE DADOS

Armazenamento

     Todas as medições, configurações e resumos para cada pulso medido são armazenados na memória RAM até que um evento de auto-salvar ocorra (se o auto-salvar estiver acionado) or se o usuário clicar no menu "File" - "Save Data".
     As séries de listas de opções próximas à lista de resultados, permitem ao usuário navegar pelos resultados de pulsos anteriores, cantos, seções ou arquivos dentro da mesma análise. Toda essa informação é apagada quando o usuário seleciona o menu "File" - "Clear Data".
     O Sound Ruler utiliza uma estrutura hierárquica para manter cada número na memória apenas uma vez, mas se mais dados forem produzidos dentro da mesma Análise além do que a memória pode manter, o computador se tornará lento. Se isto ocorrer, salve os dados, vá ao menu "File" - "Clear Data" e inicie uma nova análise.

Volta ao topo | Página Inicial

Salvamento

     Sound Ruler lida com dados de uma forma similar a um editor de texto. A medida que as análises são realizadas, pode-se navegar pelos resultados, re-analisar cantos substituindo os resultados antigos pelos novos e salvá-los num arquivo com a função "Save Data".
     Como num editor de texto, evite trabalhar por muito tempo sem salvar os resultados.
     Quando os dados são salvos, o Sound Ruler circulará pelos 5 nívels hierárquicos e os 3 tipos de dados (brutos, resumos e configurações) para produzir toda a informação redundante na(s) tabela(s) de resultados.
     Os dados são salvos em um ou dois arquivos, como configurado em "Options - Saving Data". Os resultados em dois arquivos foram planejados para a incorporação num banco de dados relacional, visando eficiência em análises extensivas. Os dados são salvos como arquivos-texto delimitados por vírgula (.CSV), por ser um padrão geral que pode ser lido pela maioria dos programas de bancos de dados e planilhas.

Volta ao topo | Página Inicial

 

GRÁFICOS

Exportando figuras

     O Sound Ruler oferece várias opções de formatos de arquivos para salvar e copiar figuras. Estes formam duas categorias: bitmaps e metafiles. Cada uma dessas categorias tem suas vantagens e desvantagens e o usuário deve estar atento a elas para obter os melhores resultados ao exportar figuras.
     A diferença entre bitmaps e metafiles é a forma na qual a informação visual é descrita. Em poucas palavras, um bitmap é codificado como uma tablela, onde cada célula representa um pixel e armazena a informação de cor e brilho deste pixel. Quando um gráfico é salvo como bitmap, a informação de cada pixel é salva sequencialmente. Metafiles, por outro lado, armazenam a informação visual como um grupo de objetos gráficos, descrevendo cada objeto através de coordenadas relativas de seus limites. Um gráfico metafile é armazenado como um grupo de linhas, onde cada linha é descrita por sua cor e coordenadas dos pontos de limite.
     Teoricamente, metafiles deveriam ser melhores para descrever gráficos, uma vez que são baseados em coordenadas relativas e portanto podem ser re-dimensionados sem perda de fidelidade ao original. Infelizmente, a maneira com a qual os metafiles são implementados nos vários programas não é padronizada, causando freqüentemente problemas de distorção no tamanho do texto das figuras a serem transportadas entre aplicativos.
     Uma recomendação simplista é utilizar bitmaps quando se deseja que as figuras se pareçam exatamente como no Sound Ruler e metafiles quando se pode antecipar a necessidade de re-dimensionamento das mesmas.

Volta ao topo | Página Inicial

Editando figuras

     O Sound Ruler é projetado para analisar e produzir gráficos de sons em série.
     Ao utilizar o menu "Export Graphs" na janela principal, uma nova figura é criada com os gráficos escolhidos pelo usuário. Esta figura é altamente personalizável e sua característica chave é a função "Refresh" que permite a atualização dos dados nos eixos. Além disso, esta figura pode ser salva em vários formatos, incluindo o .fig do Matlab. Quando salva no formato .fig, a figura pode ser carregada posteriormente para edições adicionais e para atualizar seus dados.
     Uma pequena biblioteca de figuras-modelo pode ser criada e recarregada para produzir figuras padronizadas em série com rapidez.

Volta ao topo | Página Inicial

 

FERRAMENTAS

Calibração de amplitude

     Simplismente ir ao campo e apontar um medidor de nível de pressão de som para um animal vocalizando normalmente não produzirá medidas úteis para calibrar gravações. A razão é que os sons de animais são comumente curtos e com amplitude variável. Os medidores do nível de pressão de som obtém as medidas através da integração do som recebido durante uma janela de tempo que normalmente é de 0.5 ou 0.2 segundos.
     É possível calibrar a amplitude dos sons a serem analisados comparando-os com um sinal de amplitude conhecida. O Sound Ruler pode medir um pedaço de um som de referência e calcular um fator de calibração para as medidas dos seus sons.
      Existem várias maneiras de se produzir um som de referência e o mais apropriado depende de vários fatores incluindo: o ambiente acústico aonde as gravações são feitas, a precisão desejada, o equipamento disponível e o orçamento.
     Alguns gravadores (alguns Nagras de rolo) possuem medidores embutidos de amplitudes calibradas .
    Os fabricantes de medidores de nível de pressão de som de precisão geralmente oferecem também fontes de som constantes que produzem som com amplitudes altamente repetíveis. Pode-se acoplar tal fonte de som ao microfone (e ao gravador) que será usado no campo e gravar um sinal de amplitude conhecida. Observe que microfones de um mesmo modelo, gravadores e fitas variam em sensibilidade e amplificação. Desta forma, a mesma combinação de microfone, gravador e fita que foi calibrada no laboratório deve ser usada no campo. Além disso, todas as configurações de ganho devem ser exatamente as mesmas utilizadas no laboratório. Para tornar o sistema um pouco mais versátil no campo, pode-se calibrá-lo com vários ajustes de ganho no laboratório, mas neste caso, valeria a pena realizar alguns testes para descobrir quão bem o usuário é capaz de repetir o ajuste de ganho ao posicionar o botão. Outro problema deste método é que o equipamento pode se tornar menos sensível à medida que as pilhas se desgastam. Isto pode ser verificado através da repetição do procedimento de calibração no laboratório ao retornar do campo, para que cada fita possua o tom de calibração anterior à saída para o campo, as gravações de campo e o tom de calibração posterior à saída para o campo
. Se o equipamento funcionou como esperado, os tons pré e pós terão a mesma amplitude.
     Quando a aplicação não requerer medidas de alta precisão, um sistema de calibração pode ser montado com materiais de baixo custo. Lojas de produtos eletrônicos em geral como a Radio Shack têm à venda medidores de nível de pressão de som por cerca de US$ 50. É possíivel encontrar também sirenes piezoelétricas amplificadas (US$2) que necessitam apenas ser conectadas a uma pilha e um interruptor para criar uma mini fonte de som. A idéia é ativar a sirene, medir a amplitude com o medidor de pressão de som, substituir o medidor pelo microfone e gravar o tom calibrado. Idealmente, isso deveria ser feito dentro de uma câmara anecóica para eliminar todos os sons exceto o que esta sendo irradiado diretamente pela sirene. Resultados razoáveis podem ser obtidos num ambiente externo silencioso, sem vento ou superfícies duras próximas. Este procedimento apresenta muitas fontes de erro, incluindo: a inconstância da sirene, a precisão do medidor, outros sons e eco, e erros na distância e alinhamento durante a substituição do medidor pelo microfone. Deve-se repetir este procedimento várias vezes para se obter medidas de erro nas medições da nível de pressão de som e nas amplitudes dos tons gravados, que juntos indicarão a precisão geral dos ajustes de calibração.

Volta ao topo | Página Inicial

Filtragem

     Os filtros "highpass, lowpass e bandpass" especificados no menu "Set - General" ou clicando no gráfico do Espectrograma são filtros digitais de Butterworth de resposta de impulso infinito (IIR). Este tipo de filtro é caracterizado por ser chato na faixa de frequencias a que é permissivo e de maneira geral, monotônico, mas que não possui uma mudança muito abrupta na frequência crítica. Deve-se, portanto, evitar ajustar as frequências críticas próximas às frequências de interesse na análise.
     A magnitude da resposta do filtro nas frequências de corte é sqrt (1/2) = 0.707. Pode-se ajustar a resposta da frequência do filtro alterando a frequência crítica e a ordem do filtro. Problemas numéricos podem surgir caso ordens iguais ou superiores a 15 sejam especificadas.
      Versões futuras do Sound Ruler deverão incluir um gráfico de resposta da frequência do filtro para facilitar o ajuste das frequências de corte e da ordem do filtro.
    

Volta ao topo | Página Inicial

Filtro de curva de sensibilidade

     A ferramenta de curva de sensibilitade utiliza uma equação modificada de Yule-Walker para desenhar um filtro digital IIR recursivo utilisando um ajuste de quadrado mínimo da resposta de frequência especificada pelo usuário no arquivo de filtro.
     Quando um filtro é criado, o Sound Ruler produz um gráfico combinando a resposta da frequência especificada no filtro com a resposta da frequência produzida pelo filtro. Este gráfico pode ser usado como um guia para ajustar a ordem do filtro e a resposta de frequência desejada, a fim de obter a melhor configuração de filtro. Aumentar a ordem do filtro pode produzir combinações melhores, mas problemas numéricos podem surgir com filtros de ordem muito alta. Mudanças bruscas na resposta de frequência podem produzir combinações ruins.

Volta ao topo | Página Inicial

Análise de Cross-Correlation

     A análise de cross-correlation gera um índice de máxima sobreposição entre cada gráfico especificado pelo usuário. Isto é feito através do deslizamento do segundo gráfico sobre o primeiro e gerando um índice de sobreposição a cada passo do deslizamento. O resultado é o maior índice absoluto e o posicionamento relativo no qual ele ocorreu.
     Para os oscilogramas, os gráficos são vetores de amplitude por tempo. Eles são deslizados ao longo do eixo de tempo, a intervalos definidos no campo "Resolution" da ACC.
     Os Espectros de Potência são vetores de amplitude por frequência. Eles são deslizados ao longo dos eixos de frequência a intervalos iguais à resolução de frequência do gráfico. A unidade de FFT usada é independente do comprimento do sinal e é igual a unidade de FFT especificada para o gráfico de Espectro de Potência ("Menu - Options - Power Spectrum"`). A FFT é centralizada no ponto de máxima amplitude do sinal. Se o sinal for mais longo do que a FFT, ele será cortado; se for mais curto, zeros serão adicionados no início ou no fim.
     Os espectrogramas são matrizes de amplitude por frequência por tempo. Os gráficos são deslizados ao longo dos eixos de tempo a intervalos iguais aos ( FFT size - FFT overlap ) especificados no Espectrograma. Em ACCs em 2D, os gráficos também são deslizados ao longo dos eixos de frequência a intervalos iguais a ( taxa de amostragem/ FFT size ) especificados para o Espectrograma. Cada sinal selecionado para a análise recebe ( FFT size / 2 ) zeros no início e ( FFT size / 2 ) zeros no fim, para permitir que o início e o fim do sinal sejam centralizados nas FFTs. Pode-se especificar um tempo de sinal extra para ser incluido com os cantos selecionados para a ACC, para fazer com que as FFTs dos limites do som contenham ruídos de fundo da gravação e não zeros.
     O índice de correlação é a soma dos produtos, para cada passo no deslizamento, dos valores dos dois sinais. Se a opção "Normalize amplitude" estiver selecionada, então o cálculo do índice é o mesmo, mas para cada passo no deslizamento, o produto dos valores é dividido pela raiz quadrada do produto das somas dos valores em cada sinal.
    

Volta ao topo | Página Inicial

Sound Math

     Esta é uma ferramenta didática e conceitual para auxiliar a visualização de cenários acústicos. A abordagem numérica busca facilitar a compreensão das relações quantitativas entre variáveis. Não se deve esperar que os resultados obtidos concordem precisamente com situações reais, uma vez que as relações entre as variáveis são tratadas em sua forma mais simplista, assumindo propagação em um campo livre, nível de pressão de som = a intensidade do som, absorção de som pelo meio despresível, etc.
     O Sound Math está ainda em sua infância e existem muitos planos de expansão, tais como auxílios visuais para identificar variáveis relacionadas, demostração da relação matemática e/ou gráficos de pares de variáveis, novos cenários e aumento gradual de complexidade. No entanto, a opinião dos usuários será muito importante na definição do direcionamento com o qual o Sound Math deve crescer.
     O cenário atual apresenta uma fonte sonora em um campo silencioso livre ou hemisferico, produzindo um tom sem modulação de frequência. O som se propaga através de um meio estático homogêneo sem absorção e atinge um receptorr estático que codifica o som como informação digital.
     Exercícios para estudantes podem incluir não apenas questões no âmbito do cenário, mas extensões a ele, como efeito Doppler, cálculos de pressão de som na superfície da membrana timpânica, problemas com fontes múltiplas, "aliasing", etc.
   

     O nível de potência na fonte é:
          sourcePowerLevel = 10 * log10 (sourcePower/ 0.000000000001)
          Observação: 1 picowatt é a referência para o nível de potência na fonte.
     O som irradia da fonte numa superfície em expansão que é :
          surface = 4 * pi * r ^ 2 num campo livre (uma ave em vôo)
          surface = 2 * pi * r ^ 2 num campo hemisférico (como num chão plano ou na superfície da água).
     A intensidade do som diminui com a distância à medida de:
          remoteIntensity = sourcePower / surface
     O nível de pressão remoto é aproximadamente:
          remotedBSPL ~= 10 * log10 ( remoteIntensity / 0.000000000001)
          Observação: 1 picowatt é a referência para o nível de intensidade do som.
     O período da fonte de som é:
     
    sourcePer = 1 / sourceFreq
     E o número de ciclos de som produzido é dado por:
     
    sourceCycles = sourceFreq * sourceDuration
     O comprimento de onda do som no meio é definido como:
    
     mediumWavelength = mediumSoundSpeed / sourceFreq
     O atraso com o qual o som é percebido pelo receptor é:
    
     remoteDelay = remoteDistance / mediumSoundSpeed
     A pressão remota (em pascais) é:
    
     remotePressurePa = 10 ^ ( remotedBSPL / 20 + log10 ( 0.00002 ) )
    
     Observação: 0.00002 Pa é a referência para o nível de pressão do som (SPL).
     E em atmosferas, a pressão é:
    
     remotePressureAtm = remotePressurePa / 101325
     Quando o som é digitalizado, a frequência de Nyquist é:
    
     remoteNyquistFreq = remoteSRate / 2
     A resolução de freqüência é dada por:
    
     remoteFreqResol = remoteSRate / remoteFFTsize
     E a resolução de tempo é:
    
     remoteTimeResol = 1 / ( remoteSRate / remoteFFTsize )
     O número de valores possíveis de amplitude com o qual o som é armazenado é:
    
     remoteCategories = 2 ^ remoteBits
     E se o sinal variar de -1 volt a +1 volt, a resolução de amplitude é:
    
     remoteAmplResol = 2 / remoteCategories
    

Volta ao topo | Página Inicial