Saltar al contenido
Núria Gavaldà – English Pronunciation Coach

Espectrograma

espectrograma - Nuria Gavalda

Soy Núria Gavaldà y en este artículo os voy a explicar qué es un espectrograma

Si quieres aprender como hablar el inglés correctamente, te interesará este artículo. Con su ayuda, entenderás las herramientas necesarias de la Fonética en el proceso de aprendizaje de la lengua inglesa no nativa.

Qué es un espectrograma

Tanto para los animales como para nosotros los humanos, el sonido es una manera de establecer una comunicación efectiva. El espectrograma será unos de los instrumentos para estudiar este fenómeno.

En líneas generales, es el resultado de computarizar el espectro de tramas sobre una superficie o espacio determinado de una señal o frecuencia sonora. En otras palabras, estamos hablando de un gráfico donde podemos visualizar las ondas sonoras emitidas a lo largo de un tiempo específico.

Dependiendo del contenido frecuencial, este gráfico puede contener tramas (picos) altas, intermedias o bajas.

Entonces, ¿para qué sirve un espectograma? y ¿qué es un espectrograma? Pues técnicamente es una herramienta que se utiliza para representar y analizar cualquier tipo de señal audiovisual.

Esto significa que, de acuerdo a la distribución del sonido, podemos obtener una representación en tres dimensiones; temporal, frecuencial y de amplitud.

El gráfico obtenido del espectro sonoro nos ayuda por consiguiente a comprender mucho mejor su contenido y a partir de esto podemos tomar decisiones.

Para qué sirve un espectrograma

Pues como ya bien sabes, es una herramienta de análisis que sirve para registrar un amplio número de sonidos. Es decir, funciona como una especie de recolector de muestras, el cual funciona por medio de una ventana temporal.

Esta ventana o algoritmo posee un tamaño proporcional al tipo de estudio que deseamos implementar, ya que podría tratarse de una señal armónica o de una resonante.

Una vez que se haya definido el tipo de señal se pueden realizar los cálculos sobre el contenido frecuencial. ¿Y esto que quiere decir? esto quiere decir que de acuerdo a las muestras obtenidas en la ventana temporal podremos visualizar una gráfica en dos o tres dimensiones.

Pero esto no termina aquí, después de que se hayan recolectado todas muestras de sonido se vuelve a repetir el proceso.

El objetivo es desplazar la ventana temporal a lo largo del tiempo y así atrapar el mayor número de muestras posibles para extender el espectro de la señal.

Una vez que se coge una muestra diferente, se vuelve a calcular el contenido frecuencial y vuelve a representar sobre la misma gráfica, de esta manera se construye un espectro mucho más completo.

A esta tarea se le conoce también como una sucesión de Transformadas de Fourier, la sumatoria de las representaciones de las ventanas consecutivas obtenidas.

Este método no solo aporta más información sobre el contenido frecuencial de la señal, también registra el comportamiento de la energía y de la frecuencia durante el tiempo.

La gráfica en tres dimensiones puede ser representada de diferentes formas, pero la manera más común de hacerlo es sobre el eje de las abscisas. De esta manera, que las frecuencias se ubiquen en el eje de las ordenadas y el comportamiento de la energía calculado en número de decibeles se encuentre a lo largo del plano tridimensional.

Es importante mencionar que toda esta síntesis gráfica debe estar diseñada con una gama de colores que permitan una fácil compresión de cómo varía la energía a través del tiempo.

Cómo crear un espectrograma

Antes de crearlo, lo más importantees conocer el comportamiento de las tramas a lo largo del tiempo.

Y es que, dependiendo de la naturaleza de la señal de audio, se debe seleccionar el tamaño de la ventana, la cual contiene un número limitado de muestras.

El criterio de selección de una ventana temporal se basa en el tamaño de la trama, la capacidad de procesamiento y el análisis de la señal.

En este sentido, existen dos bloques principales; ventanas de banda ancha o Wideband y las de banda estrecha o Narrowband.

El ancho de la ventana, por lo tanto, es considerado como el dominio frecuencial, es decir, la resolución del espectro de la onda principal de la transformada de Fourier.

En otras palabras, el ancho de la ventana permite una mejor distribución de la energía y por consiguiente una mayor apreciación de las tramas.

De acuerdo al tipo de ventana que se seleccione, es posible obtener una mejor resolución en los lóbulos primarios y secundarios de todo el espectro de Fourier.

Debido a esto, se pueden encontrar diferentes variaciones de ventanas de acuerdo al tipo de señal o frecuencia; Bartlett, Blackman, Gaussiana, Hanning, Kaiser, Rectacgunlar, entre otras.

Ventanas de banda ancha de mayor dimensión sobre el dominio temporal suponen una reducción en los saltos de las ondas a través del tiempo.

Por el contrario, un ancho de banda de menor dimensión sobre el dominio temporal se traduce en un dominio de ondas más grande.

¿Qué es la Transformada de Fourier?

La STFT o Transformada de Fourier de Tiempo Reducido es un conjunto de muestras atrapadas en una ventana temporal.

Estamos hablando de un método de procesamiento de señales que cambian en el tiempo y, por lo tanto, registran un comportamiento heterogéneo.

La transformada del tiempo lo que hace es extraer diferentes tramas de una señal o frecuencia durante los desplazamientos de la ventana.

Durante este proceso se genera una fractura o discontinuidad del tiempo, por lo tanto, el desplazamiento se le puede ocultar mediante el solapamiento de tramas, una técnica mejor conocida como overlap.

Representación gráfica del STFT

Como bien ya sabes, cada una de las tramas que se obtienen a través de la Transformada de Fourier son guardadas en una matriz o cuadro.

Dentro de este cuadro, podemos observar las variaciones del espectro y el comportamiento de la señal para cada sucesión de tramas durante el tiempo.

Esto quiere decir que a medida que se van obteniendo nuevas tramas, se va registrando en la primera posición de la matriz una nueva señal.

Por consecuencia, se genera un movimiento de posiciones, es decir, la nueva trama empuja a la primera y esta a su vez a la tercera, la cual se pone en cuarta posición y así sucesivamente.

De esta manera, se obtiene un registro gráfico de la variación del espectro de la señal y la energía a través de un cuadro.

Pero ¿cómo podemos leer este cuadro? Muy fácil, el eje T o línea horizontal representan el tiempo, aquí se encuentran las sucesiones de tramas, y en n el eje F o línea vertical observamos la frecuencia expresada en Hz.

Pero eso no es todo, también se encuentra la representación gráfica de la energía expresada en dB, esta posee una gama de colores o escala de grises, donde los valores más oscuros muestran el nivel más alto de energía.


Quizás también te puede interesar:

que es la fonetica - nuria gavalda

¿Qué es la Fonética?

Fonética del Inglés - Nuria Gavaldà - Pronunciación del Inglés

Fonética en Inglés

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Cookies