Análisis acústico del habla mediante Praat: análisis espectrográfico y análisis de formantes
Mediante la opción Show analyses... que aparece en el menú View se llega a un cuadro en el que pueden marcarse o no marcarse los recuadros correspondientes al tipo de análisis que se mostrará en la ventana.
Para visualizar el espectrograma, se marca la opción Show spectrogram
Igualmente puede visualizarse el espectrograma señalando Show spectrogram en el menú Spectrum
La representación del espectrograma aparece en el centro de la ventana. Situando el cursor en el punto deseado, en la parte izquierda de la ventana aparece el valor en hercios correspondiente a la frecuencia del punto en el que se ha situado el cursor, mientras que en la parte superior aparece el tiempo.
Mediante la opción Spectrogram settings del menú Spectrum se abre una ventana en la que pueden ajustarse algunos parámetros de análisis y de visualización.
La opción View range (Hz) define el rango frecuencial (de 0 Hz a 5.000 Hz en el ejemplo) que se visualiza en la ventana de análisis; con ello se cambia únicamente la visualización, pero no las propiedades de la señal sonora que se está analizando.
Mediante Window length (s) se especifica el tamaño de la ventana de análisis. Empleando el valor por defecto (0.005 s, es decir, 5 ms) se obtiene un espectrograma de banda ancha en el que se visualizan los formantes.
Con una ventana de análisis de 0.03 s (30 ms) se obtiene un espectrograma de banda estrecha en el que pueden observarse los armónicos.
La opción Dynamic range permite ajustar el rango dinámico, que corresponde a la visualización de las diferencias entre los valores máximos y mínimos de energía sonora; cuanto más elevado es el rango dinámico, más «oscura» se aprecia la imagen, pues se muestra un mayor número de componentes frecuenciales con una baja energía sonora; cuanto más bajo es el rango, más «clara» se observa la imagen, pues aparecen únicamente los componentes frecuenciales con una energía sonora por encima de un umbral determinado.
Por ejemplo, si el valor de energía sonora más alto en un espectrograma corresponde a 30 dB / Hz y el rango dinámico es de 50 dB, los valores por debajo de -20 dB / Hz (es decir, 30 - 50) aparecerán en color blanco, y los valores entre -20 dB y 30 dB / Hz aparecerán como una escala de grises en función de su energía sonora (Praat Manual, Intro 3.2: Configuring the spectrogram).
Praat Manual: Spectral analysis
Mediante la opción Formant settings en el menú Formant es posible configurar algunos parámetros del análisis de los formantes.
Maximum formant (Hz) especifica el valor máximo del rango frecuencial en el que se efectuará el análisis. El manual de Praat recomienda un valor de 5.500 Hz para voces femeninas, 5.000 Hz para voces masculinas y valores más elevados (8.000 Hz) para voces infantiles (Praat Manual, Sound: To Formant (burg) ).
Mediante Number of formants se define el número de formantes que se desea analizar; el valor por defecto es 5.
Window length (s) indica la duración de la ventana de análisis. El valor por defecto (0.025 s) equivale a una ventana de análisis de 0.050 s (50 ms) (Praat Manual, Sound: To Formant (burg) ).
El grosor de los puntos rojos que señalan la trayectoria de los formantes puede variarse cambiando el valor de Dot size (mm).
La opción Formant listing en el apartado Query del menú Formant permite obtener, en una nueva ventana, los valores de los formantes en el punto donde se halla situado el cursor o en una selección.
En el mismo apartado Query del menú Formant pueden obtenerse, de forma individual, los valores de frecuencia y de amplitud de banda de los cuatro primeros formantes o del formante que se desee si se introduce su número en las ventanas que se abren con el comando Get formant... o Get bandwidth....
Si se selecciona un fragmento de la señal sonora, se obtiene el valor medio de cada formante en la selección.
Praat Manual: Formant analysis