Las características acústicas de los sonidos del habla
La onda sonora producida durante la fonación es el resultado del paso del aire por la glotis en la emisión de una serie de sucesivas bocanadas de aire al ritmo de abertura y cierre de los pliegues vocales.
Para crear una onda sonora las moléculas de aire deben entrar en vibración, lo que se consigue al pasar a través de los pliegues vocales que se encuentran en movimiento.
Creación de un movimiento vibratorio mediante una goma elástica.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
Compresión y rarefacción de las moléculas de aire producidas por la vibración de un diapasón.
Ferrero, F., Genre, A., Boë, L.-J. y Contini, M. (1979). Nozioni di fonetica acustica. Omega.
Compresión y rarefacción de las moléculas de aire producidas por la vibración de un diapasón.
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Desplazamiento de las moléculas de aire.
Denes, P. B. y Pinson, E. N. (1963). The speech chain: The physics and biology of spoken language. Anchor Press.
Desplazamiento de las moléculas de aire.
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Movimiento vibratorio de una molécula de aire.
Llisterri, J. (1996). Los sonidos del habla. En C. Martín Vide (Ed.), Elementos de lingüística (pp. 67–128). Octaedro. https://joaquimllisterri.cat/publicacions/Llisterri_96_Sonidos_Habla.pdf
El ciclo de un movimiento vibratorio:
Representación de un movimiento vibratorio.
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
La amplitud de un movimiento vibratorio viene dada por la distancia entre la posición de reposo y el punto de máximo desplazamiento.
Depende de la fuerza aplicada inicialmente y de la resistencia que ofrezca el medio en el que se produce la vibración.
Desde el punto de vista fisico, la amplitud se cuantifica en unidades de presión sonora.
La amplitud es un parámetro de naturaleza física; las variaciones en la ampliud producen cambios en la percepción de la intensidad (en inglés, loudness), un parámetro de naturaleza perceptiva que se cuantifica en decibelios (dB).
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
El tiempo que dura un movimiento vibratorio depende de la fuerza aplicada inicialmente y de la resistencia que ofrezca el medio en el que se produce la vibración.
La duración de los sonidos del habla se cuantifica en milésimas de segundo o milisegundos (ms).
Las variaciones en el tiempo de emisión de un sonido se perciben como variaciones en su duración.
El movimiento de vaivén de las moléculas de aire se repite diversas veces a lo largo del tiempo, dando lugar a un sonido periódico caracterizado por la repetición de una serie de ciclos.
Movimiento vibratorio de una molécula de aire.
Llisterri, J. (1996). Los sonidos del habla. En C. Martín Vide (Ed.), Elementos de lingüística (pp. 67–128). Octaedro. https://joaquimllisterri.cat/publicacions/Llisterri_96_Sonidos_Habla.pdf
La frecuencia corresponde al número de veces que una partícula va de la posición de reposo (A) al punto de separación máxima respecto a esta posición (B), vuelve al punto de reposo (C), llega de nuevo al punto de separación máxima (D) y vuelve a la posición de reposo (E), es decir al número de ciclos por unidad de tiempo.
La unidad de medida de la frecuencia es el Hercio (Hz), equivalente a un ciclo por segundo.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
La onda sonora es el resultado de la vibración de las moléculas del aire y puede definirse en función de tres parámetros acústicos:
Ondas sonoras periódicas simples con la misma amplitud (1) y con diferente frecuencia (10 Hz, 20 Hz, 50 Hz, 100 Hz).
Ondas sonoras periódicas simples con la misma frecuencia (100 Hz) y con diferente amplitud (0,10, 0,50, 0,75, 1).
❯ Creación de ondas sonoras simples
La onda sonora producida en la glotis como resultado de la fonación corresponde al tipo de sonidos denominados compuestos o complejos, consistentes en la superposición de varias ondas simples (tonos puros).
Una onda sonora compuesta es la suma de las ondas sonoras simples que la componen.
Forma de onda: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora compuesta |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
|
Espectro: onda sonora compuesta |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora compuesta |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
Espectro: onda sonora simple |
|
Espectro: onda sonora compuesta |
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
La frecuencia fundamental es la onda sonora simple de frecuencia más baja entre las que forman una onda sonora compleja.
Espectro entre 0 y 1000 Hz de una vocal sintetizada [a] con una frecuencia fundamental de 100 Hz.
Espectro entre 0 y 1000 Hz de una vocal sintetizada [a] con una frecuencia fundamental de 200 Hz.
La frecuencia fundamental (f0) corresponde a la frecuencia de abertura y cierre de los pliegues vocales.
❯ Los correlatos articulatorios de la melodía
Las variaciones de frecuencia fundamental a lo largo del tiempo en el habla se observan en una curva melódica.
La frecuencia fundamental es un parámetro físico; sus cambios se perciben como variaciones en la altura tonal (en inglés, pitch) de un sonido.
❯ Los correlatos perceptivos de la melodía
Los armónicos son componentes de una onda sonora compleja.
La frecuencia de los armónicos es un múltiplo entero de la frecuencia fundamental.
Frecuencia fundamental | 100 Hz |
Segundo armónico | 100 x 2 = 200 Hz |
Tercer armónico | 100 x 3 = 300 Hz |
Cuarto armónico | 100 x 4 = 400 Hz |
Quinto armónico | 100 x 5 = 500 Hz |
Espectro de una onda sonora compleja con una frecuencia fundamental de 100 Hz. Se muestran únicamente los cinco primeros armónicos.
Frecuencia fundamental | 250 Hz |
Segundo armónico | 250 x 2 = 500 Hz |
Tercer armónico | 250 x 3 = 750 Hz |
Cuarto armónico | 250 x 4 = 1000 Hz |
Quinto armónico | 250 x 5 = 1250 Hz |
Espectro de una onda sonora compleja con una frecuencia fundamental de 250 Hz. Se muestran únicamente los cinco primeros armónicos.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Dos tipos de representación de la onda sonora:
Oscilogramas o formas de onda y espectros de ondas sonoras periódicas.
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
El espectro de la onda sonora tal como se produce en la glotis presenta una amplitud descendente en los armónicos a medida que aumenta la frecuencia.
Espectro de la onda sonora producida por el movimiento de los pliegues vocales (f0 = 100 Hz).
El paso de la onda sonora por las cavidades supraglóticas modifica la amplitud de los armónicos debido al fenómeno de la resonancia.
Efecto de la resonancia (F1 = 500 Hz, F2 = 1500 Hz, F3 = 2500 Hz).
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
La resonancia tiene como resultado la modificación de la amplitud de los armónicos de un sonido complejo en función de las características de la cavidad en la que se produce la vibración de las moléculas de aire.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Por regla general, las cavidades pequeñas refuerzan la amplitud de los armónicos de frecuencia alta; por este motivo se percibe un sonido agudo en el caso del violíb.
Las cavidades grandes refuerzan la amplitud de los armónicos de frecuencia baja; por ello, en el caso de los contrabajos, se obtienen sonidos percibidos como graves—.
En las cavidades supraglóticas la amplitud de los armónicos de la onda sonora procedente de la glotis queda alterada en función de la posición adoptada para la articulación de cada sonido.
En el caso de los sonidos periódicos complejos, se refuerza la amplitud de grupos de armónicos situados alrededor de una determinada frecuencia, configurándose así los denominados ‘formantes’.
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Las variaciones en la frecuencia de los formantes de un sonido se perciben como variaciones en su timbre (en inglés, quality).
Configuración de las cavidades supraglóticas y espectro en la vocal [i].
Fuente de la imagen obtenida por resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica. Universitat de Girona. http://web.udg.edu/labfon/imatge.htm
Configuración de las cavidades supraglóticas y espectro en la vocal [u].
Fuente de la imagen obtenida por resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica. Universitat de Girona. http://web.udg.edu/labfon/imatge.htm
En la vocal anterior [i] el adelantamiento de la lengua crea una cavidad anterior al punto de constricción de tamaño relativamente pequeño, mientras que la cavidad posterior a este punto presenta un tamaño mayor. Esto se refleja en un espectro con primer un formante de frecuencia baja —relacionado con la cavidad posterior— y un segundo formante de frecuencia alta —relacionado con la cavidad anterior—.
En la vocal posterior [u], el punto de constricción, situado en la zona velar, crea dos cavidades grandes, una anterior —a la que contribuye también el adelantamiento de los labios— y otra posterior. Esto se refleja en el espectro de [u], que presenta dos formantes de frecuencia baja.
Desde el punto de vista acústico las vocales se diferencian por la frecuencia a la que se encuentran esas zonas de armónicos de amplitud reforzada por acción de la resonancia de las cavidades supraglóticas o formantes.
Espectro de la vocal [i]
Helle, S. (1991). Puhuvat koneet / Talande maskiner / Talking machines (Versión 4.0) [Programa informático]. Heureka.
Espectro y función de área en el tracto vocal de la vocal [i].
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
Espectro de la vocal [u]
Helle, S. (1991). Puhuvat koneet / Talande maskiner / Talking machines (Versión 4.0) [Programa informático]. Heureka.
Espectro y función de área en el tracto vocal de la vocal [u].
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
Espectro de la vocal [a]
Helle, S. (1991). Puhuvat koneet / Talande maskiner / Talking machines (Versión 4.0) [Programa informático]. Heureka.
Espectro y función de área en el tracto vocal de la vocal [a].
Raphael, L. J., Borden, G. J. y Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6.a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
La presencia de formantes es característica de todos aquellos sonidos que se producen con resonancia en el tracto vocal como las vocales, las nasales o las laterales.
Beskow, J. (2001). Formant synthesizer demo [Programa informático]. Centre for Speech Technology, KTH Stockholm. https://www.speech.kth.se/wavesurfer/formant/
❯ Características acústicas de las vocales: la estructura formántica
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
En las consonantes como las fricativas sordas, la turbulencia en la corriente de aire creada por el estrechamiento en el punto en que se produce la constricción tiene como resultado un sonido que en términos acústicos puede describirse como un sonido aperiódico continuo.
La falta de periodicidad —debida a que no se produce vibración de los pliegues vocales— se manifiesta en un espectro sin armónicos.
Forma de onda (oscilograma) y espectro de un sonido aperiódico continuo.
En la producción de los sonidos aperiódicos —por ejemplo, las consonantes fricativas sordas— se observa la influencia del volumen de las cavidades supraglóticas en función de la zona del tracto vocal en la que se da la constricción.
Forma de onda (oscilograma) y espectro de un sonido aperiódico continuo.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
En los sonidos aperiódicos impulsionales (en inglés, transient) la energía sonora se concentra en un breve lapso de tiempo, como en el caso de la explosión que se produce después de la fase de cierre en las consonantes oclusivas.
En los sonidos aperiódicos impulsionales se puede observar el efecto de la configuración de las cavidades supraglóticas en función de la zona del tracto vocal en la que se produce la explosión.
Forma de onda (oscilograma) de la explosión en las consonantes oclusivas sordas [p], [t] y [k].
Rosen, S. y Howell, P. (2011). Signals and systems for speech and hearing (2.a ed.). Emerald.
La clasificación acústica de los sonidos del habla puede resumirse de la forma siguiente:
Sonidos periódicos compuestos o complejos | Vibración de los pliegues vocales (frecuencia del fundamental, f0) y resonancia (armónicos) en el tracto vocal | vocales, nasales, laterales |
Sonidos aperiódicos impulsionales | Cierre y explosión en el tracto vocal | oclusivas |
Sonidos aperiódicos continuos | Fricción producida por una constricción en el tracto vocal | fricativas |
Landercy, A. y Renard, R. (1977). Éléments de phonétique. Centre International de Phonétique Appliquée; Didier.
Existe una relación directa entre las características acústicas de los sonidos del habla y el modo de producción.
❯ Correlatos articulatorios, acústicos y perceptivos de los elementos segmentales
El aparato fonador puede considerarse en términos de una fuente —el lugar donde se produce la corriente de aire indispensable para la producción del sonido— y un filtro —el conjunto de cavidades que, por el fenómeno de la resonancia, modifican las características de la fuente—.
Modelo simplificado de la producción del habla.
Fuente y filtro en el tracto vocal.
Modelo de la fuente y el filtro.
Lieberman, P. y Blumstein, S. E. (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge University Press. https://doi.org/10.1017/CBO9781139165952
Demostración de la fonación humana.
Domínguez, H. [Hugo Domínguez Luthier]. (2011, 27 de julio). Demostración de la fonación humana [Video]. YouTube. https://www.youtube.com/watch?v=8WnMKJhI7y4
El modelo de la fuente y el filtro constituye la base de la teoría acústica de la producción del habla.
Gunnar Fant (1919–2009) (Fuente de la imagen: TMH, Speech, Music and Hearing. (2016, 29 de abril). Gunnar Fant 1919-2009. KTH Royal Institute of Technology. https://www.speech.kth.se/gunnarfant/)
|
Producidos con vibración de los pliegues vocales.
Sonidos sonoros: producidos con una fuente periódica.
Sonidos sordos: producidos sin la intervención de una fuente periódica.
Espectro de la onda sonora producida por el movimiento de los pliegues vocales (f0 = 100 Hz).
La estructura del aparato fonador humano permite combinar simultáneamente una fuente periódica y una fuente aperiódica: por ejemplo, las consonantes fricativas sonoras se producen mediante con una fuente periódica —la vibración de los pliegues vocales— combinada con una fuente aperiódica —la turbulencia en el lugar de constricción en el tracto vocal—.
Las cavidades supraglóticas modifican la amplitud de los armónicos de la fuente por efecto de la resonancia. Este efecto es equivalente al de un filtro que permite el paso de determinados elementos y, en cambio, impide el de otros.
El concepto de filtro.
Lieberman, P. y Blumstein, S. E. (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge University Press. https://doi.org/10.1017/CBO9781139165952
Efecto del filtro sobre la fuente (F1 = 500 Hz, F2 = 1500 Hz, F3 = 2500 Hz).
La función de transferencia (o función de filtro): descripción matemática de las características de las cavidades de resonancia en función de los armónicos que amplifican o reducen.
Función de transferencia del tracto vocal.
Lieberman, P. y Blumstein, S. E. (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge University Press. https://doi.org/10.1017/CBO9781139165952
A la salida del tracto vocal se produce una nueva modificación en el espectro a causa de la radiación.
Efecto de la radiación en la pendiente del espectro (F1 = 500 Hz, F2 = 1500 Hz, F3 = 2500 Hz).
El filtro puede considerarse como fijo en los sonidos durante la producción de los cuales no se altera la forma de la cavidad de resonancia —por ejemplo en las vocales—.
El filtro puede considerarse como variable cuando necesariamente tiene que producirse un cambio en la forma de la cavidad de resonancia, como en el caso de las oclusivas que constan de una fase de oclusión y otra de explosión.
La resonancia puede darse en la cavidad oral (filtro oral) o en la cavidad nasal (filtro nasal), en función de la posición de la úvula cerrando o abriendo el paso de la corriente del aire hacia las fosas nasales.
Fuente | Filtro | Clases de sonidos |
Periódica | Fijo, oral | vocales orales |
Periódica | Fijo, oral + nasal | vocales nasales |
Periódica | Variable, oral | diptongos |
Aperiódica continua | Fijo, oral | fricativas sordas |
Aperiódica impulsional | Variable, oral | oclusivas orales sordas |
Aperiódica continua + periódica | Fijo, oral | fricativas sonoras |
Aperiódica impulsional + periódica | Variable, oral | oclusivas orales sonoras |
Aperiódica impulsional + periódica | Variable, oral + nasal | oclusivas nasales |
Aperiódica continua + periódica | Variable, oral | laterales y róticas |
Adaptado de Landercy, A. y Renard, R. (1977). Éléments de phonétique. Centre International de Phonétique Appliquée; Didier.