Las características acústicas de los elementos segmentales

Características acústicas

Las vocales son sonidos periódicos complejos producidos con resonancia en el tracto vocal.

Fuente periódica

Las vocales se producen generalmente con vibración de los pliegues vocales, por lo que presentan una fuente periódica.

Filtro oral fijo

En las vocales no se producen cambios en la forma del tracto vocal durante la articulación del sonido (filtro fijo) y el aire sale únicamente por la cavidad bucal (filtro oral).

Parámetros acústicos

Frecuencia de los formantes (F1, F2, F3)

La frecuencia de los tres primeros formantes distingue acústicamente las vocales entre sí.

Frecuencia de los tres primeros formantes de la vocal /æ/ del inglés en un espectrograma.

Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.^a ed.). Singular / Thomson Learning.

Representación esquemática del primer y del segundo formante de las vocales del español chileno (Ruiz Mella y Soto-Barba, 2005) en un espectrograma.

Román, D. (s. f.). Caracterización acústica de las vocales del español. Materiales de estudio. http://domingo-roman.net/vocales_esp_caract_acustica.html

Valor medio de la frecuencia (en Hz) y desviación estándar del primer y del segundo formante de las vocales en una muestra de 16 hablantes masculinos de español.

Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.

Valor medio de la frecuencia (en Hz) y desviación estándar del primer y del segundo formante de las vocales en una muestra de 6 hablantes femeninas de español.

Valor medio de la frecuencia (en Hz) del tercer formante de las vocales en una muestra de 16 hablantes masculinos y 6 hablantes femeninas de español.

Valores medios de la frecuencia (en Hz) de los cuatro primeros formantes de las vocales del catalán producidas aisladamente y en la secuencia [sVk] por seis hablantes y en secuencias CVC por tres hablantes. Las desviaciones típicas corresponden a contextos CVC simétricos.

Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.

Formants_vocals_catala_altres_llengues_Recasens_2014.jpg

Valores medios de la frecuencia (en Hz) de los dos primeros formantes de las vocales tónicas [e], [ɛ], [a], [ɔ] y [o] del catalán oriental comparados con los de otras lenguas románicas y con los del inglés.

Recasens, D. (2014). Fonètica i fonologia experimentals del català: vocals i consonants. Institut d’Estudis Catalans.

Valores medios de frecuencia (en Hz) de los tres primeros formantes de las vocales tónicas de los principales dialectos del catalán. Los datos corresponden a valores medios de repeticiones de realizaciones vocálicas en distintos contextos consonánticos por diferentes hablantes.

Recasens, D. (2014). Fonètica i fonologia experimentals del català: vocals i consonants. Institut d’Estudis Catalans.

Duración

La duración de las vocales viene condicionada por diferentes factores:

Sonoridad, zona de articulación y modo de articulación de las consonantes adyacentes.
Situación en sílaba abierta o cerrada.
Aparición en sílaba acentuada o no acentuada.
Aparición en palabras monosílabicas o polisilábicas.
Aparición en posición inicial o final de palabra y en posición pre- o post-pausal.

Intensidad

La amplitud (en términos acústicos) o la intensidad (en términos perceptivos) de las vocales puede verse afectada por diversos factores:

Aparición en sílaba acentuada o no acentuada.
Posición respecto al acento en la palabra.
Posición en el enunciado.

Frecuencia fundamental (f₀)

La frecuencia fundamental de las vocales viene modificada por distintos factores:

Sonoridad de las consonantes adyacentes.
Aparición en sílaba acentuada o en sílaba no acentuada.
Apariciónen determinadas posiciones de la curva melódica del enunciado.

Duración intrínseca

Duración propia de una vocal determinada por sus características fonéticas propias.

Las vocales abiertas presentan una duración intrínseca superior a la de las vocales cerradas.

Intensidad intrínseca

La amplitud (en términos acústicos) o la intensidad (en términos perceptivos) propias de cada vocal viene determinada por sus características fonéticas.

Las vocales abiertas presentan una intensidad intrínseca superior a la de las vocales cerradas.

Frecuencia fundamental intrínseca

Existe una relación entre el grado de abertura de la vocal y la altura relativa de su frecuencia fundamental.

Las vocales cerradas presentan una frecuencia fundamental más elevada que las vocales abiertas.

Representación

En el espectrograma

Vocales

En un espectrograma las vocales se caracterizan por unas bandas de frecuencia con una mayor intensidad correspondientes a los formantes.

Representación espectrográfica de las vocales del catalán. F1 indica el primer formante y F2 indica el segundo formante.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Diptongos

En un espectrograma los diptongos se caracterizan por un movimiento continuo de los formantes desde la posición propia de la primera vocal del diptongo hasta la posición característica de la segunda vocal.

Representación espectrográfica de los diptongos [au̯] y [əu̯] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Representación espectrográfica de los diptongos [i̯ə] y [u̯ə] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

En el espectro

En un espectro los formantes de las vocales se muestran en forma de picos de intensidad situados a una frecuencia diferente para cada vocal.

Relación entre la representación espectrográfica y la representación espectral de las vocales [i] y [a] del catalán. Las líneas horizontales señalan la posición de los dos primeros formantes en el espectrograma y las verticales señalan la posición de los dos primeros formantes en el espectro.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Trapecio vocálico

Las vocales pueden representarse como puntos en un eje de coordenadas, situando la frecuencia del primer formante en el eje vertical y la frecuencia del segundo formante en el eje horizontal.

El resultado es un triángulo o trapecio que se corresponde con las características articulatorias si se representa la abertura de la mandíbula (o la posición vertical de la lengua) en el eje vertical y la localización de la constricción (o la posición horizontal de la lengua) en el eje horizontal.

Trapecio vocálico con los valores medios (en Hz) de F1 y F2 obtenidos a partir de una muestra de 16 hablantes masculinos (línea continua) y 6 hablantes femeninas (línea discontinua) de español.

Trapecio vocálico con los valores medios (en Hz) de F1 y F2 obtenido a partir de una muestra de 16 hablantes masculinos (línea continua) y 6 hablantes femeninas (línea discontinua) de español, superpuesto a una representación esquemática del tracto vocal.

Valores medios (en Hz) de los dos primeros formantes de las vocales representados en un trapecio vocálico obtenido a partir de una muestra de 16 hablantes masculinos y 6 hablantes femeninas de español.

Área o campo de dispersión

El área o campo de dispersión es el espacio que se obtiene trazando una línea exterior a todos los puntos que representan realizaciones de una misma vocal.

Áreas de dispersión de las vocales del inglés obtenidas a partir de las producciones de 76 hablantes.

Peterson, G. E. y Barney, H. L. (1952). Control methods used in a study of the vowels. The Journal of the Acoustical Society of America, 24(2), 175–184. https://doi.org/10.1121/1.1906875

Áreas de dispersion de las vocales del español en función el contexto consonántico.

Guirao, M. y de Manrique, A. M. B. (1979). Spectral modifications of Spanish vowels by consonantal context [Manuscrito inédito]. Laboratorio de Investigaciones Sensoriales, CONICET y Universidad de Buenos Aires. Reproducido en de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.

Áreas de dispersión de las vocales del catalán pronunciadas por seis hablantes en posición aislada (izquierda) y en el contexto [sVk] (derecha).

Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.

Correlación articulatoria – acústica

La abertura de la mandíbula (o posición vertical de la lengua), la localización de la constricción (o posición horizontal de la lengua) y la disposición de los labios determinan la frecuencia de los formantes de las vocales.

Constricción hacia la parte posterior del tracto vocal
[i] > [e] > [a] > [o] > [u]
→ F2 decreciente.
Aumento de la elevación de la lengua
[a] > [e] > [i]
[a] > [o] > [u]
→ F1 decreciente.

Representación esquemática de los formantes de las vocales

Representación esquemática del primer y del segundo formante de las vocales del español chileno (Ruiz Mella y Soto-Barba, 2005) en un espectrograma.

Relación entre las características articulatorias y las características acústicas en el trapecio vocálico.

Relación entre las características articulatorias y las características acústicas de las vocales del español.

Fuente de las representaciones articulatorias: Quilis, A. (1993). Tratado de fonología y fonética españolas. Gredos.

Configuración del tracto vocal, espectro y espectrograma de la vocal [i].

Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica

Configuración del tracto vocal, espectro y espectrograma de la vocal [e].

Configuración del tracto vocal, espectro y espectrograma de la vocal [a].

Configuración del tracto vocal, espectro y espectrograma de la vocal [o].

Configuración del tracto vocal, espectro y espectrograma de la vocal [u].

«Articulation	Speech Wave
Tongue fronted	F₂-F₁ large.
a) Prepalatal position	F₂ high, F₃ maximally high.
b) Midpalatal position	F₂ maximally high and close to F₃.
Tongue retracted	F₂-F₁ small, F₁ comparatively high.
Mouth opening (including tongue section and lips) narrow	F₁ low.
Lips relatively close and protruded (small lip-opening area)	F₁ + F₂ + F₃ lower than with a larger lip-opening and the same tongue articulation. A progressive lip closure alone causes a decrease in each of F₁, F₂, and F₃ but with varying amounts depending on the particular tongue position. The effect on F₃ in pronounced in case of prepalatal tongue positions.»

Fant, G. (2004). Descriptive analysis of the acoustic aspects of speech. Speech acoustics and phonetics: Selected writings (pp. 145–161). Kluwer. https://doi.org/10.1007/978-1-4020-5746-5 (Obra original publicada en 1962)

Gunnar Fant (1919–2009)

(Fuente de la imagen: TMH, Speech, Music and Hearing. (2016, 29 de abril). Gunnar Fant 1919–2009. KTH Royal Institute of Technology. https://www.speech.kth.se/gunnarfant/)

Características acústicas de la vocales

❯ Indicios acústicos en la percepción de las vocales

Consonantes oclusivas orales

Características articulatorias

❯ Modo de articulación oclusivo

Características acústicas

Fuente aperiódica impulsional

Las consonantes oclusivas son sonidos aperiódicos producidos con una fuente de ruido de naturaleza impulsional en el tracto vocal.

En las oclusivas sonoras la fuente aperiódica impulsional se combina con una fuente periódica.

Filtro oral variable

La producción de las consonantes oclusivas requiere una fase de cierre u oclusión y otra de abertura o explosión, lo que implica un movimiento del tracto vocal (filtro variable). El aire sale únicamente por la cavidad bucal (filtro oral).

Parámetros acústicos

Oclusión

Durante la fase de oclusión o cierre se da una ausencia de energía acústica en las oclusivas sordas y la presencia de energía a baja frecuencia en las oclusivas sonoras.

Duración

La duración de la oclusión se situa entre los 50–150 ms.

Explosión

Duración

La duración de la explosión es habitualmente menor de 50 ms.

La explosión presenta una mayor duración en las velares que en labiales o dentales y alveolares; puede ser mayor en las dentales y alveolares que en las labiales.

	Duración (en ms) de la explosión en [p] (desviación típica entre paréntesis)	Duración (en ms) de la explosión en [t] (desviación típica entre paréntesis)	Duración (en ms) de la explosión en [k] (desviación típica entre paréntesis)
Catalán Llisterri (1987)	3,71 (2,1)	6,71 (3,6)	14,12 (8,8)
Catalán Martí (1986)	8,6 (0,5)	13,6 (0,5)	20,5 (2,4)
Español Poch (1984)	15,3	15,62	21,86
Francés Durand (1985)	28,53 (5,6) 20,53 (9,2)	31,46 (18,9) 33,33 (7,7)	53,06 (18,63) 48,40 (12,17)

Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Poch, D. (1984). Las oclusivas sordas del español: estudio acústico espectrográfico de las realizaciones intervocálicas en contacto con vocal acentuada [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Durand, P. (1985). Variabilité acoustique et invariance en français : consonnes occlusives et voyelles. Éditions du CNRS.

Frecuencia

Concentración de la energía sonora en las frecuencias bajas en la labiales, concentración de la energía sonora en las frecuencias altas en las dentales y alveolares y concentración de la energía a la altura de la vocal adyacente o en un pico espectral de frecuencia media en las velares.

Intensidad

Menor intensidad en la explosión de las labiales que en la de las dentales, alveolares o velares; las alveolares presentan una explosión de mayor intensidad que las dentales.

VOT (Voice Onset Time)

Intervalo temporal entre la explosión y el inicio de la sonoridad de la vocal.

La duración del VOT aumenta a medida que la oclusión se desplaza hacia la parte posterior del tracto vocal.

El VOT presenta valores positivos en las consonantes sordas y negativos en las sonoras.

Representación del VOT negativo de una consonante sonora ([b]) y del VOT positivo de una consonante sorda ([t]) en el oscilograma y en el espectrograma.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

	Duración (en ms) del VOT de [p] (desviación típica entre paréntesis)	Duración (en ms) del VOT de [t] (desviación típica entre paréntesis)	Duración (en ms) del VOT de [k] (desviación típica entre paréntesis)
Catalán Julià (1981)	3	16	35
Catalán Martí (1986)	10,2 (0,8)	16,1 (1,1)	26,1 (3,6)
Catalán Recasens (1986)	23	27	47
Catalán Llisterri (1987)	11,75 (4)	17,35 (7,4)	28,37 (9,7)
Español (Argentina) de Manrique (1980)	10	15	25
Español (Peninsular) Poch (1984)	17,18	19,75	29,01
Español (Puerto Rico) Flege y Eefting (1987)	18 (5)	22 (6)	39 (7)
Francés (Canadá) Caramazza et al. (1973)	18	23	32
Francés (Europeo) Durand (1985)	17,85 (14,5)	25,17 (17,6)	42,5 (14,5)
Italiano Vagges et al. (1978)	12 (6)	17 (3)	30 (10)

Julià, J. (1981). Estudi contrastiu dels oclusius de l’anglès i el català: un experiment acústic. Estudi General, 1(2), 75–85. https://www.raco.cat/index.php/EstudiGral/article/view/43543
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Poch, D. (1984). Las oclusivas sordas del español: estudio acústico espectrográfico de las realizaciones intervocálicas en contacto con vocal acentuada [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Flege, J. E. y Eefting, W. (1987). Imitation of a VOT continuum by native speakers of English and Spanish: Evidence for phonetic category formation. The Journal of the Acoustical Society of America, 83(2), 729–740. https://doi.org/10.1121/1.396115
Caramazza, A., Yeni-Komshian, G. H., Zuriff, Z. y Carbone, E. (1973). The acquisition of a new phonological contrast: The case of stop consonants in French-English bilinguals. The Journal of the Acoustical Society of America, 54(2), 421–428. https://doi.org/10.1121/1.1913594
Durand, P. (1985). Variabilité acoustique et invariance en français : consonnes occlusives et voyelles. Éditions du CNRS.
Vagges, K., Ferrero, F., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.

Transiciones de los formantes

Frecuencia de inicio

Para una misma zona de articulación, la frecuencia de inicio de las transiciones de los formantes depende de la vocal adyacente.

Dirección

La dirección de las transiciones de los formantes depende de la zona de articulación de la oclusiva y de la vocal adyacente.

F2 y F3 descendentes en las labiales.
F2 descendente o ascendentes y F3 descendente en dentales y alveolares.
F2 ascendente y F3 descendentes en las velares.

Transiciones de oclusivas sordas a vocal central

Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de la vocal central [a] en catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de vocal anterior [i] en catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de vocal posterior [u] en catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones del segundo formante de la consonante oclusiva sorda [t] en contacto con vocal anterior ([i]) y con vocal posterior ([u]) en catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Pendiente

La pendiente de las transiciones de los formantes (en inglés, slope) depende de factores como el grado de coarticulación.

Duración

La duración de las transiciones de los formantes depende de la oclusiva y de factores como la velocidad de elocución.

Oscila entre 30 y 100 ms en las oclusivas sordas.

Varía entre 80 y 150 ms en las oclusivas sonoras.

	Duración (en ms) de las transiciones de [p] (desviación típica entre paréntesis)	Duración (en ms) de las transiciones de [t] (desviación típica entre paréntesis)	Duración (en ms) de las transiciones de [k] (desviación típica entre paréntesis)
Catalán Martí (1986)	F1: 17,5 (2,2) F2: 26,5 (6,5) F3: 23 (4,1) Media 22,33	F1: 21,87 (3,3) F2: 30,6 (9,1) F3: 22,5 (7) Media 24,99	F1: 25,5 (3,2) F2: 32,1 (11,1) F3: 35,1 (9,9) Media 30,9
Catalán Llisterri (1987)	F1: 14,4 (8,2) F2: 20,8 (4,9) F3: 32,2 (13,16) Media 19,46 (4,4)	F1: 18,8 (8,8) F2: 25,1 (12,1) F3: 19,7 (9,2) Media 19,6 (9,8)	F1: 25,6 (9) F2: 24,8 (6,5) F3: 23,6 (8,9) Media 24,66 (5,5)

Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.

Configuración espectral

La configuración espectral de las consonantes oclusivas puede estudiarse a partir del espectro obtenido en los 10–20 ms que siguen a la explosión.

Oscilogramas y espectros de la explosión de las consonantes oclusivas sonoras [b], [d] y [ɡ] seguidas de la vocal [a] en inglés.

Stevens, K. N. y Blumstein, S. E. (1978). Invariant cues for place of articulation in stop consonants. The Journal of the Acoustical Society of America, 64(5), 1358–1368. https://doi.org/10.1121/1.382102

Espectro difuso-descendente en las labiales.

Espectros de consonantes oclusivas labiales sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.

Blumstein, S. E. y Stevens, K. N. (1979). Acoustic invariance in speech production: Evidence from measurements of the spectral characteristics of stop consonants. The Journal of the Acoustical Society of America, 66(4), 1001–1017. https://doi.org/10.1121/1.383319

Espectro difuso y ascendente en las alveolares.

Espectros de consonantes oclusivas alveolares sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.

Espectro compacto en las velares.

Espectros de consonantes oclusivas velares sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.

Representación

En el espectrograma

En las consonantes oclusivas sordas la fase de oclusión (en inglés, stop gap) se visualiza en el espectrograma en forma de energía acústica de intensidad muy baja o de intensidad nula.

Oscilograma y espectrograma de la palabra inglesa buttercup; las flechas indican las consonantes oclusivas sordas.

Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.^a ed.). Singular / Thomson Learning.

En las oclusivas sonoras se observa energía acústica de baja frecuencia, que en el espectrograma se manifiesta como lo que se denomina ‘barra de sonoridad’ (en inglés, voice bar).

Oscilograma y espectrograma de la palabra inglesa raggedy; los intervalos marcados con G indican las consonantes oclusivas sonoras.

Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.^a ed.). Singular / Thomson Learning.

Las oclusivas aspiradas muestran una zona de energía aperiódica de intensidad débil en el espectrograma.

La fase de explosión de las oclusivas se observa en el espectrograma en forma de energía aperiódica correspondiente al ruido de explosión (en inglés, burst o transient).

Oscilograma y espectrograma de las sílabas /pɑ/, /tɑ/ y /kɑ/ en inglés con la indicación de la envolvente espectral del ruido de explosión de cada consonante oclusiva.

Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.^a ed.). Singular / Thomson Learning.

Oscilograma y espectrograma de la palabra catalana bata [batə] en el que se muestran las barras de explosión de las dos consonantes oclusivas, la barra de sonorida de [b] y la oclusión de [t].

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones formánticas.

Transiciones de los formantes en las consonantes oclusivas

Transiciones de los tres primeros formantes en las consonantes oclusivas sonoras seguidas de una vocal central.

Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.^a ed.). Singular / Thomson Learning.

Correlación articulatoria – acústica

Oclusión

La fase de oclusión (cierre de los articuladores) se manifiesta acústicamente como un intervalo de energía acústica mínima.

Explosión

La fase de explosión (salida del aire retenido por el cierre de los articulacores) se manifiesta acústicament como un ruido transitorio.

La distribución frecuencial del ruido de explosión depende del lugar de articulación de la consonante y las cavidades que éste determina.

Transiciones de los formantes

Las transiciones de los formantes reflejan el movimiento del tracto vocal desde la configuración articulatoria de la consonante a la de la vocal.

El punto de inicio, la dirección y la pendiente de las transiciones de los formantes dependen de la zona de articulación de la consonante —es decir, de la zona en la que se produce la constricción— y de la vocal adyacente.

Sonoridad

La sonoridad se manifiesta acústicamente en forma de energía sonora periódica a bajas frecuencias durante la producción de la consonante.

Aspiración

La aspiración se manifiesta acústicamente en forma de energía sonora aperiódica que aparece después de la oclusión y antes de la vocal.

Características acústicas de las consonantes oclusivas orales

❯ Indicios acústicos en la percepción de las consonantes oclusivas orales

Consonantes oclusivas nasales

Características articulatorias

❯ Modo de articulación nasal

Características acústicas

Sonidos periódicos complejos producidos con resonancia en la cavidad bucal (o cavidad oral) y en la cavidad nasal.

Fuente

En las consonantes nasales la fuente periódica se superpone a una fuente aperiódica impulsional.

Filtro

En las consonantes nasales un filtro oral variable (la cavidad oral) se acopla a un filtro nasal fijo (cavidad nasal).

Parámetros acústicos

Murmullo nasal

El murmullo nasal (en inglés, nasal murmur) es un segmento acústico asociado a la energía sonora resultante de la resonancia en la cavidad nasal.

Presenta una estructura formántica con polos (formantes) y ceros (antiformantes).

Los formantes se caracterizan por una gran amplitud de banda y una notable densidad en el espectro.

La estructura formántica del murmullo nasal se relaciona con la zona de articulación de la consonante, aunque existen similaridades notables (N1 = 150–200 Hz; N2 = 1 000–1 600 Hz; N3 = 1 750–2 500 Hz; N4 = 3 000 Hz).

	Frecuencia (en Hz) de los formantes de [m] (desviación típica entre paréntesis)	Frecuencia (en Hz) de los formantes de [n] (desviación típica entre paréntesis)	Frecuencia (en Hz) de los formantes de [ɲ] (desviación típica entre paréntesis)	Frecuencia (en Hz) de los formantes de [ŋ] (desviación típica entre paréntesis)
Catalán Recasens (1986)	N1: 190 N2: 1 165 N3: 2 122 N4: 2 954	N1: 199 N2: 1 468 N3: 2 178 N4: 2 788	N1: 194 N2: 1 323 N2: 1 583 N3: 2 196 N3: 2 498 N4: 3 202 N4: 3 285	N1: 207 N2: 1 220 N3: 2 203 N4: 2 282 N4: 2 956
Catalán Martí (1986)	N1: 250 N2: 990 N3: 2 000	N1: 260 N2: 1 020 N3: 2 380	N1: 280 N2: 1 070 N3: 2 120
Español Quilis (1981)	N1: 270 N2: 1 020 N3: 1 990	N1: 361 N2: 1 400 N3: 2 372	N1: 292 N2: 1 630 N3: 2 420
Italiano Vagges et al. (1978)	N1: 265 (46) N2: 1 165 (147) N3: 2 290 (146)	N1: 310 (73) N2: 1 410 (126)	N1: 305 (46) N2: 2 145 (99)

Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.

Formante nasal

Pico espectral de intensidad considerable y de baja frecuencia (300 Hz) que aparece en el murmullo nasal; es común a todas las consonantes nasales.

Transiciones

Las transiciones de las consonantes oclusivas nasales se comportan como las transiciones de las oclusivas orales homorgánicas.

En las consonantes nasales se da una transición abrupta entre la nasal y la vocal adyacente.

Configuración espectral

La configuración espectral de las consonantes oclusivas nasales presenta características análogas a la de las oclusivas orales homorgánicas.

Representación

En el espectrograma

Murmullo nasal: energía sonora periódica de baja intensidad que presenta una estructura formántica con un primer formante relativamente intenso.

Representación espectrográfica de las consonantes nasales

Representación en el espectrograma de los formantes nasales (murmullos nasales) de la consonante nasal bilabial en la palabra catalana ama.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones formánticas.

Transiciones formánticas de las consonantes nasales en las secuencias [amə], [anə] y [aɲə] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Correlación articulatoria – acústica

Murmullo nasal

El murmullo nasal es la consecuencia de la abertura del paso del aire hacia la cavidad nasal por la acción del velo del paladar.

Oclusión

La oclusión en la cavidad oral tiene un efecto relativos en la estructura espectral del del murmullo nasal.

Transiciones de los formantes

El movimiento del tracto vocal desde la configuración articulatoria de la consonante a la de la vocal y la subida del velo del paladar se manifiestan acústicamente en forma de transiciones abruptas de los formantes.

Características acústicas de las consonantes oclusivas nasales

❯ Indicios acústicos en la percepción de las consonantes oclusivas nasales

Consonantes fricativas

Características articulatorias

❯ Modo de articulación fricativo

Características acústicas

Sonidos aperiódicos continuos

Las consonantes fricativas son sonidos de naturaleza aperiódica continua.

Fuente

La fuente de las consonantes fricativas sordas es aperiódica continua.

En las consonantes fricativas sonoras se da simultáneamente una fuente aperiódica en el tracto vocal y una fuente periódica en la glotis.

Filtro

Las consonantes fricativas se producen con un filtro oral fijo, ya que no se dan cambios en la forma del tracto bucal durante la producción del sonido.

Parámetros acústicos

Intensidad

En función de la intensidad puede establecerse una diferencia entre las fricativas estridentes (o sibilantes), que presentan mayor energía sonora, y las fricativas no estridentes (o no sibilantes), que presentan una menor energía sonora.

Estridentes: alveolares y palatales.
No estridentes: labiodentales, dentales, interdentales y glotales.

Las fricativas sonoras presentan una mayor energía sonora que las sordas.

Configuración espectral

Alveolares: concentración de la energía sonora por encima de los 4 000 Hz.

Palatales: concentración de la energía sonora por encima de los 3 000 Hz.

Las fricativas no estridentes (labiodentales, dentales, interdentales y glotales) presentan un espectro plano y difuso.

	[f]	[θ]	[s]	[z]	[ʃ]	[ʒ]	[x]
Catalán Martí (1986)	Banda entre 500 y 10 000 Hz		F1: 1 695 Hz F2: 2 577 Hz F3: 3 619 Hz	F1: 1 592 Hz F2: 2 275 Hz F3: 3 694 Hz	F1: 2 061 Hz F2: 2 692 Hz F3: 3 618 Hz	F1: 2 022 Hz F2: 2 680 Hz F3: 3 515 Hz
Español (Peninsular) Quilis (1981)	Límite inferior: 2 100 Hz	Límite inferior: 2 400 – 6 400 Hz	Límite inferior: 2 511 – 3 888 Hz F1: 3 483 – 5 670 F2: 4 455
Español (Argentina) de Manrique (1980)	Banda entre 1 000 y 11 000 Hz F1: 1 500 Hz F2: 8 500 Hz		Banda entre 2 000 y 12 000 Hz F1: 4 000 – 6 500 Hz F2: 7 500 – 9 500 Hz		Banda entre 2 000 y 12 000 Hz F1: 2 500 Hz F2: 5 000 Hz	Banda entre 1 500 y 10 000 Hz F1: 2 500 – 3 500 Hz F2: 5 500 Hz	Banda estrecha de baja frecuencia F2: de la vocal [o u a] F3: de la vocal [e i]
Italiano Vagges et al. (1978)	Límite inferior: 2 200 Hz		Límite inferior: 4 300 Hz	Límite inferior: 5 080 Hz	Límite inferior: 1 925 Hz

Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.

Duración

La duración de las fricativas está influenciada por el contexto fonético de la consonante, por su posición en el enunciado y por la velocidad de elocución.

Aumenta en el orden siguiente: dentales, labiales, alveolares y palatales.

La duración de la energía aperiódica en las fricativas sordas tiende a ser mayor que en las sonoras.

Representación

En el espectrograma

Consonantes fricativas

Energía aperiódica en las frecuencias altas.

Presencia de energía aperiódica en las frecuencias bajas en las sonoras.

Transiciones formánticas desde y hasta las vocales adyacentes.

Oscilograma y espectrograma de una consonante fricativa alveolar sorda [s] y de una consonante fricativa alveolar sonora [z] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Consonantes africadas

Oscilograma y espectrograma de una consonante africada palatal sorda [t͡ʃ) y de una consonante africada palatal sonora [d͡ʒ] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Consonantes aproximantes

Oscilograma y espectrograma de una consonante aproximante bilabial [β̞] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Transiciones del segundo formante en las consonantes aproximantes bilabial [β̞], dental [ð̞] y velar [ɣ̞] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Correlación articulatoria – acústica

Fuente aperiódica

El paso del aire por una constricción estrecha en el tracto vocal tiene como resultado una turbulencia que se manifiesta en energía sonora aperiódica.

Filtro

Las propiedades del filtro de las consonantes fricativas vienen determinadas por el lugar en el que se realiza la constricción; en función de la zona de articulación se encuentran diferentes configuraciones espectrales.

Fuente periódica

La vibración de los pliegues vocales en las fricativas sonoras se traduce en una fuente periódica superpuesta a una fuente aperiódica.

Características acústicas de las consonantes fricativas

❯ Indicios acústicos en la percepción de las consonantes fricativas

Consonantes laterales

Características articulatorias

❯ Modo de articulación lateral

Características acústicas

Fuente

Sonidos periódicos complejos producidos con resonancia en el tracto vocal.

Fuente aperiódica combinada con una fuente aperiódica continua.

Filtro

Las consonantes laterales se producen con un filtro oral fijo, ya que su articulación se lleva a cabo en la cavidad bucal y sin que varíe la forma de la cavidad durante la consonante.

Parámetros acústicos

Frecuencia de los formantes (F1, F2, F3)

La frecuencia de los formantes de las consonantes laterales depende, en gran medida, de la de los formantes de las vocales adyacentes.

F1 se encuentra a la altura del F1 de la vocal adyacente.

F3 se encuentra a la altura del F3 la vocal adyacente con vocales anteriores.

	Frecuencia (en Hz) de los formantes de [l] (desviación típica entre paréntesis)	Frecuencia (en Hz) de los formantes de [ʎ] (desviación típica entre paréntesis)
Catalán Martí (1986)	F1: 354 F2: 940 F3: 2 427	F1: 244 F2: 1 877 F3: 2 202
Catalán Recasens (1984)	F1: 319 (104) F2: 1 075 (217) F3: 3 292 (247) Z1 1 469 Z2 2 710	F1: 229 (36) F2: 1 988 (136) F3: 2 678 (252) Z1 1 011 Z2 2 407
Español (Peninsular) Quilis et al. (1979)	F1: 328 F2: 1 561 F3: 2 587	F1: 291 F2: 2 060 F3: 2 661
Español (Argentina) de Manrique (1980)	F1: 400 F2: 1 400 – 2 000 F3: 2 500 (300)
Francés Chafcouloff (1980)	F1: 379 F2: 1 656 F3: 2 354
Italiano Vagges et al. (1978)	F1: 500 (59) F2: 1 165 (86) F3: 2 570 (93)	F1: 280 (46) F2: 2 010 (286) F3: 3 155 (273)

Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1984). Producció i coarticulació de vocals i consonants del català en el decurs [Tesis doctoral inédita]. Universitat de Barcelona.
Quilis, A., Esgueva, M., Gutiérrez Araus, M. L. y Cantarero, M. (1979). Características acústicas de las consonantes laterales españolas. Lingüística Española Actual, 1(2), 233–343.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Buenos Aires: Hachette.
Chafcouloff, M. (1980). Les caractéristiques acoustiques de /j,y,w,l,r/ en français. Travaux de l’Institut de Phonétique d’Aix, 7, 7–56.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.

Transiciones de los formantes

Las transiciones de los formantes de las laterales dependen de la zona de articulación de la consonante y de las vocales adyacentes.

Transiciones rápidas de F1 (10 ms).

Transiciones más lentas de F2 y F3 (60 – 70 ms).

Configuración espectral

En el espectro de las consonantes laterales se observa la presencia de un cero espectral (antiformante, Z) con una frecuencia de 1800 – 2100 Hz.

Duración

Las consonantes laterales presentan una duración mínima de 50 – 60 ms.

Representación

En el espectrograma

En el espectrograma las consonantes laterales muestran una estructura con formantes de una intensidad más baja que la de los formantes de las vocales adyacentes.

Oscilograma y espectrograma de una consonante lateral velarizada [ɫ] y de una consonante lateral palatal [ʎ] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Correlación articulatoria – acústica

Filtro

El volumen de la cavidad anterior y posterior al punto de constricción determina la estructura formántica de las consonantes laterales.

Velarización: aumento del volumen de la cavidad posterior al punto de constricción alveolar que conlleva una disminución de la frecuencia del segundo formante y disminución del volumen de la cavidad posterior al punto de constricción velar que produce un aumento de la frecuencia del primer formante y una disminución de la frecuencia del tercer formante.

Fuente

La salida del aire por los lados de la cavidad bucalpuede resultar en la presencia de un cierto ruido de fricción.

Características acústicas de las consonantes laterales

❯ Indicios acústicos en la percepción de las consonantes líquidas

Consonantes róticas

Características articulatorias

❯ Modo de articulación rótico

Características acústicas

Fuente

Las consonantes róticas son sonidos periódicos complejos producidos con resonancia en el tracto vocal.

Presentan una fuente periódica que puede darse simultáneamente con una fuente aperiódica continua o impulsional en el tracto vocal.

Filtro

Las consonantes róticas se producen con un filtro oral variable, ya que su articulación implica un movimiento de los articuladores.

Parámetros acústicos

Frecuencia de los formantes (F1, F2, F3)

La frecuencia de los formantes de las consonantes róticas depende estrechamente de la de los formantes de las vocales adyacentes.

Transiciones de los formantes

Transiciones cortas de F1 y transiciones de duración variable (50 – 300 ms) de F2 y F3 en las alveolares.

Duración

Duración total

2 – 3 vibraciones en las róticas múltiples.

4 – 6 vibraciones en las uvulares.

50 – 60 ms en las aproximantes.

Duración del momento de cierre

20 ms en las róticas múltiples.

Intensidad

Las consonantes róticas presentan una reducción de la intensidad respecto a las vocales adyacentes.

	[ɾ] Duración (en ms)	[ɾ] Frecuencia de los formantes (en Hz)	[r] Duración (en ms)	[r] Frecuencia de los formantes (en Hz)
Catalán Martí (1986)		[i] F1: 262 F2: 1 537 F3: 2 300 [a] F1: 325 F2: 1 413 F3: 2 433 [u] F1: 200 F2: 1 113 F3: 1 600		[i] F1: 400 F2: 1 450 F3: 2 475 [a] F1: 488 F2: 1 175 F3: 2 233 [u] F1: 425 F2: 1 225 F3: 2 150
Catalán Recasens (1986)	21 – 32 15 – 26		Oclusión: 12 – 18; 9 – 20 Abertura: 27 – 31; 26 – 38
Español (Peninsular) Quilis (1881)	20		Oclusión: 15 (3 oclusiones) Abertura: 18 (2 aberturas)	[i] F1: 368 F2: 1 246 [a] F1: 557 F2: 1 193 [u] F1: 332 F2: 948
Español (Argentina) de Manrique (1980)	10		Oclusión: 10 Abertura: 20	F1: 500 F2: 1 500 F3: 2 500

Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.

Representación

En el espectrograma

Presencia de una zona de baja energía sonora en el momento del cierre.

Presencia de formantes en el momento de la abertura.

Descenso de la frecuencia de F3 característico de las róticas.

Presencia de ruido de fricción (aperiódico) en las variantes fricativas.

En las variantes uvulares F3 y F4 aparecen muy próximos.

En las variantes dentales F3 aparece con una frecuencia alta.

Oscilograma y espectrograma de una consonante rótica múltiple [r] y de una consonante rótica simple [ɾ] del catalán.

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.

Correlación articulatoria – acústica

Cierre

El cierre del tracto vocal se manifiesta en una zona de energía sonora mínima.

Abertura

La abertura del tracto vocal tiene como resultado la presencia de formantes.

Fricción

La fricción en el tracto vocal provoca la presencia de energía aperiódica.

Características acústicas de las consonantes róticas

❯ Indicios acústicos en la percepción de las consonantes líquidas

Resumen

Características acústicas de los sonidos vocálicos y consonánticos en función de la fuente y el filtro.

de Manrique, A. M. B. (1980). Manual de fonética acústica. Buenos Aires: Hachette.

Correlatos acústicos de la sonoridad en las consonantes oclusivas y fricativas.

Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.

Características acústicas de las consonantes sonoras.

Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.

Correlatos acústicos espectrales del lugar de articulación de las consonantes.

Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.

❯ Indicios acústicos en la percepción del lugar de articulación

❯ Indicios acústicos en la percepción del modo de articulación

❯ Indicios acústicos en la percepción de la sonoridad

Características acústicas de los elementos segmentales

Las características acústicas de los elementos segmentales
Joaquim Llisterri, Universitat Autònoma de Barcelona

La pàgina va ser modificada per darrera vegada el

Características acústicas

Fuente periódica

Filtro oral fijo

Parámetros acústicos

Duración

Intensidad

Frecuencia fundamental (f0)

Duración intrínseca

Intensidad intrínseca

Representación

Vocales

En el espectro

Características articulatorias

Características acústicas

Fuente aperiódica impulsional

Filtro oral variable

Parámetros acústicos

Oclusión

Duración

Explosión

Duración

Frecuencia

Intensidad

Frecuencia de inicio

Dirección

Pendiente

Duración

Configuración espectral

Representación

En el espectrograma

Correlación articulatoria – acústica

Oclusión

Explosión

Transiciones de los formantes

Sonoridad

Aspiración

Características articulatorias

Características acústicas

Fuente

Filtro

Parámetros acústicos

Murmullo nasal

Formante nasal

Transiciones

Configuración espectral

Representación

En el espectrograma

Correlación articulatoria – acústica

Murmullo nasal

Oclusión

Transiciones de los formantes

Características articulatorias

Características acústicas

Sonidos aperiódicos continuos

Fuente

Filtro

Parámetros acústicos

Intensidad

Configuración espectral

Duración

Representación

En el espectrograma

Consonantes fricativas

Consonantes africadas

Consonantes aproximantes

Correlación articulatoria – acústica

Fuente aperiódica

Filtro

Fuente periódica

Características articulatorias

Características acústicas

Fuente

Filtro

Parámetros acústicos

Frecuencia de los formantes (F1, F2, F3)

Transiciones de los formantes

Configuración espectral

Duración

Representación

En el espectrograma

Frecuencia fundamental (f₀)