Las características acústicas de los elementos segmentales
❯ La clasificación articulatoria de las vocales
Las vocales son sonidos periódicos complejos producidos con resonancia en el tracto vocal.
Las vocales se producen generalmente con vibración de los pliegues vocales, por lo que presentan una fuente periódica.
En las vocales no se producen cambios en la forma del tracto vocal durante la articulación del sonido (filtro fijo) y el aire sale únicamente por la cavidad bucal (filtro oral).
La frecuencia de los tres primeros formantes distingue acústicamente las vocales entre sí.
Frecuencia de los tres primeros formantes de la vocal /æ/ del inglés en un espectrograma.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
Representación esquemática del primer y del segundo formante de las vocales del español chileno (Ruiz Mella y Soto-Barba, 2005) en un espectrograma.
Román, D. (s. f.). Caracterización acústica de las vocales del español. Materiales de estudio. http://domingo-roman.net/vocales_esp_caract_acustica.html
Valor medio de la frecuencia (en Hz) y desviación estándar del primer y del segundo formante de las vocales en una muestra de 16 hablantes masculinos de español.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
Valor medio de la frecuencia (en Hz) y desviación estándar del primer y del segundo formante de las vocales en una muestra de 6 hablantes femeninas de español.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
Valor medio de la frecuencia (en Hz) del tercer formante de las vocales en una muestra de 16 hablantes masculinos y 6 hablantes femeninas de español.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
Valores medios de la frecuencia (en Hz) de los cuatro primeros formantes de las vocales del catalán producidas aisladamente y en la secuencia [sVk] por seis hablantes y en secuencias CVC por tres hablantes. Las desviaciones típicas corresponden a contextos CVC simétricos.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Valores medios de la frecuencia (en Hz) de los dos primeros formantes de las vocales tónicas [e], [ɛ], [a], [ɔ] y [o] del catalán oriental comparados con los de otras lenguas románicas y con los del inglés.
Recasens, D. (2014). Fonètica i fonologia experimentals del català: vocals i consonants. Institut d’Estudis Catalans.
Valores medios de frecuencia (en Hz) de los tres primeros formantes de las vocales tónicas de los principales dialectos del catalán. Los datos corresponden a valores medios de repeticiones de realizaciones vocálicas en distintos contextos consonánticos por diferentes hablantes.
Recasens, D. (2014). Fonètica i fonologia experimentals del català: vocals i consonants. Institut d’Estudis Catalans.
La duración de las vocales viene condicionada por diferentes factores:
La amplitud (en términos acústicos) o la intensidad (en términos perceptivos) de las vocales puede verse afectada por diversos factores:
La frecuencia fundamental de las vocales viene modificada por distintos factores:
Duración propia de una vocal determinada por sus características fonéticas propias.
Las vocales abiertas presentan una duración intrínseca superior a la de las vocales cerradas.
La amplitud (en términos acústicos) o la intensidad (en términos perceptivos) propias de cada vocal viene determinada por sus características fonéticas.
Las vocales abiertas presentan una intensidad intrínseca superior a la de las vocales cerradas.
Existe una relación entre el grado de abertura de la vocal y la altura relativa de su frecuencia fundamental.
Las vocales cerradas presentan una frecuencia fundamental más elevada que las vocales abiertas.
En un espectrograma las vocales se caracterizan por unas bandas de frecuencia con una mayor intensidad correspondientes a los formantes.
Representación espectrográfica de las vocales del catalán. F1 indica el primer formante y F2 indica el segundo formante.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
En un espectrograma los diptongos se caracterizan por un movimiento continuo de los formantes desde la posición propia de la primera vocal del diptongo hasta la posición característica de la segunda vocal.
Representación espectrográfica de los diptongos [au̯] y [əu̯] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Representación espectrográfica de los diptongos [i̯ə] y [u̯ə] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
En un espectro los formantes de las vocales se muestran en forma de picos de intensidad situados a una frecuencia diferente para cada vocal.
Relación entre la representación espectrográfica y la representación espectral de las vocales [i] y [a] del catalán. Las líneas horizontales señalan la posición de los dos primeros formantes en el espectrograma y las verticales señalan la posición de los dos primeros formantes en el espectro.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Las vocales pueden representarse como puntos en un eje de coordenadas, situando la frecuencia del primer formante en el eje vertical y la frecuencia del segundo formante en el eje horizontal.
El resultado es un triángulo o trapecio que se corresponde con las características articulatorias si se representa la abertura de la mandíbula (o la posición vertical de la lengua) en el eje vertical y la localización de la constricción (o la posición horizontal de la lengua) en el eje horizontal.
Trapecio vocálico con los valores medios (en Hz) de F1 y F2 obtenidos a partir de una muestra de 16 hablantes masculinos (línea continua) y 6 hablantes femeninas (línea discontinua) de español.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
Trapecio vocálico con los valores medios (en Hz) de F1 y F2 obtenido a partir de una muestra de 16 hablantes masculinos (línea continua) y 6 hablantes femeninas (línea discontinua) de español, superpuesto a una representación esquemática del tracto vocal.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
Valores medios (en Hz) de los dos primeros formantes de las vocales representados en un trapecio vocálico obtenido a partir de una muestra de 16 hablantes masculinos y 6 hablantes femeninas de español.
Quilis, A. y Esgueva, M. (1983). Realización de los fonemas vocálicos españoles en posición fonética normal. En M. Esgueva y M. Cantarero (Eds.), Estudios de fonética I (pp. 137–252). Consejo Superior de Investigaciones Científicas.
El área o campo de dispersión es el espacio que se obtiene trazando una línea exterior a todos los puntos que representan realizaciones de una misma vocal.
Áreas de dispersión de las vocales del inglés obtenidas a partir de las producciones de 76 hablantes.
Peterson, G. E. y Barney, H. L. (1952). Control methods used in a study of the vowels. The Journal of the Acoustical Society of America, 24(2), 175–184. https://doi.org/10.1121/1.1906875
Áreas de dispersion de las vocales del español en función el contexto consonántico.
Guirao, M. y de Manrique, A. M. B. (1979). Spectral modifications of Spanish vowels by consonantal context [Manuscrito inédito]. Laboratorio de Investigaciones Sensoriales, CONICET y Universidad de Buenos Aires. Reproducido en de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Áreas de dispersión de las vocales del catalán pronunciadas por seis hablantes en posición aislada (izquierda) y en el contexto [sVk] (derecha).
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
La abertura de la mandíbula (o posición vertical de la lengua), la localización de la constricción (o posición horizontal de la lengua) y la disposición de los labios determinan la frecuencia de los formantes de las vocales.
Representación esquemática del primer y del segundo formante de las vocales del español chileno (Ruiz Mella y Soto-Barba, 2005) en un espectrograma.
Relación entre las características articulatorias y las características acústicas en el trapecio vocálico.
Relación entre las características articulatorias y las características acústicas de las vocales del español.
Fuente de las representaciones articulatorias: Quilis, A. (1993). Tratado de fonología y fonética españolas. Gredos.
Configuración del tracto vocal, espectro y espectrograma de la vocal [i].
Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica
Configuración del tracto vocal, espectro y espectrograma de la vocal [e].
Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica
Configuración del tracto vocal, espectro y espectrograma de la vocal [a].
Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica
Configuración del tracto vocal, espectro y espectrograma de la vocal [o].
Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica
Configuración del tracto vocal, espectro y espectrograma de la vocal [u].
Fuente de la imagen obtenida mediante resonancia magnética: Laboratori de Fonètica. (s. f.). Imatges de ressonància magnètica (IRM): vocalisme i consonantisme. Universitat de Girona. https://www.udg.edu/ca/aer/Laboratori-de-fonetica/Recursos/Imatges-de-Ressonancia-Magnetica
«Articulation |
Speech Wave |
Tongue fronted | F2-F1 large. |
a) Prepalatal position | F2 high, F3 maximally high. |
b) Midpalatal position | F2 maximally high and close to F3. |
Tongue retracted | F2-F1 small, F1 comparatively high. |
Mouth opening (including tongue section and lips) narrow | F1 low. |
Lips relatively close and protruded (small lip-opening area) | F1 + F2 + F3 lower than with a larger lip-opening and the same tongue articulation. A progressive lip closure alone causes a decrease in each of F1, F2, and F3 but with varying amounts depending on the particular tongue position. The effect on F3 in pronounced in case of prepalatal tongue positions.» |
Gunnar Fant (1919–2009) (Fuente de la imagen: TMH, Speech, Music and Hearing. (2016, 29 de abril). Gunnar Fant 1919–2009. KTH Royal Institute of Technology. https://www.speech.kth.se/gunnarfant/)
|
Características acústicas de la vocales
❯ Indicios acústicos en la percepción de las vocales
❯ Modo de articulación oclusivo
Las consonantes oclusivas son sonidos aperiódicos producidos con una fuente de ruido de naturaleza impulsional en el tracto vocal.
En las oclusivas sonoras la fuente aperiódica impulsional se combina con una fuente periódica.
La producción de las consonantes oclusivas requiere una fase de cierre u oclusión y otra de abertura o explosión, lo que implica un movimiento del tracto vocal (filtro variable). El aire sale únicamente por la cavidad bucal (filtro oral).
Durante la fase de oclusión o cierre se da una ausencia de energía acústica en las oclusivas sordas y la presencia de energía a baja frecuencia en las oclusivas sonoras.
La duración de la oclusión se situa entre los 50–150 ms.
La duración de la explosión es habitualmente menor de 50 ms.
La explosión presenta una mayor duración en las velares que en labiales o dentales y alveolares; puede ser mayor en las dentales y alveolares que en las labiales.
Duración (en ms) de la explosión en [p] (desviación típica entre paréntesis) |
Duración (en ms) de la explosión en [t] (desviación típica entre paréntesis) |
Duración (en ms) de la explosión en [k] (desviación típica entre paréntesis) |
|
Catalán Llisterri (1987) |
3,71 (2,1) | 6,71 (3,6) | 14,12 (8,8) |
Catalán Martí (1986) |
8,6 (0,5) | 13,6 (0,5) | 20,5 (2,4) |
Español Poch (1984) |
15,3 | 15,62 | 21,86 |
Francés Durand (1985) |
28,53 (5,6) 20,53 (9,2) |
31,46 (18,9) 33,33 (7,7) |
53,06 (18,63) 48,40 (12,17) |
Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Poch, D. (1984). Las oclusivas sordas del español: estudio acústico espectrográfico de las realizaciones intervocálicas en contacto con vocal acentuada [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Durand, P. (1985). Variabilité acoustique et invariance en français : consonnes occlusives et voyelles. Éditions du CNRS.
Concentración de la energía sonora en las frecuencias bajas en la labiales, concentración de la energía sonora en las frecuencias altas en las dentales y alveolares y concentración de la energía a la altura de la vocal adyacente o en un pico espectral de frecuencia media en las velares.
Menor intensidad en la explosión de las labiales que en la de las dentales, alveolares o velares; las alveolares presentan una explosión de mayor intensidad que las dentales.
Intervalo temporal entre la explosión y el inicio de la sonoridad de la vocal.
La duración del VOT aumenta a medida que la oclusión se desplaza hacia la parte posterior del tracto vocal.
El VOT presenta valores positivos en las consonantes sordas y negativos en las sonoras.
Representación del VOT negativo de una consonante sonora ([b]) y del VOT positivo de una consonante sorda ([t]) en el oscilograma y en el espectrograma.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Duración (en ms) del VOT de [p] (desviación típica entre paréntesis) |
Duración (en ms) del VOT de [t] (desviación típica entre paréntesis) |
Duración (en ms) del VOT de [k] (desviación típica entre paréntesis) |
|
Catalán Julià (1981) |
3 | 16 | 35 |
Catalán Martí (1986) |
10,2 (0,8) | 16,1 (1,1) | 26,1 (3,6) |
Catalán Recasens (1986) |
23 | 27 | 47 |
Catalán Llisterri (1987) |
11,75 (4) | 17,35 (7,4) | 28,37 (9,7) |
Español (Argentina) de Manrique (1980) |
10 | 15 | 25 |
Español (Peninsular) Poch (1984) |
17,18 | 19,75 | 29,01 |
Español (Puerto Rico) Flege y Eefting (1987) |
18 (5) | 22 (6) | 39 (7) |
Francés (Canadá) Caramazza et al. (1973) |
18 | 23 | 32 |
Francés (Europeo) Durand (1985) |
17,85 (14,5) | 25,17 (17,6) | 42,5 (14,5) |
Italiano Vagges et al. (1978) |
12 (6) | 17 (3) | 30 (10) |
Julià, J. (1981). Estudi contrastiu dels oclusius de l’anglès i el català: un experiment acústic. Estudi General, 1(2), 75–85. https://www.raco.cat/index.php/EstudiGral/article/view/43543
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Poch, D. (1984). Las oclusivas sordas del español: estudio acústico espectrográfico de las realizaciones intervocálicas en contacto con vocal acentuada [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
Flege, J. E. y Eefting, W. (1987). Imitation of a VOT continuum by native speakers of English and Spanish: Evidence for phonetic category formation. The Journal of the Acoustical Society of America, 83(2), 729–740. https://doi.org/10.1121/1.396115
Caramazza, A., Yeni-Komshian, G. H., Zuriff, Z. y Carbone, E. (1973). The acquisition of a new phonological contrast: The case of stop consonants in French-English bilinguals. The Journal of the Acoustical Society of America, 54(2), 421–428. https://doi.org/10.1121/1.1913594
Durand, P. (1985). Variabilité acoustique et invariance en français : consonnes occlusives et voyelles. Éditions du CNRS.
Vagges, K., Ferrero, F., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.
Para una misma zona de articulación, la frecuencia de inicio de las transiciones de los formantes depende de la vocal adyacente.
La dirección de las transiciones de los formantes depende de la zona de articulación de la oclusiva y de la vocal adyacente.
Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de la vocal central [a] en catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de vocal anterior [i] en catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones del segundo formante de las consonantes oclusivas sordas seguidas de vocal posterior [u] en catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones del segundo formante de la consonante oclusiva sorda [t] en contacto con vocal anterior ([i]) y con vocal posterior ([u]) en catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
La pendiente de las transiciones de los formantes (en inglés, slope) depende de factores como el grado de coarticulación.
La duración de las transiciones de los formantes depende de la oclusiva y de factores como la velocidad de elocución.
Oscila entre 30 y 100 ms en las oclusivas sordas.
Varía entre 80 y 150 ms en las oclusivas sonoras.
Duración (en ms) de las transiciones de [p] (desviación típica entre paréntesis) |
Duración (en ms) de las transiciones de [t] (desviación típica entre paréntesis) |
Duración (en ms) de las transiciones de [k] (desviación típica entre paréntesis) |
|
Catalán Martí (1986) |
F1: 17,5 (2,2) F2: 26,5 (6,5) F3: 23 (4,1) Media 22,33 |
F1: 21,87 (3,3) F2: 30,6 (9,1) F3: 22,5 (7) Media 24,99 |
F1: 25,5 (3,2) F2: 32,1 (11,1) F3: 35,1 (9,9) Media 30,9 |
Catalán Llisterri (1987) |
F1: 14,4 (8,2) F2: 20,8 (4,9) F3: 32,2 (13,16) Media 19,46 (4,4) |
F1: 18,8 (8,8) F2: 25,1 (12,1) F3: 19,7 (9,2) Media 19,6 (9,8) |
F1: 25,6 (9) F2: 24,8 (6,5) F3: 23,6 (8,9) Media 24,66 (5,5) |
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Llisterri, J. (1987). Anàlisi, síntesi i percepció de grups oclusiu-vocal del català: contribució a l’estudi dels correlats acústics del lloc d’articulació [Tesis doctoral inédita]. Universitat Autònoma de Barcelona.
La configuración espectral de las consonantes oclusivas puede estudiarse a partir del espectro obtenido en los 10–20 ms que siguen a la explosión.
Oscilogramas y espectros de la explosión de las consonantes oclusivas sonoras [b], [d] y [ɡ] seguidas de la vocal [a] en inglés.
Stevens, K. N. y Blumstein, S. E. (1978). Invariant cues for place of articulation in stop consonants. The Journal of the Acoustical Society of America, 64(5), 1358–1368. https://doi.org/10.1121/1.382102
Espectro difuso-descendente en las labiales.
Espectros de consonantes oclusivas labiales sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.
Blumstein, S. E. y Stevens, K. N. (1979). Acoustic invariance in speech production: Evidence from measurements of the spectral characteristics of stop consonants. The Journal of the Acoustical Society of America, 66(4), 1001–1017. https://doi.org/10.1121/1.383319
Espectro difuso y ascendente en las alveolares.
Espectros de consonantes oclusivas alveolares sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.
Blumstein, S. E. y Stevens, K. N. (1979). Acoustic invariance in speech production: Evidence from measurements of the spectral characteristics of stop consonants. The Journal of the Acoustical Society of America, 66(4), 1001–1017. https://doi.org/10.1121/1.383319
Espectro compacto en las velares.
Espectros de consonantes oclusivas velares sordas y sonoras seguidas de diferentes vocales y producidas por distintos hablantes de inglés.
Blumstein, S. E. y Stevens, K. N. (1979). Acoustic invariance in speech production: Evidence from measurements of the spectral characteristics of stop consonants. The Journal of the Acoustical Society of America, 66(4), 1001–1017. https://doi.org/10.1121/1.383319
En las consonantes oclusivas sordas la fase de oclusión (en inglés, stop gap) se visualiza en el espectrograma en forma de energía acústica de intensidad muy baja o de intensidad nula.
Oscilograma y espectrograma de la palabra inglesa buttercup; las flechas indican las consonantes oclusivas sordas.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
En las oclusivas sonoras se observa energía acústica de baja frecuencia, que en el espectrograma se manifiesta como lo que se denomina ‘barra de sonoridad’ (en inglés, voice bar).
Oscilograma y espectrograma de la palabra inglesa raggedy; los intervalos marcados con G indican las consonantes oclusivas sonoras.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
Las oclusivas aspiradas muestran una zona de energía aperiódica de intensidad débil en el espectrograma.
La fase de explosión de las oclusivas se observa en el espectrograma en forma de energía aperiódica correspondiente al ruido de explosión (en inglés, burst o transient).
Oscilograma y espectrograma de las sílabas /pɑ/, /tɑ/ y /kɑ/ en inglés con la indicación de la envolvente espectral del ruido de explosión de cada consonante oclusiva.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
Oscilograma y espectrograma de la palabra catalana bata [batə] en el que se muestran las barras de explosión de las dos consonantes oclusivas, la barra de sonorida de [b] y la oclusión de [t].
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones formánticas.
Transiciones de los tres primeros formantes en las consonantes oclusivas sonoras seguidas de una vocal central.
Kent, R. D. y Read, C. (2002). The acoustic analysis of speech (2.a ed.). Singular / Thomson Learning.
La fase de oclusión (cierre de los articuladores) se manifiesta acústicamente como un intervalo de energía acústica mínima.
La fase de explosión (salida del aire retenido por el cierre de los articulacores) se manifiesta acústicament como un ruido transitorio.
La distribución frecuencial del ruido de explosión depende del lugar de articulación de la consonante y las cavidades que éste determina.
Las transiciones de los formantes reflejan el movimiento del tracto vocal desde la configuración articulatoria de la consonante a la de la vocal.
El punto de inicio, la dirección y la pendiente de las transiciones de los formantes dependen de la zona de articulación de la consonante —es decir, de la zona en la que se produce la constricción— y de la vocal adyacente.
La sonoridad se manifiesta acústicamente en forma de energía sonora periódica a bajas frecuencias durante la producción de la consonante.
La aspiración se manifiesta acústicamente en forma de energía sonora aperiódica que aparece después de la oclusión y antes de la vocal.
Características acústicas de las consonantes oclusivas orales
❯ Indicios acústicos en la percepción de las consonantes oclusivas orales
Sonidos periódicos complejos producidos con resonancia en la cavidad bucal (o cavidad oral) y en la cavidad nasal.
En las consonantes nasales la fuente periódica se superpone a una fuente aperiódica impulsional.
En las consonantes nasales un filtro oral variable (la cavidad oral) se acopla a un filtro nasal fijo (cavidad nasal).
El murmullo nasal (en inglés, nasal murmur) es un segmento acústico asociado a la energía sonora resultante de la resonancia en la cavidad nasal.
Presenta una estructura formántica con polos (formantes) y ceros (antiformantes).
Los formantes se caracterizan por una gran amplitud de banda y una notable densidad en el espectro.
La estructura formántica del murmullo nasal se relaciona con la zona de articulación de la consonante, aunque existen similaridades notables (N1 = 150–200 Hz; N2 = 1 000–1 600 Hz; N3 = 1 750–2 500 Hz; N4 = 3 000 Hz).
Frecuencia (en Hz) de los formantes de [m] (desviación típica entre paréntesis) |
Frecuencia (en Hz) de los formantes de [n] (desviación típica entre paréntesis) |
Frecuencia (en Hz) de los formantes de [ɲ] (desviación típica entre paréntesis) |
Frecuencia (en Hz) de los formantes de [ŋ] (desviación típica entre paréntesis) |
|
Catalán Recasens (1986) |
N1: 190 N2: 1 165 N3: 2 122 N4: 2 954 |
N1: 199 N2: 1 468 N3: 2 178 N4: 2 788 |
N1: 194 N2: 1 323 N2: 1 583 N3: 2 196 N3: 2 498 N4: 3 202 N4: 3 285 |
N1: 207 N2: 1 220 N3: 2 203 N4: 2 282 N4: 2 956 |
Catalán Martí (1986) |
N1: 250 N2: 990 N3: 2 000 |
N1: 260 N2: 1 020 N3: 2 380 |
N1: 280 N2: 1 070 N3: 2 120 |
|
Español Quilis (1981) |
N1: 270 N2: 1 020 N3: 1 990 |
N1: 361 N2: 1 400 N3: 2 372 |
N1: 292 N2: 1 630 N3: 2 420 |
|
Italiano Vagges et al. (1978) |
N1: 265 (46) N2: 1 165 (147) N3: 2 290 (146) |
N1: 310 (73) N2: 1 410 (126) |
N1: 305 (46) N2: 2 145 (99) |
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.
Pico espectral de intensidad considerable y de baja frecuencia (300 Hz) que aparece en el murmullo nasal; es común a todas las consonantes nasales.
Las transiciones de las consonantes oclusivas nasales se comportan como las transiciones de las oclusivas orales homorgánicas.
En las consonantes nasales se da una transición abrupta entre la nasal y la vocal adyacente.
La configuración espectral de las consonantes oclusivas nasales presenta características análogas a la de las oclusivas orales homorgánicas.
Murmullo nasal: energía sonora periódica de baja intensidad que presenta una estructura formántica con un primer formante relativamente intenso.
Representación en el espectrograma de los formantes nasales (murmullos nasales) de la consonante nasal bilabial en la palabra catalana ama.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones formánticas.
Transiciones formánticas de las consonantes nasales en las secuencias [amə], [anə] y [aɲə] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
El murmullo nasal es la consecuencia de la abertura del paso del aire hacia la cavidad nasal por la acción del velo del paladar.
La oclusión en la cavidad oral tiene un efecto relativos en la estructura espectral del del murmullo nasal.
El movimiento del tracto vocal desde la configuración articulatoria de la consonante a la de la vocal y la subida del velo del paladar se manifiestan acústicamente en forma de transiciones abruptas de los formantes.
Características acústicas de las consonantes oclusivas nasales
❯ Indicios acústicos en la percepción de las consonantes oclusivas nasales
❯ Modo de articulación fricativo
Las consonantes fricativas son sonidos de naturaleza aperiódica continua.
La fuente de las consonantes fricativas sordas es aperiódica continua.
En las consonantes fricativas sonoras se da simultáneamente una fuente aperiódica en el tracto vocal y una fuente periódica en la glotis.
Las consonantes fricativas se producen con un filtro oral fijo, ya que no se dan cambios en la forma del tracto bucal durante la producción del sonido.
En función de la intensidad puede establecerse una diferencia entre las fricativas estridentes (o sibilantes), que presentan mayor energía sonora, y las fricativas no estridentes (o no sibilantes), que presentan una menor energía sonora.
Las fricativas sonoras presentan una mayor energía sonora que las sordas.
Alveolares: concentración de la energía sonora por encima de los 4 000 Hz.
Palatales: concentración de la energía sonora por encima de los 3 000 Hz.
Las fricativas no estridentes (labiodentales, dentales, interdentales y glotales) presentan un espectro plano y difuso.
[f] | [θ] | [s] | [z] | [ʃ] | [ʒ] | [x] | |
Catalán Martí (1986) |
Banda entre 500 y 10 000 Hz | F1: 1 695 Hz F2: 2 577 Hz F3: 3 619 Hz |
F1: 1 592 Hz F2: 2 275 Hz F3: 3 694 Hz |
F1: 2 061 Hz F2: 2 692 Hz F3: 3 618 Hz |
F1: 2 022 Hz F2: 2 680 Hz F3: 3 515 Hz |
||
Español (Peninsular) Quilis (1981) |
Límite inferior: 2 100 Hz | Límite inferior: 2 400 – 6 400 Hz | Límite inferior: 2 511 – 3 888 Hz F1: 3 483 – 5 670 F2: 4 455 |
||||
Español (Argentina) de Manrique (1980) |
Banda entre 1 000 y 11 000 Hz F1: 1 500 Hz F2: 8 500 Hz |
Banda entre 2 000 y 12 000 Hz F1: 4 000 – 6 500 Hz F2: 7 500 – 9 500 Hz |
Banda entre 2 000 y 12 000 Hz F1: 2 500 Hz F2: 5 000 Hz |
Banda entre 1 500 y 10 000 Hz F1: 2 500 – 3 500 Hz F2: 5 500 Hz |
Banda estrecha de baja frecuencia F2: de la vocal [o u a] F3: de la vocal [e i] |
||
Italiano Vagges et al. (1978) |
Límite inferior: 2 200 Hz | Límite inferior: 4 300 Hz | Límite inferior: 5 080 Hz | Límite inferior: 1 925 Hz |
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.
La duración de las fricativas está influenciada por el contexto fonético de la consonante, por su posición en el enunciado y por la velocidad de elocución.
Aumenta en el orden siguiente: dentales, labiales, alveolares y palatales.
La duración de la energía aperiódica en las fricativas sordas tiende a ser mayor que en las sonoras.
Energía aperiódica en las frecuencias altas.
Presencia de energía aperiódica en las frecuencias bajas en las sonoras.
Transiciones formánticas desde y hasta las vocales adyacentes.
Oscilograma y espectrograma de una consonante fricativa alveolar sorda [s] y de una consonante fricativa alveolar sonora [z] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Oscilograma y espectrograma de una consonante africada palatal sorda [t͡ʃ) y de una consonante africada palatal sonora [d͡ʒ] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Oscilograma y espectrograma de una consonante aproximante bilabial [β̞] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
Transiciones del segundo formante en las consonantes aproximantes bilabial [β̞], dental [ð̞] y velar [ɣ̞] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
El paso del aire por una constricción estrecha en el tracto vocal tiene como resultado una turbulencia que se manifiesta en energía sonora aperiódica.
Las propiedades del filtro de las consonantes fricativas vienen determinadas por el lugar en el que se realiza la constricción; en función de la zona de articulación se encuentran diferentes configuraciones espectrales.
La vibración de los pliegues vocales en las fricativas sonoras se traduce en una fuente periódica superpuesta a una fuente aperiódica.
Características acústicas de las consonantes fricativas
❯ Indicios acústicos en la percepción de las consonantes fricativas
❯ Modo de articulación lateral
Sonidos periódicos complejos producidos con resonancia en el tracto vocal.
Fuente aperiódica combinada con una fuente aperiódica continua.
Las consonantes laterales se producen con un filtro oral fijo, ya que su articulación se lleva a cabo en la cavidad bucal y sin que varíe la forma de la cavidad durante la consonante.
La frecuencia de los formantes de las consonantes laterales depende, en gran medida, de la de los formantes de las vocales adyacentes.
F1 se encuentra a la altura del F1 de la vocal adyacente.
F3 se encuentra a la altura del F3 la vocal adyacente con vocales anteriores.
Frecuencia (en Hz) de los formantes de [l] (desviación típica entre paréntesis) |
Frecuencia (en Hz) de los formantes de [ʎ] (desviación típica entre paréntesis) |
|
Catalán Martí (1986) |
F1: 354 F2: 940 F3: 2 427 |
F1: 244 F2: 1 877 F3: 2 202 |
Catalán Recasens (1984) |
F1: 319 (104) F2: 1 075 (217) F3: 3 292 (247) Z1 1 469 Z2 2 710 |
F1: 229 (36) F2: 1 988 (136) F3: 2 678 (252) Z1 1 011 Z2 2 407 |
Español (Peninsular) Quilis et al. (1979) |
F1: 328 F2: 1 561 F3: 2 587 |
F1: 291 F2: 2 060 F3: 2 661 |
Español (Argentina) de Manrique (1980) |
F1: 400 F2: 1 400 – 2 000 F3: 2 500 (300) |
|
Francés Chafcouloff (1980) |
F1: 379 F2: 1 656 F3: 2 354 |
|
Italiano Vagges et al. (1978) |
F1: 500 (59) F2: 1 165 (86) F3: 2 570 (93) |
F1: 280 (46) F2: 2 010 (286) F3: 3 155 (273) |
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1984). Producció i coarticulació de vocals i consonants del català en el decurs [Tesis doctoral inédita]. Universitat de Barcelona.
Quilis, A., Esgueva, M., Gutiérrez Araus, M. L. y Cantarero, M. (1979). Características acústicas de las consonantes laterales españolas. Lingüística Española Actual, 1(2), 233–343.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Buenos Aires: Hachette.
Chafcouloff, M. (1980). Les caractéristiques acoustiques de /j,y,w,l,r/ en français. Travaux de l’Institut de Phonétique d’Aix, 7, 7–56.
Vagges, K., Ferrero, F. E., Magno Caldognetto, E. y Lavagnoli, C. (1978). Some acoustic characteristics of Italian consonants. Journal of Italian Linguistics, 3(1), 69–85.
Las transiciones de los formantes de las laterales dependen de la zona de articulación de la consonante y de las vocales adyacentes.
Transiciones rápidas de F1 (10 ms).
Transiciones más lentas de F2 y F3 (60 – 70 ms).
En el espectro de las consonantes laterales se observa la presencia de un cero espectral (antiformante, Z) con una frecuencia de 1800 – 2100 Hz.
Las consonantes laterales presentan una duración mínima de 50 – 60 ms.
En el espectrograma las consonantes laterales muestran una estructura con formantes de una intensidad más baja que la de los formantes de las vocales adyacentes.
Oscilograma y espectrograma de una consonante lateral velarizada [ɫ] y de una consonante lateral palatal [ʎ] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
El volumen de la cavidad anterior y posterior al punto de constricción determina la estructura formántica de las consonantes laterales.
Velarización: aumento del volumen de la cavidad posterior al punto de constricción alveolar que conlleva una disminución de la frecuencia del segundo formante y disminución del volumen de la cavidad posterior al punto de constricción velar que produce un aumento de la frecuencia del primer formante y una disminución de la frecuencia del tercer formante.
La salida del aire por los lados de la cavidad bucalpuede resultar en la presencia de un cierto ruido de fricción.
Características acústicas de las consonantes laterales
❯ Indicios acústicos en la percepción de las consonantes líquidas
Las consonantes róticas son sonidos periódicos complejos producidos con resonancia en el tracto vocal.
Presentan una fuente periódica que puede darse simultáneamente con una fuente aperiódica continua o impulsional en el tracto vocal.
Las consonantes róticas se producen con un filtro oral variable, ya que su articulación implica un movimiento de los articuladores.
La frecuencia de los formantes de las consonantes róticas depende estrechamente de la de los formantes de las vocales adyacentes.
Transiciones cortas de F1 y transiciones de duración variable (50 – 300 ms) de F2 y F3 en las alveolares.
2 – 3 vibraciones en las róticas múltiples.
4 – 6 vibraciones en las uvulares.
50 – 60 ms en las aproximantes.
20 ms en las róticas múltiples.
Las consonantes róticas presentan una reducción de la intensidad respecto a las vocales adyacentes.
[ɾ] Duración (en ms) |
[ɾ] Frecuencia de los formantes (en Hz) |
[r] Duración (en ms) |
[r] Frecuencia de los formantes (en Hz) |
|
Catalán Martí (1986) |
[i] F1: 262 F2: 1 537 F3: 2 300 [a] F1: 325 F2: 1 413 F3: 2 433 [u] F1: 200 F2: 1 113 F3: 1 600 |
[i] F1: 400 F2: 1 450 F3: 2 475 [a] F1: 488 F2: 1 175 F3: 2 233 [u] F1: 425 F2: 1 225 F3: 2 150 |
||
Catalán Recasens (1986) |
21 – 32 15 – 26 |
Oclusión: 12 – 18; 9 – 20 Abertura: 27 – 31; 26 – 38 |
||
Español (Peninsular) Quilis (1881) |
20 | Oclusión: 15 (3 oclusiones) Abertura: 18 (2 aberturas) |
[i] F1: 368 F2: 1 246 [a] F1: 557 F2: 1 193 [u] F1: 332 F2: 948 |
|
Español (Argentina) de Manrique (1980) |
10 | Oclusión: 10 Abertura: 20 |
F1: 500 F2: 1 500 F3: 2 500 |
Martí, J. (1986). Estudi acústic del català i síntesi automàtica per ordinador [Tesis doctoral inédita]. Universitat de València.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Publicacions de l’Abadia de Montserrat.
Quilis, A. (1981). Fonética acústica de la lengua española. Gredos.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Hachette.
Presencia de una zona de baja energía sonora en el momento del cierre.
Presencia de formantes en el momento de la abertura.
Descenso de la frecuencia de F3 característico de las róticas.
Presencia de ruido de fricción (aperiódico) en las variantes fricativas.
En las variantes uvulares F3 y F4 aparecen muy próximos.
En las variantes dentales F3 aparece con una frecuencia alta.
Oscilograma y espectrograma de una consonante rótica múltiple [r] y de una consonante rótica simple [ɾ] del catalán.
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Coord.), Psicologia del llenguatge. (pp. 35–114). Editorial UOC.
El cierre del tracto vocal se manifiesta en una zona de energía sonora mínima.
La abertura del tracto vocal tiene como resultado la presencia de formantes.
La fricción en el tracto vocal provoca la presencia de energía aperiódica.
Características acústicas de las consonantes róticas
❯ Indicios acústicos en la percepción de las consonantes líquidas
Características acústicas de los sonidos vocálicos y consonánticos en función de la fuente y el filtro.
de Manrique, A. M. B. (1980). Manual de fonética acústica. Buenos Aires: Hachette.
Correlatos acústicos de la sonoridad en las consonantes oclusivas y fricativas.
Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.
Características acústicas de las consonantes sonoras.
Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.
Correlatos acústicos espectrales del lugar de articulación de las consonantes.
Pickett, J. M. (1980). The sounds of speech communication: A primer of acoustic phonetics and speech perception. PRO-ED.
❯ Indicios acústicos en la percepción del lugar de articulación
❯ Indicios acústicos en la percepción del modo de articulación
❯ Indicios acústicos en la percepción de la sonoridad
Características acústicas de los elementos segmentales