SciELO - Scientific Electronic Library Online

 
vol.41 número1Preferencias psicoterapéuticas: versión argentina de las escalas PEX-1 y C-NIP-v1.1Construcción y validación de la Escala de problemas sociales en población chilena índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista de Psicología (PUCP)

versión On-line ISSN 0254-9247

Revista de Psicología vol.41 no.1 Lima ene./jun. 2023  Epub 15-Feb-2023

http://dx.doi.org/10.18800/psico.202301.016 

Artículos

Medición del apuntamiento en variables en escala nominal

Measurement of peakedness in variables on nominal scale

Medição de afilamento em variáveis na escala nominal

Mesure de l’acuité dans les variables sur échelle nominale

José Moral de la Rubia1 
http://orcid.org/0000-0003-1856-1458

1Universidad Autónoma de Nuevo León - México, jose_moral@hotmail.com

Resumen

El objetivo de este estudio metodológico es definir y desarrollar una medida de apuntamiento cualitativo y comprobar su validez. Se generaron 120 distribuciones cualitativas desde distribuciones binomiales. La curtosis percentílica y el promedio de cinco jueces al evaluar visualmente grado de apuntamiento se usaron como criterios de validez. Se definió apuntamiento como la saliencia del pico entre los hombros. Desde las frecuencias de las categorías nominales, se precisó cómo trazar un diagrama de barras y medir la distancia del pico a los hombros. La estadística mostró un comportamiento ajustado a las expectativas. Su correlación con apuntamiento promedio interjuez fue de .87 y con curtosis percentílica -.38. Se concluye que un concepto de apuntamiento cualitativo se puede definir y medir confiablemente.

Palabras clave: forma de la distribución; apuntamiento; curtosis; variable cualitativa; estadística descriptiva

Abstract

The objective of this methodological study is to define and develop a qualitative peakedness measure and to test its validity. One hundred twenty qualitative distributions were generated from binomial distributions. The percentile kurtosis and the average of five judges when visually assessing the degree of peakedness were used as validity criteria. Peakedness was defined as the standout of the peak between the shoulders. From the frequencies of the nominal categories, it was specified how to chart a bar diagram and measure the distance from the peak to the shoulders. The statistic showed a behavior adjusted to expectations. Its correlation with average inter-judge peakedness was .87 and with percentile kurtosis −.38. It is concluded that a concept of qualitative peakedness can be defined and measured reliably.

Keywords: distribution shape; peakedness; kurtosis; qualitative variable; descriptive statistics

Resumo

O objetivo deste estudo metodológico é definir e desenvolver uma medida de afilamento qualitativo e verificar sua validade. 120 distribuições qualitativas foram geradas a partir de distribuições binomiais. A curtose percentil e a média de cinco juízes na avaliação visual do grau de afilamento foram utilizadas como critérios de validade. Afilamento foi definida como a saliência do pico entre os ombros. A partir das frequências das categorias nominais, foi especificado como traçar um diagrama de barras e medir a distância do pico aos ombros. A estatística mostrou um comportamento ajustado às expectativas. Sua correlação com afilamento médio entre juízes foi de .87 e com curtose percentil −.38. Conclui-se que um conceito de afilamento qualitativo pode ser definido e mensurado de forma confiável.

Palavras-chave: forma de distribuição; afilamento; curtose; variável qualitativa; estatística descritiva

Résumé

L’objectif de cette étude méthodologique est de définir et de développer une mesure de l’acuité qualitative et d’en vérifier la validité. 120 distributions qualitatives ont été générées à partir de distributions binomiales. La kurtosis percentile et la moyenne de cinq juges lors de l’évaluation visuelle du degré d’acuité ont été utilisées comme critères de validité. L’acuité était définie comme la saillie du pic entre les épaules. A partir des fréquences des catégories nominales, il a été précisé comment tracer un diagramme à barres et mesurer la distance du pic aux épaules. La statistique a montré un comportement ajusté aux attentes. Sa corrélation avec l’acuité moyen inter-juges était de .87 et avec la kurtosis percentile de −.38. Il est conclu qu’un concept d’acuité qualitative peut être défini et mesuré de manière fiable.

Mots clés: forme de distribution; acuité; kurtosis; variable qualitative; statistiques descriptives

Curtosis

Al describir la forma de una distribución desde su representación gráfica en un histograma (distribución continua) o diagrama de barras (discreta), se distinguen el pico, dos hombros (izquierdo y derecho) y dos colas (izquierda y derecha). El pico es el valor modal o más frecuente de la distribución. Corresponde al punto en el eje de abscisas (valores de X) donde la gráfica alcanza su máximo en el eje de ordenadas (frecuencias o probabilidades simples). El hombro izquierdo se puede definir como el área comprendida entre la puntuación a una desviación estándar por debajo de la media aritmética y la media aritmética. Esta definición se usa, sobre todo, con la distribución normal (Wahab et al., 2017). Otra definición alternativa se basa en estadísticas de orden. Bajo esta definición, el hombro derecho es el área entre el percentil 25, 20 o 10 y el percentil 50 (Alzaatreh & Sulieman, 2021). Por su parte, el hombro derecho se puede definir como el área entre la media aritmética y la puntuación a una desviación estándar por encima de la media aritmética; a su vez, con base en estadísticas de orden, como el área entre el percentil 50 y el percentil 75, 80 o 90. La cola izquierda es el área entre el hombro izquierdo y el valor mínimo que puede ser asintótico al eje de abscisas; asimismo, la cola derecha es el área entre el hombro derecho y el valor máximo que también puede ser asintótico al eje de abscisas. Si el valor mínimo o máximo queda en el área del hombro, no hay cola izquierda en el primer caso o derecha en el segundo.

El término curtosis es un neologismo que significa arqueamiento y fue introducido por Pearson en 1905 (Fiori & Zenga, 2009). La medida de curtosis basada en el cuarto momento central estandarizado (β 2 a nivel poblacional y b 2 a nivel muestral) procede de uno de los cuatro parámetros del sistema de distribuciones continuas de Pearson (Celikoglu & Tirnakli, 2018). Este autor británico, fundador de la estadística matemática, interpreta la curtosis como un índice de curvatura o grado en que el perfil curvo de la distribución se estrecha hacia una aguja (valores más altos) o se amplía hacia un semicírculo o un rectángulo (valores más bajos). Toma como modelo la distribución normal y, en función de su valor poblacional (β 2 = 3), centra la medida de la curtosis (Β 2 = β 2 −3) en 0, a lo que denomina exceso de curtosis (McAlevey & Stent, 2018).

Otra opción a los momentos centrales es usar cumulantes (γ 2 a nivel poblacional y g 2 a nivel muestral), lo que proporciona resultados muy semejantes a Β 2 , ya que los cumulantes se pueden expresar como momentos centrales (McAlevey & Stent, 2018). Una tercera opción es una proporción de combinaciones lineales de estadísticas de orden (L-momentos estandarizados), como la curtosis percentílica, que no requiere momentos finitos y es más robusta ante asimetría (Bastianin, 2020).

Darlington (1970) fue uno de los primeros autores en señalar que el coeficiente de curtosis β 2 basado en el cuarto momento central estandarizado más que medir apuntamiento evalúa cuán pesadas son las colas con respecto a los hombros. Moors (1986) retoma este señalamiento e indica que β 2 equivale a la varianza de las puntuaciones estandarizadas elevadas al cuadrado más uno. Consecuentemente, habla de la variabilidad de las puntuaciones que se alejan de los hombros. Una mayor curtosis indica mayor variabilidad o peso de las colas. Balanda y MacGillivray (1988), tras una revisión crítica del concepto de curtosis, concluyen que abarca tanto aspectos de curvatura y apuntamiento como pesadez de las colas. Definen el coeficiente β 2 como una medida libre de posición y escala que cuantifica el movimiento de la masa o densidad de probabilidad desde los hombros hacia las colas. Si la caída en los hombros es abrupta, desplazándose una gran cantidad de masa hacia las colas, entonces la distribución presenta leptocurtosis. Por el contrario, cuando la caída en los hombros es suave, desplazándose poca masa hacia las colas, hay platicurtosis. Westfall (2014) remarca que es un error interpretar la curtosis en términos de apuntamiento; cuando debe entenderse en términos de extremosidad de las colas.

La presencia de asimetría con una cola pesada y otra adelgazada dificulta la interpretación de la curtosis. En este caso, los índices basados en momentos y los basados en percentiles suelen diferir en sus conclusiones (Bastianin, 2020). Cabe señalar que la presencia de una moda en cada extremo de la distribución, como al medirse una actitud en una sociedad polarizada con respecto al objeto actitudinal, genera platicurtosis, ya que hace a las colas muy pesadas (Darlington, 1970; Westfall, 2014). No obstante, interpretar la curtosis como un indicador de bimodalidad, como sugirió Darlington (1970), es un error, ya que no se requiere valores modales en las colas para baja curtosis, β < 3, incluso hay distribuciones con dos modas en la zona de los hombros que tienen curtosis media, β = 3, o alta, β > 3 (Westfall, 2014). Todo esto hace que las medidas de curtosis sean confusas en su interpretación (McAlevey & Stent, 2018).

Apuntamiento

Un concepto alternativo al de curtosis es el de apuntamiento (Horn, 1983). En una distribución unimodal, simétrica y centrada en su moda, se refiere a cuan delgada es la zona de los hombros y, por ende, cuan definido está el pico. Una distribución con alto apuntamiento presenta un pico muy prominente en la zona de los hombros (alto y angosto), como se observa en la distribución de Laplace (Ribeiro-Reis, 2021). Por el contrario, una distribución con bajo apuntamiento muestra un pico poco destacado en la zona de los hombros, como la distribución normal. En un sentido más amplio, se refiere a cuan definido está el pico de la distribución en términos de altura y estrechamiento hacia su punta (Westfall, 2014). Para su medición, en una distribución continua, unimodal, simétrica y centrada en 0, Horn (1983) propuso el complemento de la proporción entre el área bajo la curva de la función de densidad entre los percentiles 50 y 75 (numerador) y el área rectangular definida por la altura de la moda (centrada en 0) y la longitud o distancia entre los percentiles 50 y 75 (denominador). Esta estadística requiere unos hombros en el rango intercuartílico para evitar desvirtuarse por efecto de la elongación de las colas. Así, si se toman cuantiles de orden de .83 o mayor, la medida inadecuadamente indica que la distribución de Cauchy tiene mayor apuntamiento que la de Laplace por efecto de las colas (Horn, 1983).

Otra medida del apuntamiento, aunque indirecta, es la curtosis percentílica. Esta medida se basa en el cociente entre el rango semiintercuartílico y el rango percentílico, esto es, la proporción que la semidistancia entre los cuartiles superior e inferior representa dentro de la distancia entre los deciles superior e inferior. Un valor pequeño en esta proporción evidencia una distancia corta entre los datos de la zona central (hombros) y, consecuentemente, apuntamiento y leptocurtosis (Kelley, 1923). Por el contrario, un valor grande en dicha proporción muestra una distancia larga en los valores centrales, ya sea por baja frecuencia y aplanamiento, como en la distribución uniforme, o por una depresión en los valores más centrales con una progresiva elevación hacia las colas, como en la distribución arcoseno.

Cabe señalar que las medidas de curtosis y apuntamiento se usan con distribuciones de variables continuas, incluso se aplican con distribuciones de variables cuantitativas discretas y ordinales, pero no así con variables cualitativas (Aytaçoglu & Sazak, 2017), al igual que ocurre con las medidas de asimetría (Gupta & Kapoor, 2020). No obstante, recientemente se ha propuesto una medida de asimetría para variables cualitativas y, desde su planteamiento, se ha sugerido que sería posible desarrollar un concepto y medida de apuntamiento para este tipo de variables (Moral, 2022).

Asimetría cualitativa

Existe simetría cuando una parte de la distribución es reflejo de la otra en relación con un eje central o de simetría. Desde la propuesta de Moral (2022), se requiere elaborar un diagrama de barras para medir y definir asimetría cualitativa. Aunque las categorías nominales carecen de información intrínseca que permita su ordenamiento, poseen información extrínseca, la frecuencia, que sí lo permite. Al disponer las categorías nominales en su orden de frecuencia, no interesa un ordenamiento ascendente o descendente, pues esto no facilita observar gráficamente la simetría. Interesa un ordenamiento que lleve a un perfil triangular, si la moda es única; trapezoidal, si hay dos o múltiples modas; o rectangular, si no hay moda (distribución uniforme). Para tal fin, se ubica en el centro una categoría de frecuencia máxima cuando el número de categorías k es impar o dos de las categorías con frecuencia máxima cuando k es par. Emparejadas las categorías por proximidad de frecuencia, se colocan los miembros de cada par a izquierda y a derecha de este centro, a la izquierda la categoría con más frecuencia del par y a la derecha la categoría con menos frecuencia del par. Los pares con frecuencias más altas quedan más cerca del centro y los pares con las frecuencias más bajas aparecen más alejados del centro. Si solo hay dos categorías, se ubica en primer orden la más alta y, en segundo orden, la más baja. De este modo, el diagrama permite visualizar si hay simetría o no.

La distribución de la variable cualitativa se puede considerar simétrica, si las dos partes a ambos lados de la categoría de máxima frecuencia ubicada en el centro (número impar de categorías) o de la línea imaginaria perpendicular al eje de abscisas entre las dos categorías centrales de mayor frecuencia (número par de categorías) son iguales. Por el contrario, hay asimetría si son disimilares. A este concepto se le denomina simetría cualitativa (Moral, 2022).

Una cuantificación directa es promediar la diferencia entre las frecuencias de las categorías dispuestas en simetría. Cuando hay simetría, el valor de este promedio es cero. Cuando hay asimetría, el promedio se aleja de cero hasta alcanzar un máximo de 1. Su máximo se encuentra con una variable aleatoria constante dicotómica, en la que una categoría concentra toda la frecuencia o probabilidad y la otra categoría tiene una frecuencia o probabilidad nula. El mínimo de 0 aparece con la distribución uniforme discreta y aquellas que emulan a la Bernoulli o binomial con parámetro p = .5 o a la triangular discreta simétrica. Se denomina a esta estadística diferencia promedio de frecuencia entre pares de categorías ordenadas por homogeneidad de frecuencia y se denota por dfp (Moral, 2022).

Planteamiento del problema

El concepto de curtosis es confuso (McAlevey & Stent, 2018; Westfall, 2014) frente al de apuntamiento (Horn, 1983). Este último concepto podría aplicarse a la descripción de la distribución de una variable cualitativa cuando no existe ninguna medición planteada al respecto. Desde el diagrama de barras propuesto para medir asimetría cualitativa (Moral, 2022), cabría preguntarse si es posible definir un concepto de apuntamiento para describir una variable cualitativa y desarrollar una medida para su cuantificación. Retomando esta pregunta y el trabajo previo de asimetría cualitativa, este estudio tiene como objetivos: 1) definir un concepto y medida de apuntamiento para variables cualitativas, 2) verificar si el comportamiento de la medida es adecuado para medir apuntamiento, y 3) comprobar su validez en relación con dos criterios (apuntamiento promedio interjuez [API] y curtosis percentílica [CP]). Las hipótesis y definición de los criterios se detallan en la sección de Método.

Método

Para el primer objetivo de definir y medir el apuntamiento cualitativo, se emplearon argumentaciones para llegar a un concepto cuantificable y expresarlo en una fórmula algebraica. De aquí surgió la estadística distancia del pico a los hombros que se denota por dph.

Para el segundo objetivo de describir el comportamiento de dph, se aplicó a distintas variantes de la distribución binomial B(n, p) que permitieron emular distribuciones de variables cualitativas. Se hizo variar tanto el parámetro n de número de ensayos independientes de 1 (k= 2 categorías cualitativas) a 20 (k = 21 categorías cualitativas) como el parámetro p de probabilidad de éxito en cada ensayo independiente (p= .01, .1, .2, .3, .4 y .5). La función de masa de probabilidad f X (x) de la distribución binomial proporcionó las frecuencias relativas de las k categorías de cada variable cualitativa.

Se tenía la expectativa de que los valores de apuntamiento más altos aparecieran con las probabilidades de éxito más bajas, ya que cuanto menor es la probabilidad de éxito, el pico ubicado en un valor nulo o pequeño de éxitos es más alto. Consecuentemente, se conjeturó una correlación entre p y dph inversa, alta o muy alta, pero no perfecta debido a la asimetría que generan los valores de p alejados de .5 y el distinto número de categorías. También se esperaba que el número de categorías afectara. A mayor número de categorías, más se reparte la frecuencia entre las categorías, con lo que menor será el valor de dph; por tanto, la expectativa era de relación lineal inversa, aunque menor que con el parámetro p. Las correlaciones se calcularon por el coeficiente por rangos de Spearman (rS), ya que la distribución de dph no se ajustó a la normalidad. Las correlaciones de dph con p y k se compararon por la prueba t de Hotelling. Al estipularse que las categorías delimitantes de los hombros no estuvieran subsumidas en las categorías de máxima frecuencia, la expectativa era que la paridad o imparidad del número de categorías no afectara a dph, lo que se comprobó con la prueba U de Mann y Whitney. El ajuste a la normalidad se contrastó por la prueba W de Royston (1992) y K2 de D’Agostino et al. (1990). Al describir las distribuciones de dph y los dos criterios de validez, los percentiles se calcularon por la regla 8 de interpolación lineal de las medianas aproximadas para estadísticas de orden (Hyndman & Fann, 1996).

La validez de dph se comprobó por su correlación directa con el promedio del grado de apuntamiento evaluado visualmente por cinco jueces expertos o apuntamiento promedio interjuez (API) y la relación inversa con la curtosis percentílica (CP), cuyo cálculo se detalla en la sección de Resultados. Ambas correlaciones se estimaron por el coeficiente por rangos de Spearman (r S ), ya que no seguían una distribución normal. A cinco jueces (profesores de estadística en facultades de psicología), se les dio una escala para clasificar en cinco categorías ordenadas 66 diagramas de barras. Se les pidió que evaluaran en cada gráfico el grado de apuntamiento o cuanto se destaca verticalmente el pico (categoría o categorías de frecuencia máxima) con respecto a los hombros (línea horizontal trazada a la altura promedio de las categorías adyacentes). La escala tenía un rango de 1 a 5. Cada categoría ordinal venía con su diagrama de ejemplo. El cuestionario se proporcionó vía correo electrónico en un archivo Excel. En la Figura 1, se muestran sus instrucciones y, en las Figuras 2 a 12, sus diagramas. Estos se ordenaron por número de categorías (de 2 a 12), pero en disposición aleatoria con respecto al parámetro p. Además, los diagramas del cuestionario carecían de las estadísticas y los valores de frecuencia encima de las barras.

Los intervalos de confianza para r S se construyeron con el cuantil de orden .975 de una distribución t de Student con n−2 grados de libertad y el error estándar de Bonnet y Wright (2000). La fuerza de asociación se interpretó desde los puntos de corte sugeridos por ­Hopkins (2006): r S Î [0, .1) trivial, [.1, .3) pequeña, [.3, .5) media, [.5, .7) grande, [.70, .90) muy grande, [.90, 1) casi perfecta y 1 perfecta. La concordancia entre los jueces se estimó desde el promedio de los coeficientes de correlación por rangos de Spearman y el coeficiente de concordancia W de Kendall. Cabe señalar que no existe umbrales establecidos para interpretar el coeficiente W; no obstante, se pueden establecer desde su relación con el promedio de las correlaciones r S entre los m jueces (­Gibbons & Kendall, 1990): W = ( S (m−1)+1)/m. Cuando m = 5 jueces, valores entre [0, .1) de S y [0, .28) de W muestran una concordancia trivial, entre [.1, .3) de S y [.28, .44) de W pequeña, entre [.3, .5) de S y [.44, .60) de W media, entre [.5, .7) de S y [.60, .76) de W grande, entre [.7, .9) de S y [.76, .92] de W muy grande, entre [.9, 1] de S y [.92, 1) de W casi perfecta y 1 en S y W perfecta.

Figura 1 Instrucciones del cuestionario enviado a los jueces 

Resultados

Definición y cuantificación del apuntamiento cualitativo

Al igual que la asimetría, el apuntamiento es una propiedad de la forma de una distribución. Representada una distribución discreta por un diagrama de barras, el apuntamiento se define como la distancia vertical (frecuencia) entre el pico y los hombros.

Las categorías de una variable en escala nominal son las opciones de clasificación dentro de un sistema inclusivo (todo elemento de la población se puede clasificar) y exhaustivo (en una sola categoría) y carecen de cualquier propiedad algebraica intrínseca. Constituyen un sistema de clasificación y no una medición en sentido estricto que implica la determinación objetiva de cuantas veces la característica medida del objeto es la unidad de medida consensuada por expertos. No obstante, las categorías de una variable cualitativa admiten una cuantificación con base en su frecuencia en la muestra o la población. Así, desde su frecuencia relativa o probabilidad, se abre una posibilidad de transformación. Las categorías cualitativas de la variable se pueden transformar en categorías ordenadas, esto es, se puede crear una métrica ordinal de frecuencia.

Al elaborar el diagrama de barras para visualizar el apuntamiento, no se dispone la secuencia de categorías (ordenadas por frecuencia) en orden ascendente, sino en forma triangular o trapezoidal como se describió previamente al presentar la asimetría cualitativa en la sección de Introducción. Una vez elaborado el diagrama de barras se procede a enumerar las k categorías de la variable cualitativa A de 1 a k con lo que se crea la variable ordinal A(Δ).

El pico es el valor o los valores en el eje de abscisas a los que corresponde el valor máximo en el eje de ordenadas y se localiza en la categoría o categorías centrales dentro del diagrama elaborado. Para medir apuntamiento, se toma la frecuencia simple del pico, esto es, la frecuencia simple máxima.

El concepto de hombro (izquierdo o derecho) implica un eje de simetría y una distancia desde este eje. La forma en que se elabora el diagrama ubica la moda en el centro como eje de simetría. Se establece una distancia a cada lado del eje de simetría de aproximadamente el 25% de la distribución, de tal forma que ambos hombros cubren en torno al 50% central, como sugiere Horn (1983). Al haberse enumerado las categorías en el diagrama del 1 a k, se pueden calcular los percentiles del diagrama o variable A(Δ). El percentil 25 es la categoría que tiene una frecuencia acumulada de al menos .25 en el diagrama o distribución de A(Δ) y el percentil 75 es la categoría que tiene una frecuencia acumulada de al menos .75 en el diagrama o distribución de A(Δ). No obstante, si dichos percentiles corresponden a la moda o valores modales, entonces se toma la categoría adyacente inmediata no modal, en caso de que exista. Una vez ubicada las dos categorías delimitantes de los hombros, se toma sus frecuencias simples para medir el apuntamiento. Ya que estas frecuencias pueden ser dispares, se calcula la media aritmética de ambas frecuencias. A la categoría delimitante del hombro izquierdo se le denota con h 1 y a la categoría delimitante del hombro derecho se le denota con h 2 .

La medida de apuntamiento cualitativo es la diferencia entre la frecuencia del pico (f pico ) y el promedio de las frecuencias de las dos categorías delimitantes de los hombros en la disposición triangular (una moda), trapezoidal (dos o más modas) o rectangular (distribución uniforme). En la condición de dos categorías nominales, la diferencia se calcula entre las frecuencias de ambos atributos, por lo que coincide con la medida de asimetría cualitativa (Moral, 2022). A esta estadística se le denomina diferencia del pico a los hombros y se denota por dph.

Cabe señalar que la definición que se adopta de percentil P X (p´ 100) del diagrama o distribución de A(Δ) es el valor mínimo de las categorías ordenadas (1, 2, … k) que acumula al menos una probabilidad o frecuencia igual al orden p del percentil. Se trata de la definición más sencilla y corresponde al inverso de la función de distribución acumulativa (Stuart & Ord, 1994).

La estadística dph está acotada de 0 a 1. Un valor de 0 indica un apuntamiento nulo, y aparece con una distribución uniforme. Un valor de 1 representa el apuntamiento máximo y se alcanza con la distribución de una variable aleatoria discreta constante en la que un valor concentra toda la probabilidad o frecuencia. Para interpretar dph en sentido absoluto, se puede considerar que el intervalo [0, .25) indica un apuntamiento bajo, [.25, .5) medio, [.5, .75) alto y [.75, 1] muy alto.

Se define una segunda estadística desde el diagrama o variable ordinal A(Δ) generada desde las frecuencias de la variable cualitativa A. Esta segunda medida es la curtosis percentílica (CP) o cociente entre el rango semiintercuartílico (RSI) y el rango percentílico (RP) de A(Δ). CP puede tomar valores en el intervalo [0, .5]. En la medida que ambos rangos son más próximos tiende a .5, mostrando colas acortadas o platicurtosis. Por el contrario, en la medida que son más dispares, al ser el rango percentílico mayor que el semiintercuartílico, se aproxima a 0, evidenciando colas alargadas o leptocurtosis (Kelley, 1923).

Cálculo y comportamiento de dph

Se inicia mostrando un ejemplo de cálculo con seis categorías (Tabla 1). Se generan las frecuencias de los seis atributos de una variable cualitativa A = {a, b, c, d, e, f, g} a partir de una distribución binomial de parámetros n (número de ensayos independientes) = 5 y p (probabilidad de éxito) = .2. Así, se establece una correspondencia entre las probabilidades de los valores numéricos discretos de la distribución binomial X = {0, 1, 2, 3, 4, 5} y las frecuencias de los atributos de la variable cualitativa A:

La variable A tiene seis atributos, por lo que se definen tres parejas de categorías con frecuencias próximas. La categoría b presenta la frecuencia más alta, f A (b) = .4096, por lo que es el pico de la distribución, y se ubica en el centro izquierda (tercera posición). Se empareja con la categoría a, que tiene la segunda frecuencia más alta, f A (a) =.3277, y se coloca en el centro derecha (cuarta posición). El par más próximo al central (posiciones segunda y quinta) es c y d: f A (c) = .2048 (miembro a la izquierda del pico) > f A (d) = .0512 (miembro a la derecha del pico). El par más distante al central (posiciones primera y sexta) es e y f: f A (e) =.0064 (miembro a la izquierda del pico) > f A (f) = .0003 (miembro a la derecha del pico).

De este modo, las categorías cualitativas presentan el orden e, c, b, a, d y f dentro del diagrama triangular (Figura 6). Desde este orden, la variable cualitativa A se transforma en la variable ordinal A(Δ): A(Δ=e) = 1, A(Δ=c) = 2, A(Δ=b) = 3, A(Δ=a) = 4, A(Δ=d) = 5 y A(Δ=f ) = 6, lo que permite calcular las frecuencias acumuladas F A(Δ) (i), el cuartil inferior o percentil 25 (F A(Δ) (3) = .6208 > .25) y el cuartil superior o percentil 75 (F A(Δ) (3) = .9485 > .75).

Como previamente se definió, la categoría delimitante del hombro izquierdo (h 1 ) corresponde al cuartil inferior, salvo que su frecuencia (altura) corresponda al pico. En ese caso, pasa a ser la categoría no modal contigua a la izquierda. De forma análoga, la categoría delimitante del hombro derecho (h 2 ) corresponde al cuartil superior, salvo que su frecuencia (altura) corresponda al pico, con lo que pasa a ser la categoría no modal contigua a la derecha. En este ejemplo, los cuartiles inferior y superior no corresponden al pico, por lo que h 1 es el percentil 25 y h 2 es el percentil 75 de X(Δ).

Tabla 1 Distribución binomial B(n = 5, p = .2) generadora de la variable cualitativa A, transformación de A en la variable ordinal A(Δ) y percentiles de A(Δ) 

La distancia del pico a la moda (dph) se obtiene al restar a la frecuencia del pico (moda única), el promedio de las frecuencias de las categorías delimitantes de los hombros izquierdo (primer cuartil o percentil 25) y derecho (tercer cuartil o percentil 75).

El primer decil de X(Δ), que es el valor que acumula al menos el .10, corresponde a 1 y su decil superior, que acumula al menos el .90, es 3. La curtosis percentílica de A(Δ) o cociente entre su rango semiintercuartílico y su rango percentílico es de un cuarto.

Se presenta un segundo ejemplo de cálculo de dph (Tabla 2). Las frecuencias de la variable cualitativa A con cinco atributos se generan a partir de una distribución binomial B(n = 4, p = .2).

Hay cinco categorías y dos modas (a y b). Una de las dos categorías con frecuencia más alta (b) se ubica en el centro (tercera posición). Las otras cuatro categorías se emparejan por proximidad de frecuencia. El par más próximo a la moda (posiciones segunda y cuarta) es a y c: f A (a) =.4096 (miembro a la izquierda del pico) > f A (c) = .1536 (miembro a la derecha del pico). El par más distante a la moda (posiciones primera y quinta) es d y e: f A (d) =.0256 (miembro a la izquierda del pico) > f A (e) = .0016 (miembro a la derecha del pico).

Las categorías cualitativas presentan el orden d, a, b, c y e dentro del diagrama con forma trapezoidal al tener dos modas o pico romo (Figura 5). Desde este orden, la variable cualitativa A se transforma en la variable ordinal A(Δ): A(Δ=d) = 1, A(Δ=a) = 2, A(Δ=b) = 3, A(Δ=c) = 4 y A(Δ=e) = 5. Se calculan las frecuencias acumuladas, el primer cuartil (F A(Δ) (2) =.4352 > .25) y el tercer cuartil (F A(Δ) (3) =.8448 > .75). El primer cuartil es una de las dos categorías modales, por lo que la categoría delimitante del hombro izquierdo (h 1 ) pasa a ser la categoría no modal contigua a la izquierda: X(Δ) = 1. El tercer cuartil también es una de las dos categorías modales, por lo que la categoría delimitante del hombro derecho (h 2 ) pasa a ser la categoría no modal contigua a la derecha: X(Δ) = 4 (Tabla 2).

Tabla 2 Distribución binomial B(n = 4, p = .2) generadora de la variable cualitativa A, transformación de A en la variable ordinal A(Δ) y percentiles de A(Δ) 

La estadística dph se obtiene al restar a la frecuencia del pico (f(a) = f(b) = .4096), el promedio de las frecuencias de las categorías delimitantes del hombro izquierdo y del hombro derecho.

El percentil 10 de A(Δ) es 2 y su percentil 90 es 4. La curtosis percentílica de A(Δ) o cociente entre su rango semiintercuartílico y su rango percentílico es de un cuarto.

De las Figuras 2 a 21, se muestran los 120 diagramas de barras con su distribución de origen , dph y los dos criterios de validez (CP y API). Para lograr los grados variables de apuntamiento, se dieron seis valores diferentes a las probabilidades de éxito: .01 (probabilidad muy baja), .1, .2, .3, .4 y .5 (probabilidad media). Se obvió la otra mitad de probabilidades (.6, .7, .8, .9 y .99), ya que resulta exactamente el mismo diagrama de barras.

Figura 2 Diagrama de barras con dos categorías. B(n =1, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 3 Diagrama de barras con tres categorías. B(n =2, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 4 Diagrama de barras con cuatro categorías. B(n = 3, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 5 Diagrama de barras con cinco categorías. B(n = 4, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 6 Diagrama de barras con seis categorías. B(n = 5, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 7 Diagrama de barras con siete categorías. B(n = 6, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 8 Diagrama de barras con ocho categorías. B(n = 7, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 9 Diagrama de barras con nueve categorías. B(n = 8, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 10 Diagrama de barras con 10 categorías. B(n = 9, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 11 Diagrama de barras con 11 categorías. B(n = 10, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 12 Diagrama de barras con 12 categorías. B(n = 11, p) = distribución binomial generadora, dph = distancia del pico al hombro, CP = curtosis percentílica y API = apuntamiento promedio interjuez. 

Figura 13 Diagrama de barras con 13 categorías. B(n = 12, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 14 Diagrama de barras con 14 categorías. B(n = 13, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 15 Diagrama de barras con 15 categorías. B(n = 14, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 16 Diagrama de barras con 16 categorías. B(n = 15, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 17 Diagrama de barras con 17 categorías. B(n = 16, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 18 Diagrama de barras con 18 categorías. B(n = 17, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 19 Diagrama de barras con 19 categorías. B(n = 18, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 20 Diagrama de barras con 20 categorías. B(n = 19, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Figura 21 Diagrama de barras con 21 categorías. B(n = 20, p) = distribución binomial generadora, dph = distancia del pico al hombro y CP = curtosis percentílica. 

Se rechazó la hipótesis nula de normalidad para la distribución de dph (W = .71, Z = −7.45, p < .001; K 2 = 25.31, p < .001). Su distribución presentó asimetría positiva (g 1 = 1.34, IC al 95% [0.91, 1.78], Z = 6.08, p < .001; D’Agostino et al. (1990): b 1 = 1.33, Z b1 = 4.99, p < .001; asimetría intercuartílica [AIC] = .57; asimetría percentílica [AP] = .84). Aunque se la puede considerar mesocúrtica por las medidas basadas en cumulantes (g 2 = 0.19, IC al 95% [−0.67, 1.05], Z g2 = 0.44, p = .660) o momentos estandarizados (D’Agostino et al. (1990): b 2 = 3.14, Z b2 = 0.60, p = .546), no así por la medida basada en percentiles (CP = .15). El valor de .15 en la curtosis percentílica, a más de cinco décimas por debajo de .26 (valor de una distribución normal), mostró leptocurtosis o colas alargadas. Además, el histograma de frecuencias reveló asimetría positiva con una cola derecha muy pesada (Figura 22). Se definieron 11 intervalos, siguiendo la regla de Doane, al ser la distribución asimetría positiva.

Figura 22 Histograma de frecuencias de dph en la muestra de 120 distribuciones cualitativas. 

La correlación entre dph y el parámetro p de la distribución binomial que dio origen a las frecuencias de las variables fue significativa, negativa y con fuerza de asociación alta (r S = −.68, IC al 95% [−.78, −.56], t = −10.19, p < .001) con 46.8% de la varianza compartida. También la correlación entre dhp y el número de categorías k fue significativa, negativa y con una fuerza de asociación alta (r S = −.53, IC al 95% [−.65, −.37], t = −6.71, p < .001) con 27.6% de la varianza compartida. Comparadas por la prueba de Hotelling, la correlación de dph fue significativamente mayor con p que con k (t = −2.40, p =.009). No obstante, el que haya un número par o impar de categorías no tuvo efecto sobre dph (U = 1670, Z = .68 con corrección de empates y continuidad, p = .497 a dos colas, r de Rosenthal = .06).

La validez de dph en relación con CP

Cuando se calculó la curtosis percentílica en los 120 diagramas de barras, esta estadística quedó indeterminada (CP = 0/0) en 12 casos. La distribución de CP mostró simetría (g 1 = −.08, IC al 95% [−.53, .38], Z g1 = −.32, p = .75; D’Agostino et al. (1990): b 1 = −.07, Z b1 = −.33, p = .739; AIC = 0; AIC = 0). Por las medidas basadas en cumulantes (g 2 = .25, IC al 95% [−.66, 1.15], Z g2 = .54, p = .591) y momentos (D’Agostino et al. (1990): b 2 = 3.18, Z = .70, p = .486) presentó mesocurtosis, pero no así por la medida basada en percentiles (CP = .17 < .26). La hipótesis nula de normalidad se mantuvo por la prueba de D’Agostino et al. (1990), K 2 = .60, p = .743, pero se rechazó por la prueba W de Royston (1992), W = .90, Z = −4.95, p < .001. El histograma de frecuencias, con el número de intervalos definidos por la regla de Sturges, reveló colas pesadas.

La correlación negativa entre dph y CP no fue significativa (r S = −.15, IC al 95% [−.33, .04], t = −1.57, p = .120), pero al resolver la indeterminación CP = 0/0 como CP = 0 sí lo fue (r S = −.38, IC al 95% [−.53, −.21], t = −4.45, p < .001) con una fuerza de asociación media y una varianza compartida del 14.4%. Cabe señalar que, con dicha resolución de la indeterminación (n = 120), la correlación de CP con el parámetro p fue positiva y significativa (r S = .42, IC al 95% [.26, .56], t = 5.05, p < .001) con una fuerza de asociación media (17.8%); no obstante, CP fue independiente del número de categorías (r S = .001, IC al 95% [−.18, .18], t = .01, p = .995) y del hecho de tener un número par o impar de categorías (U = 2683.5, Z = .62, p = .534, r de Rosenthal = .06).

La validez de dph en relación con API

En las Figuras 2 a 12, se encuentran los promedios entre los cinco jueces en el grado de apuntamiento por diagrama (API) en la muestra de 66 diagramas, junto con las correspondientes estadísticas dph y CP. API varió de 1 a 5 con una media aritmética de 2.81, IC al 95% [2.49, 3.13] y una mediana de 2.5. La distribución mostró simetría por las medidas basadas en cumulantes (g 1 = .31, IC al 95% [−.26, .89], Z g1 = 1.07, p = .286) y momentos centrales (D’Agostino et al. (1990): b 1 = .31, Z b1 = 1.09, p = .274), aunque las medidas basadas en percentiles quedaron alejadas del valor nulo de simetría (AIC = .19 y AP = .21). Por su parte, las medidas de curtosis basadas en cumulantes (g 2 = −1.20, IC al 95% [−2.34, −.06], Z g2 = −2.07, p = .039) y momentos centrales (b 2 = 1.80, Z b2 = −4.27, p < .001) evidenciaron platicurtosis, aunque no así la medida basada en percentiles (CP = .291). Se rechazó la hipótesis nula de normalidad para distribución de API (W = .92, Z = −3.32, p < .001; K 2 = 19.42, p < .001). El histograma de frecuencias, cuyo número de intervalos se definió por la regla de Doane, reveló un perfil platicúrtico alejado de la curva acampanada de una distribución normal.

La correlación entre dph y API fue significativa y positiva (r S = .87, IC al 95% [.78, .93], t[64] = 14.18, p < .001) con una fuerza de la asociación muy alta, compartiendo el 75.9% de la varianza. Cuando la correlación entre CP (resolviendo la indeterminación 0/0 como 0) y API fue significativa, negativa y con una fuerza de asociación media (r S = −.41, IC al 95% [−.60, −.17], t[64] = −3.58, p < .001). Sin resolver la indeterminación, CP resultó independiente de API (r S = .07, IC al 95% [−.21, −.34], t[52] = .49, p = .629). Las correlaciones entre los jueces variaron de r S = .70 a .86 con una media de .78, IC al 95% [.74, .82], con lo que el coeficiente de concordancia W de Kendall fue de .82, IC 95% [.79, .86].

Discusión

Se enunció como primer objetivo definir un concepto y una medida de apuntamiento para variables cualitativas. Pearson inició un amplio proyecto de desarrollo de distribuciones continuas con base en los parámetros de posición (tendencia central), escala (variación) y forma (asimetría y curtosis) para datos numéricos procedentes de investigaciones biológicas y antropométricas con distribuciones alejadas de la normalidad (Lahcene, 2018). De aquí surgió el concepto de curtosis y su medición a través del cuarto momento central estandarizado, la medición de la asimetría con base en el tercer momento central estandarizado y pruebas de contraste de la normalidad (exceso de curtosis y simetría). Como alternativa se desarrollaron medidas de asimetría y curtosis basadas en percentiles para su aplicación a distribuciones continuas. Estas últimas, al basarse en estadísticas de orden, dieron pie a que los conceptos también fueran extensibles a variables ordinales (Kaliyadan & Kulkarni, 2019). No obstante, su posible aplicación a variables cualitativas ha sido descartado. Más allá de que los datos cualitativos no admiten estadísticas de orden, el prejuicio o presunción implícita es que la utilidad de ambos conceptos no es meramente la descripción y parametrización de una distribución, sino la evaluación de la normalidad, al ser una distribución esencial en la estadística inferencial; consecuentemente, dichos conceptos no son aplicables a variables cualitativas. Si se acentúa la utilidad descriptiva y se abandona el concepto de exceso de curtosis en referencia a la distribución normal, entonces cabría pensar en la posibilidad de desarrollar conceptos descriptivos y medidas de asimetría y apuntamiento para variables cualitativas.

Desde el trabajo previo de medición de asimetría en variables cualitativas (Moral, 2022), se abre un camino para medir apuntamiento. El concepto de curtosis como curvatura y sus medidas (β 2 , γ 2 y CP) son confusos y puede ser más claro un concepto de apuntamiento como era la pretensión original de Pearson (Westfall, 2014). La medida más natural es una distancia vertical desde el pico a los hombros. A mayor distancia o destacamiento del pico sobre los hombros, mayor será el apuntamiento. Definir el pico es muy sencillo. Corresponde a la altura o frecuencia del valor o valores modales. Sin embargo, definir los hombros como la zona central de la distribución con variables cualitativas es un problema, ya que sus valores carecen de información cuantitativa implícita que permita su ordenamiento; no obstante, sí cuentan con una información extrínseca cuantitativa que es la frecuencia.

Los hombros son los valores centrales o más próximos al eje de simetría y las colas son los valores más alejados. Desde su origen, se ha insistido que el apuntamiento y la curtosis son claramente interpretables, si la distribución presenta simetría (Bono et al., 2020; Horn, 1983). Así, la evaluación de si una distribución es apuntada es fácil si una mitad es el reflejo de la otra desde el eje central de simetría. De ahí que, al usarse la información de las frecuencias de los datos nominales, tendría más utilidad generar una presentación triangular, trapezoidal o rectangular en un diagrama de barras. Para este fin, se ubica en el centro la moda (triangular) o modas (trapezoidal) y se disponen las categorías más frecuentes más próximas a dicho centro y las menos frecuentes más alejadas. Para que el pico quede centrado, debe hacerse a izquierdas y derechas. Lo más sencillo es emparejar las categorías por proximidad de frecuencia. Una vez logrado el perfil, la variable cualitativa se puede transformar en ordinal. En este punto, ya es fácil definir los hombros. Las categorías centrales constituyen la zona de los hombros. A efectos de medir el apuntamiento la mitad de la distribución o espacio intercuartílico parece lo más adecuado (Horn, 1983).

Aunque el concepto de percentil es claro, su cuantificación en estadística resulta frustrante por la gran diversidad de medidas existentes (Hyndman & Fan, 1996). Este trabajo adopta la operativización más sencilla y directa al concepto. Se busca la categoría ordenada (al elaborar el diagrama de barras) con menor valor que acumula al menos la frecuencia correspondiente al orden p del percentil (Stuart & Ord, 1994). A la hora de definir el hombro con los cuartiles se añade una restricción. La categoría delimitante no debe corresponder a las categorías que configuran el pico (con frecuencia máxima). Su razón es que se requiere encontrar una referencia o marca horizontal para evaluar el grado de destacamiento vertical.

La distancia se mide desde una paralela al eje de abscisas y se ubica en el promedio de las categorías delimitantes de los hombros, ya que no es inusual que estas categorías tengan alturas dispares. De aquí surge la medida de apuntamiento cualitativo como una métrica de cuánto sobresale verticalmente el pico con respecto a las categorías centrales (hombros). Al usarse distancias (diferencias) entre frecuencias relativas, la medida queda estandarizada y oscila de 0 a 1. El valor 0 indica que el pico no se destaca en absoluto, ya que no existe propiamente (distribución uniforme) y el valor 1 indica que el pico es lo único que existe (variable aleatoria constante).

El segundo objetivo planteado fue describir el comportamiento de dph. Al pretenderse medir apuntamiento, se generan unas hipótesis. Cuanto más prominente sea la moda, dph debe aproximarse más a 1 y, cuanto menos, más a 0. El número de categorías necesariamente afecta, pues un mayor número provoca un mayor reparto de la frecuencia y, consecuentemente, menor destacamiento de la moda. Se optó por usar la distribución binomial para generar una gran diversidad de distribuciones. El parámetro p (probabilidad de éxito) permite manipular el destacamiento de la moda. Cuanto más próximo a 0 más destaca y, cuanto más próximo a .5, menos. Por otra parte, el parámetro n (número de ensayos independientes con probabilidad de éxito constante) posibilita manipular el número de atributos. Se generaron un total de 120 distribuciones con 6 valores de p y 20 de n. Conforme a la expectativa, la correlación fue alta con ambos parámetros, más alta con p que con n, con casi la mitad de la varianza compartida en el primer caso y poco más de un cuarto en el segundo. No se esperaba una relación muy alta con ninguno de ellos, ya que la repartición de la frecuencia es asimétrica cuando p toma un valor distinto de .5, dando lugar a categorías limitantes con alturas dispares, lo que se complejiza al aumentar el número de categorías. También se cumplió la expectativa de que la paridad o no del número de categorías carezca de relevancia para dph, ya que las categorías delimitantes de los hombros no están subsumidas en las categorías con frecuencia máxima (pico).

Se enunció como tercer objetivo comprobar la validez con dos criterios externos. Como primer criterio se adoptó una medida de curtosis (CP) y como segundo una evaluación visual del apuntamiento por cinco expertos (API). La hipótesis es que apuntamiento y curtosis estén relacionados. En la medida que el apuntamiento es mayor, el perfil es más leptocúrtico y, cuanto es menor, es más platicúrtico, especialmente en caso de simetría. Al existir una medida de curtosis basada en percentiles y desde la transformación ordinal que permite el diagrama de barras, se puede obtener una medida de curtosis para las 120 distribuciones. La curtosis percentílica (CP) o cociente entre el rango semiintercuartílico y el rango percentílico indica platicurtosis cuando su valor está más próximo a .5 y leptocurtosis cuando su valor está más próximo a 0, por lo tanto, la expectativa era de correlación negativa. Un primer problema que se plantea con esta medida es su indeterminación (0/0) cuando las distancias entre los cuartiles y los deciles extremos son nulas. Una solución con mucho sentido es dar a CP un valor de 0. Dicha indeterminación aparece ante distribuciones en las cuales la categoría modal subsume el primer y último decil y, por ende, el primer y último cuartil. Esta distribución se aproxima a la de una variable aleatoria constante, cuyo apuntamiento es 0 y su valor en CP es 1. Precisamente, la indeterminación 0/0 surge cuando p = .01 y el número de categorías es menor que 12 y cuando p = .1 y n = 1. Cuando p = .01 y n ≥ 12 o p = .1 y n = 2, el valor de CP ya no está indeterminado, sino es 0. En sí, es importante resolver la indeterminación, ya que la expectativa de relación se hace más clara en los extremos de p = .5 y .01. Cuando se incluyen los 120 diagramas, la correlación es significativa y negativa, conforme a la expectativa. Su fuerza de asociación es media. Cabría objetar por qué no alta. CP es una medida indirecta de apuntamiento, como lo muestra su correlación media con API con un sexto de varianza compartida, cuando la correlación entre dph y API fue muy alta con tres cuartos de varianza compartida. A su vez, la correlación entre CP y el parámetro p fue media con una varianza compartida menor a un quinto cuando la correlación entre dph y p fue alta con una varianza compartida próxima a un medio.

El segundo criterio externo usado permite comprobar que tan intuitivo y visualmente evaluable es el concepto de apuntamiento. La correlación promedio entre los expertos fue muy alta, arrojando un coeficiente de concordancia ligeramente mayor que .80, lo que evidencia un nivel de acuerdo grande desde los puntos de corte propuestos en la sección de Método. Consecuentemente, estos datos no solo indican que la medida dph es válida y confiable, sino que el concepto es fácil de evaluar visualmente. La curtosis percentílica pareciera que no. Cabe matizar que los jueces evaluaron el grado en que el pico destaca de los hombros (apuntamiento) y no qué tan destacados son los hombros con respecto a las colas que correspondería al concepto de curtosis medido por CP.

Como una limitación del estudio se tiene haber generado las distribuciones de las variables cualitativas desde una distribución binomial. Esta distribución discreta permite una gran variabilidad de condiciones de asimetría, apuntamiento, unimodalidad y bimodalidad, pero no representa todo el universo de distribuciones multinomiales. A su vez, se usó como criterio externo de cómputo automático la curtosis percentílica, la cual es una medida indirecta de apuntamiento, de ahí que no se pudiera esperar unas correlaciones muy altas. Con respecto a la baremación, cuando se evalúa la curtosis existe el concepto de exceso de curtosis que toma como referencia la distribución normal y se estima un error para evaluar el alejamiento con respecto al valor esperado. No obstante, la distribución normal no es una referencia para las variables cualitativas. Para valorar el grado de apuntamiento, se propone acudir a un criterio absoluto basado en quintos del intervalo de 0 a 1, como se usó en la evaluación interjuez.

Se concluye que es posible llevar a un concepto de apuntamiento para variables cualitativas. La distancia del pico a los hombros en el diagrama de barras (de perfil triangular, trapezoidal o rectangular) es una medida directa del concepto que pretende medir, es sencilla de cálculo y resulta válida con base en su comportamiento desde modelos de distribución binomial y con base en su relación con dos criterios: la evaluación interjuez del apuntamiento y la curtosis percentílica del mencionado diagrama de barras.

Se sugiere incluir el concepto de apuntamiento al describir distribuciones de variables cualitativas y usar la medida propuesta y validada. Aunque el concepto de curtosis es más confuso, se podría estudiar más a fondo la medida de curtosis percentílica mostrada en este trabajo o desarrollar una nueva.

Referencias

Alzaatreh, A. & Sulieman, H. (2021). On fitting cryptocurrency log-return exchange rates. Empirical Economics, 60, 1157-1174. https://doi.org/10.1007/s00181-019-01782-6 [ Links ]

Aytaçoglu, B. & Sazak, H. S. (2017). A comparative study on the estimators of skewness and kurtosis. Ege University Journal of the Faculty of Science, 41(1), 1-13. [ Links ]

Balanda, K. P. & MacGillivray, H. L. (1988). Kurtosis: A critical review. The American Statistician, 42(2), 111-119. https://doi.org/10.2307/2684482 [ Links ]

Bastianin, A. (2020). Robust measures of skewness and kurtosis for macroeconomic and financial time series. Applied Economics, 52(7), 637-670. https://doi.org/10.1080/00036846.2019.1640862 [ Links ]

Bonnett, D. G., & Wright, T. A. (2000). Sample size requirements for estimating Pearson, Kendall, and Spearman correlations. Psychometrika, 65, 23-28. https://doi.org/10.1007/BF02294183 [ Links ]

Bono, R., Arnau, J., Alarcón, R. & Blanca, M. J. (2020). Bias, precision, and accuracy of skewness and kurtosis estimators for frequently used continuous distributions. Symmetry, 12(1), article 19, 1-17. https://doi.org/10.3390/sym12010019Links ]

Celikoglu, A. & Tirnakli, U. (2018). Skewness and kurtosis analysis for non-Gaussian distributions. Physica A: Statistical Mechanics and its Applications, 499, 325-334. https://doi.org/10.1016/j.physa.2018.02.035. [ Links ]

D’Agostino, R. B., Belanger, A. & D’Agostino, R. B. Jt. (1990). A suggestion for using powerful and informative test of normality. The American Statistician, 44(4), 316-321. https://doi.org/10.1080/00031305.1990.10475751 [ Links ]

Darlington, R. B. (1970). Is kurtosis really ‘peakedness’? The American Statistician, 24(2), 19-22. https://doi.org/10.1080/00031305.1970.10478885 [ Links ]

Fiori, A. & Zenga, M. (2009). Karl Pearson and the origin of kurtosis. International Statistical Review, 77(1), 40-50. https://doi.org/10.1111/j.1751-5823.2009.00076.x [ Links ]

Gupta, S. C. & Kapoor, V. K. (2020). Descriptive measures. In Fundamentals of mathematical statistics, twelfth edition (section 2, pp. 1-78). Sultan Chand & Sons. [ Links ]

Hopkins, K. D. (2006). A new view of statistics. A scale of magnitudes for effect statistics. http://www.sportsci.org/resource/stats/effectmag.htmlLinks ]

Horn, P. S. (1983). A measure for peakedness. The American Statistician, 37(1), 55-56. https://doi.org/10.1080/00031305.1983.10483090 [ Links ]

Hyndman, R. J. & Fan, Y. (1996). Sample quantiles in statistical packages. The American Statistician, 50(4), 361-365. https://doi.org/10.1080/00031305.1996.10473566 [ Links ]

Kaliyadan, F. & Kulkarni, V. (2019). Types of variables, descriptive statistics, and sample size. Indian dermatology online journal, 10(1), 82-86. https://doi.org/10.4103/idoj.IDOJ_468_18 [ Links ]

Kelley, T. L. (1923). Statistical method. The Macmillan Company. [ Links ]

Kendall, M. G. & Gibbons, J. D. (1990). Rank correlation methods. Oxford University Press. [ Links ]

Lahcene, B. (2018). On extended normal distribution model with application in health care. International Journal of Statistics in Medical Research, 7(3), 88-95. https://doi.org/10.6000/1929-6029.2018.07.03.4 [ Links ]

McAlevey, L. G. & Stent, A. F. (2018). Kurtosis: a forgotten moment. International Journal of Mathematical Education in Science and Technology, 49(1), 120-130. https://doi.org/10.1080/0020739X.2017.1357848 [ Links ]

Moors, J. J. A. (1986). The meaning of kurtosis: Darlington reexamined. The American Statistician, 40(4), 283-284, https://doi.org/10.1080/00031305.1986.10475415 [ Links ]

Moral, J. (2022). Una medida de asimetría unidimensional para variables cualitativas. Revista de Psicología, 40(1), 519-551. https://doi.org/10.18800/psico.202201.017 [ Links ]

Ribeiro-Reis, L. D. (2021). Laplace distribution: Properties, regression model and simulation. Journal of Statistics and Management Systems. https://doi.org/10.1080/09720510.2021.1930664 [ Links ]

Royston, J. P. (1992). Approximating Shapiro-Wilk W-test for non-normality. Statistics and Computing, 2, 117-119. https://doi.org/10.1007/BF01891203 [ Links ]

Stuart, A. & Ord, J. K. (1994). Kendall’s advance theory of statistics. Vol 1. Distribution theory (6th ed.). Edward Arnold. [ Links ]

Wahab, M. F., Patel, D. C. & Armstrong, D. W. (2017). Total peak shape analysis: detection and quantitation of concurrent fronting, tailing, and their effect on asymmetry measurements. Journal of Chromatography A, 1509, 163-170. https://doi.org/10.1016/j.chroma.2017.06.031 [ Links ]

Westfall, P. H. (2014). Kurtosis as peakedness, 1905-2014. R.I.P. The American Statistician, 68(3), 191-195. https://doi.org/10.1080/00031305.2014.917055 [ Links ]

Recibido: 15 de Diciembre de 2021; Aprobado: 24 de Octubre de 2022

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons