Fundamentos y Aplicación de Pruebas Estadísticas No Paramétricas Clave

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,5 KB

Conceptos Fundamentales en Pruebas de Asociación

Frecuencias Observadas y Esperadas (O y E)

  • Esta metodología es aplicable cuando la categoría es nominal (relacionada con el nombre o clasificación).
  • Esta prueba es de Asociación.

Nomenclatura

  • O: Frecuencias Observadas
  • E: Frecuencias Esperadas

Fórmulas Clave

Grados de libertad (GL): (N° de filas - 1) × (N° de columnas - 1)

Hipótesis (Prueba de Normalidad)

Nota: Las siguientes hipótesis son típicas de pruebas de normalidad, no de asociación.

  • H0: En la población de donde se extrajo la muestra, los datos siguen una distribución normal.
  • HA: La población muestreada no sigue una distribución normal.

Coeficiente de Correlación por Rangos de Spearman (Rs)

El coeficiente de Spearman es una medida de asociación no paramétrica.

  • Es la asociación entre dos variables sin asumir una distribución normal.
  • Su función es un estadístico basado en rangos, que determina la asociación entre dos variables medidas en el mismo sujeto.
  • Las variables se miden en una escala ordinal.
  • El valor de Rs varía entre +1 y -1.
  • Si Rs es negativo, indica una relación inversa, mientras que un valor positivo indica una relación directa.

Procedimiento de Cálculo

  1. Se resuelve con la diferencia de rangos: $D_i = X_i - Y_i$.
  2. Después, se elevan al cuadrado $(D_i)^2$ y se suman los resultados.

Fórmula de Spearman

$R_s = 1 - \frac{6 \sum D_i^2}{N^3 - N}$

Hipótesis

  • H0: No existe asociación entre las dos variables.
  • HA: Existe una relación o asociación entre las dos variables.

Prueba H de Kruskal-Wallis

Esta prueba se utiliza para comparar tres o más poblaciones independientes cuando los datos son ordinales o no cumplen la normalidad.

  • Se utiliza para pruebas independientes.
  • Sirve para probar si un grupo de datos proviene de la misma población.
  • Se emplea cuando se quiere comparar tres o más poblaciones (K muestras).
  • Compara esencialmente los rangos promedios observados para las K muestras, con los esperados bajo H0.

Hipótesis

  • H0: Todos los grupos son idénticos (las medianas poblacionales son iguales).
  • HA: Por lo menos uno de los grupos es diferente.

Pasos para la Resolución

  1. Ordenar las $n$ observaciones de menor a mayor, asignándole rangos.
  2. Se obtiene la suma de los rangos correspondientes a los elementos de cada muestra y se halla el rango promedio.
  3. Se calcula el estadístico de prueba $H$.
  4. Se busca $H$ en la tabla de Chi Cuadrado (es necesario calcular los Grados de Libertad, GL).

Prueba U de Mann-Whitney (Test U)

Esta prueba se utiliza para comparar dos muestras independientes.

  • Es para muestras independientes.
  • Se basa en la combinación de los conjuntos de las $n_1$ y $n_2$ observaciones.
  • Cuando todas las observaciones están juntas, se asigna un rango a cada una de las observaciones ordenadas, que comienza en el número 1 y termina en $n_1 + n_2$.

Procedimiento

  1. Se ordenan los datos de menor a mayor en un solo conjunto.
  2. Se calcula $R_1$ y $R_2$ (sumatoria de todos los rangos de $N_1$ y $N_2$).
  3. Se calcula el valor del estadístico $U$.
  4. Se toma el valor de $U$ más pequeño y se revisa la Tabla. La región crítica contiene valores de $U$ igual o menor al valor crítico. Por lo tanto, si $U$ es mayor, no habrá prueba suficiente para rechazar $H_0$.

Hipótesis

  • H0: Si ocurre X condición (Ej: Las medianas poblacionales son iguales).
  • HA: No ocurre X condición (Ej: Las medianas poblacionales son diferentes).

Prueba de Wilcoxon (Test de Signos)

Esta prueba se utiliza para muestras relacionadas o dependientes (datos pareados).

  • Es para muestras relacionadas, es decir, se utiliza cuando las muestras no son independientes.
  • Es para determinar la frecuencia con la cual el valor de un miembro del par es superior al valor del otro miembro del par.
  • Se utiliza la prueba del Signo. Un elemento de A mayor que B, es positivo y viceversa.

Consideraciones Generales sobre Métodos No Paramétricos

  • Para realizar análisis no paramétricos, las variables deben ser resumidas a categorías discretas (o tratadas como ordinales).
  • Estos métodos (basados en rangos) son la alternativa no paramétrica al análisis de varianza (ANOVA) y la prueba $t$, ya que se basan en los rangos de las observaciones en lugar de las observaciones mismas.
  • Esta metodología utiliza información acerca de los tamaños relativos de las observaciones, sin asumir nada acerca de la naturaleza específica de la población desde donde se obtuvieron los datos.
  • Se utiliza este método cada vez que el tamaño de las muestras es pequeño y, por lo tanto, no hay garantía de que los estimadores tengan distribución normal.

Entradas relacionadas: