Fundamentos y Aplicación de Pruebas Estadísticas No Paramétricas Clave
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 5,5 KB
Conceptos Fundamentales en Pruebas de Asociación
Frecuencias Observadas y Esperadas (O y E)
- Esta metodología es aplicable cuando la categoría es nominal (relacionada con el nombre o clasificación).
- Esta prueba es de Asociación.
Nomenclatura
- O: Frecuencias Observadas
- E: Frecuencias Esperadas
Fórmulas Clave
Grados de libertad (GL): (N° de filas - 1) × (N° de columnas - 1)
Hipótesis (Prueba de Normalidad)
Nota: Las siguientes hipótesis son típicas de pruebas de normalidad, no de asociación.
- H0: En la población de donde se extrajo la muestra, los datos siguen una distribución normal.
- HA: La población muestreada no sigue una distribución normal.
Coeficiente de Correlación por Rangos de Spearman (Rs)
El coeficiente de Spearman es una medida de asociación no paramétrica.
- Es la asociación entre dos variables sin asumir una distribución normal.
- Su función es un estadístico basado en rangos, que determina la asociación entre dos variables medidas en el mismo sujeto.
- Las variables se miden en una escala ordinal.
- El valor de Rs varía entre +1 y -1.
- Si Rs es negativo, indica una relación inversa, mientras que un valor positivo indica una relación directa.
Procedimiento de Cálculo
- Se resuelve con la diferencia de rangos: $D_i = X_i - Y_i$.
- Después, se elevan al cuadrado $(D_i)^2$ y se suman los resultados.
Fórmula de Spearman
$R_s = 1 - \frac{6 \sum D_i^2}{N^3 - N}$
Hipótesis
- H0: No existe asociación entre las dos variables.
- HA: Existe una relación o asociación entre las dos variables.
Prueba H de Kruskal-Wallis
Esta prueba se utiliza para comparar tres o más poblaciones independientes cuando los datos son ordinales o no cumplen la normalidad.
- Se utiliza para pruebas independientes.
- Sirve para probar si un grupo de datos proviene de la misma población.
- Se emplea cuando se quiere comparar tres o más poblaciones (K muestras).
- Compara esencialmente los rangos promedios observados para las K muestras, con los esperados bajo H0.
Hipótesis
- H0: Todos los grupos son idénticos (las medianas poblacionales son iguales).
- HA: Por lo menos uno de los grupos es diferente.
Pasos para la Resolución
- Ordenar las $n$ observaciones de menor a mayor, asignándole rangos.
- Se obtiene la suma de los rangos correspondientes a los elementos de cada muestra y se halla el rango promedio.
- Se calcula el estadístico de prueba $H$.
- Se busca $H$ en la tabla de Chi Cuadrado (es necesario calcular los Grados de Libertad, GL).
Prueba U de Mann-Whitney (Test U)
Esta prueba se utiliza para comparar dos muestras independientes.
- Es para muestras independientes.
- Se basa en la combinación de los conjuntos de las $n_1$ y $n_2$ observaciones.
- Cuando todas las observaciones están juntas, se asigna un rango a cada una de las observaciones ordenadas, que comienza en el número 1 y termina en $n_1 + n_2$.
Procedimiento
- Se ordenan los datos de menor a mayor en un solo conjunto.
- Se calcula $R_1$ y $R_2$ (sumatoria de todos los rangos de $N_1$ y $N_2$).
- Se calcula el valor del estadístico $U$.
- Se toma el valor de $U$ más pequeño y se revisa la Tabla. La región crítica contiene valores de $U$ igual o menor al valor crítico. Por lo tanto, si $U$ es mayor, no habrá prueba suficiente para rechazar $H_0$.
Hipótesis
- H0: Si ocurre X condición (Ej: Las medianas poblacionales son iguales).
- HA: No ocurre X condición (Ej: Las medianas poblacionales son diferentes).
Prueba de Wilcoxon (Test de Signos)
Esta prueba se utiliza para muestras relacionadas o dependientes (datos pareados).
- Es para muestras relacionadas, es decir, se utiliza cuando las muestras no son independientes.
- Es para determinar la frecuencia con la cual el valor de un miembro del par es superior al valor del otro miembro del par.
- Se utiliza la prueba del Signo. Un elemento de A mayor que B, es positivo y viceversa.
Consideraciones Generales sobre Métodos No Paramétricos
- Para realizar análisis no paramétricos, las variables deben ser resumidas a categorías discretas (o tratadas como ordinales).
- Estos métodos (basados en rangos) son la alternativa no paramétrica al análisis de varianza (ANOVA) y la prueba $t$, ya que se basan en los rangos de las observaciones en lugar de las observaciones mismas.
- Esta metodología utiliza información acerca de los tamaños relativos de las observaciones, sin asumir nada acerca de la naturaleza específica de la población desde donde se obtuvieron los datos.
- Se utiliza este método cada vez que el tamaño de las muestras es pequeño y, por lo tanto, no hay garantía de que los estimadores tengan distribución normal.