Estadística Bidimensional: Correlación, Regresión y Dependencia de Variables
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 4,75 KB
Estadística Bidimensional y Relación entre Variables
Procedimiento para el Estudio de Dos Variables
Para realizar un estudio estadístico de dos variables, se deben seguir los siguientes pasos fundamentales:
- 1) Formar una tabla para cada variable: Es necesario organizar los datos incluyendo las columnas de xi (valores de la variable), ni (frecuencia absoluta), Ni (frecuencia acumulada) y el producto xi · ni.
- 2) Cálculo de parámetros: Obtener la media, la desviación típica y la varianza de cada variable de forma independiente.
- 3) Tabla conjunta: Elaborar la tabla de doble entrada necesaria para calcular la covarianza.
- 4) Coeficiente de Correlación de Pearson (r): Este indicador mide la fuerza de la relación lineal:
- 1: Indica una relación fuerte y directa.
- -1: Indica una relación fuerte inversa.
- 0: Indica que no existe relación lineal entre las variables.
- 5) Recta de regresión: Si el valor de r es muy próximo a 0, se considera que no tiene sentido calcular la recta de regresión.
Dependencia e Independencia Estadística
Para determinar la independencia en una tabla con ambas variables, se debe observar cada frecuencia conjunta (nij). Se debe multiplicar el sumatorio de su columna en el eje X (ni) por el sumatorio de su fila en el eje Y (nj) y dividir el resultado entre el total de la muestra (N).
Si para todos los casos se cumple la igualdad nij = (ni * nj) / N, entonces las variables son independientes.
Conceptos Fundamentales y Representación Gráfica
- Población: Se define como el conjunto de unidades que son objeto de nuestro estudio estadístico.
- Gráfica de dispersión: Se utiliza cuando se dispone de muchos datos de distintos valores. Se representa cada punto en una gráfica y, posteriormente, se traza una línea que pase por el centro de la nube de puntos.
Teoría de la Correlación y Relaciones Lineales
- Aunque el coeficiente de correlación sea cero (lo que indica que no hay relación lineal), el hecho de que las variables estén incorrelacionadas no significa necesariamente que no exista ningún otro tipo de relación.
- Afirmar que dos variables son independientes implica que no existe ningún tipo de relación entre ellas.
- Si una de las rectas de regresión (Y sobre X o viceversa) es paralela al eje de abscisas, significa que no hay relación lineal, pero no descarta otros tipos de dependencia.
- En los diagramas de dispersión, si los puntos no siguen una lógica visual y están simplemente desperdigados, se asume que r = 0.
- Si X e Y son independientes, entonces X e Y están incorrelacionadas (r = 0 y covarianza S = 0).
- Si S = 0 (y por tanto r = 0), las variables están incorrelacionadas; sin embargo, si r es distinto de 0, esto no implica necesariamente que X e Y sean independientes.
Coeficientes de Spearman y Contingencia
Coeficiente de Spearman (Grado de concordancia)
Se utiliza para medir la correlación entre rangos mediante la fórmula: ρ = 1 - (6 * Σd²) / (N * (N² - 1)).
Para valores grandes (que pasen de 10), los datos se deben ordenar de menor a mayor según sus valores. Se realiza la asignación de rangos, se calcula la diferencia entre ellos (di), se eleva al cuadrado (di²) y se aplica la fórmula correspondiente.
Coeficiente de Contingencia y Chi-cuadrado
Para analizar la relación entre atributos, se siguen estos pasos:
- 1) Calcular el estadístico Chi-cuadrado (χ²) evaluando la independencia de cada miembro mediante la fórmula: (nij - (ni * nj) / N)² / ((ni * nj) / N).
- 2) Si el resultado final es X = 0, los atributos son independientes.
- 3) La suma de todos estos valores permite obtener el coeficiente de contingencia de Pearson para determinar el grado de asociación.