Conceptos Clave en Estadística Descriptiva y Modelos Predictivos
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 3,12 KB
Medidas de Dispersión
Desviación Media
Es el promedio de los valores absolutos de las **desviaciones** de cada dato con respecto a la **media**; representa la lejanía de los datos con respecto a la media o promedio.
Varianza
Es una de las **medidas de dispersión** más utilizadas; indica la media de las diferencias (elevadas al cuadrado) de cada valor con respecto a la **media** y se representa mediante la variable d².
La **varianza** es la medida de dispersión más importante; se basa en el promedio aritmético de las desviaciones (de un valor con respecto a la media) elevadas al cuadrado.
Desviación Estándar
Es la **raíz cuadrada de la varianza**; se representa mediante la variable d.
La **desviación estándar** es la medida de dispersión más utilizada, ya que su resultado se expresa en las mismas unidades que los datos originales.
Relación entre Variables
Diagrama de Dispersión
El **diagrama de dispersión**, también llamado centroide, es una herramienta gráfica que ayuda a identificar la posible relación entre dos variables, facilitando la visualización e interpretación de los datos.
Covarianza
La **covarianza** es una medida descriptiva que permite medir el tipo de asociación lineal entre dos variables.
Ecuación de la Recta de Regresión
La **ecuación de la recta de regresión** permite pronosticar la puntuación que alcanzará cada supuesto en una variable Y, conociendo su puntuación en la variable X. La ecuación de una recta se determina de acuerdo con las condiciones que cumple el conjunto de puntos que la forman.
Coeficiente de Correlación
El **coeficiente de correlación** se utiliza para medir la magnitud de la relación lineal entre dos variables; es decir, indica cuán fuerte o débil es una relación lineal y se representa mediante la variable r, también llamada **r de Pearson**.
Otros Conceptos Estadísticos
Sesgo
Representa el grado de **simetría o asimetría** en la distribución de frecuencias; es decir, describe la distribución de datos con respecto a la **media**. Las medidas más comunes para obtener el sesgo son la **media**, la **mediana** y la **moda**, y este se representa por curvas de sesgo positivo, negativo o cero.
Centro de Gravedad
Es el **punto de equilibrio** de un conjunto de datos en un diagrama de dispersión, cuyas coordenadas son (X, Y).
Series de Tiempo
En estadística, se le llama así a un conjunto de valores observados durante una serie de periodos temporales (semanales, mensuales, trimestrales o anuales) secuencialmente ordenados. Se representa a través de una gráfica de líneas sobre cuyo eje X se registran los periodos y en cuyo eje Y los valores de la serie de tiempo.
El **análisis de series de tiempo** es el procedimiento por el cual se identifican y aíslan los factores relacionados con el tiempo que influyen en los valores observados en las series de tiempo, para que, una vez identificados, puedan contribuir a la interpretación de valores históricos y así predecir valores futuros.