Conceptos Clave en Estadística Descriptiva y Modelos Predictivos

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 3,12 KB

Medidas de Dispersión

Desviación Media

Es el promedio de los valores absolutos de las **desviaciones** de cada dato con respecto a la **media**; representa la lejanía de los datos con respecto a la media o promedio.

Varianza

Es una de las **medidas de dispersión** más utilizadas; indica la media de las diferencias (elevadas al cuadrado) de cada valor con respecto a la **media** y se representa mediante la variable d².

La **varianza** es la medida de dispersión más importante; se basa en el promedio aritmético de las desviaciones (de un valor con respecto a la media) elevadas al cuadrado.

Desviación Estándar

Es la **raíz cuadrada de la varianza**; se representa mediante la variable d.

La **desviación estándar** es la medida de dispersión más utilizada, ya que su resultado se expresa en las mismas unidades que los datos originales.

Relación entre Variables

Diagrama de Dispersión

El **diagrama de dispersión**, también llamado centroide, es una herramienta gráfica que ayuda a identificar la posible relación entre dos variables, facilitando la visualización e interpretación de los datos.

Covarianza

La **covarianza** es una medida descriptiva que permite medir el tipo de asociación lineal entre dos variables.

Ecuación de la Recta de Regresión

La **ecuación de la recta de regresión** permite pronosticar la puntuación que alcanzará cada supuesto en una variable Y, conociendo su puntuación en la variable X. La ecuación de una recta se determina de acuerdo con las condiciones que cumple el conjunto de puntos que la forman.

Coeficiente de Correlación

El **coeficiente de correlación** se utiliza para medir la magnitud de la relación lineal entre dos variables; es decir, indica cuán fuerte o débil es una relación lineal y se representa mediante la variable r, también llamada **r de Pearson**.

Otros Conceptos Estadísticos

Sesgo

Representa el grado de **simetría o asimetría** en la distribución de frecuencias; es decir, describe la distribución de datos con respecto a la **media**. Las medidas más comunes para obtener el sesgo son la **media**, la **mediana** y la **moda**, y este se representa por curvas de sesgo positivo, negativo o cero.

Centro de Gravedad

Es el **punto de equilibrio** de un conjunto de datos en un diagrama de dispersión, cuyas coordenadas son (X, Y).

Series de Tiempo

En estadística, se le llama así a un conjunto de valores observados durante una serie de periodos temporales (semanales, mensuales, trimestrales o anuales) secuencialmente ordenados. Se representa a través de una gráfica de líneas sobre cuyo eje X se registran los periodos y en cuyo eje Y los valores de la serie de tiempo.

El **análisis de series de tiempo** es el procedimiento por el cual se identifican y aíslan los factores relacionados con el tiempo que influyen en los valores observados en las series de tiempo, para que, una vez identificados, puedan contribuir a la interpretación de valores históricos y así predecir valores futuros.

Entradas relacionadas: