Conceptos Clave de Estadística Descriptiva: Medidas y Fórmulas

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 576,05 KB

Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o población estadística.

MedidaDatos no agrupadosDatos agrupados

Moda (Mo)

Valor de la variable al que le corresponde la máxima frecuencia absoluta.

Máxima fi

DbD37bgmKfYAAAAASUVORK5CYII=

Donde:

  • Δ1: Diferencia entre la frecuencia modal y la frecuencia absoluta anterior a la moda.
  • Δ2: Diferencia entre la frecuencia modal y la frecuencia absoluta posterior a la moda.

Mediana (Me)

Valor de la variable que se encuentra exactamente en el centro de los datos, dejando a cada lado el 50% de las observaciones.

  • Si n es par: es el promedio de los dos datos centrales. Posiciones: n/2 y (n/2)+1.
  • Si n es impar: es el dato central. Posición: (n+1)/2.

Dh5dITgUSgEgLJd5XgysGJQCLQYASS7xp8eLn0RCARqIRA8l0luHJwIpAINBiB5LsGH14uPRFIBCohkHxXCa4cnAgkAg1G4L8B1RFOXLpOPU4AAAAASUVORK5CYII=

Donde:

  • Lli: Límite inferior del intervalo de la mediana.
  • c: Amplitud del intervalo.
  • Fa: Frecuencia acumulada del intervalo anterior al de la mediana.
  • Fm: Frecuencia absoluta del intervalo de la mediana.

Media (iiQfISM460oJyJMGI4slsC1QNGibhUm2pW4J3qqmWwCXEI7cNNTcGtfmCEGwhOF1jLL6pp2NNF7OdidH3j+7Tf+XmE6WTiT9wAAAABJRU5ErkJggg== )

Promedio que se calcula sumando todos los valores de la variable y dividiendo por el tamaño de la muestra.

7FwEIctasWXil0dYwh2ByVLHQuzWUwJRQFAGHCKiI6BBc7VoRUALTPaAIOERACcwhuNq1IqAEpntAEXCIgBKYQ3C1a0VACUz3gCLgEAElMIfgateKgBKY7gFFwCECSmAOwdWuFQElMN0DioBDBJTAHIKrXSsCSmC6BxQBhwgogTkEV7tWBP4HhpUHJOwOprIAAAAASUVORK5CYII=

sYbQSoAAAAASUVORK5CYII=

cJhQfUt31qz13hAbXXcX2fUHhAfdun9tz9A7wCSSO3n2AZAAAAAElFTkSuQmCC

mi0IEGdTwLAxPii8UhHiYk5IOXjaHCpxy6ovgcaRh6TeEbpvcjAYmvbysfR52MMbXwqj080w75EDnlWe0pHiigfp+Op+VgzCQ0jRoygtCnpC3ylJToBbv+kgfKxD55Iu6bkoWFlmzJlCnFClGfIyspKuy0YLlj52JBQadmM1PRnnnkGLzTZaPfcc09a7sFs0crHZnRKw1bkpcO+aHg9evR44IEHbFFviGrqP1Hwl7o2abg5+5KVjyNwiHG2gAwmlB4DBaGbVCEjxs3WCO80JuRvvvkmGvtXP0g0ztG+CxLyOnTogKzFOlGlShXbz6T6UrKaUuqE1S9ZsiQCH5pQPo4gH8t3DVHvCGpz3x4V1BcuXEjuU7pTQXFFup9gnPWDibds2eLJxPTkYy7RKBui8jiCfJyBW1J5nIGHHsEtKx9H8FAzcEvKxxl46BHcsvJxBA81A7ekfJyBhx7BLf8HUs2eJTnTUlsAAAAASUVORK5CYII=

aYvO4mECZdnnS7UnK1svycjw7bDsUs1HWNrWndtY9SGVso8qbd8dPUMUSmeThBOmWdzZWCiUSqPUTsl89TnHrrFyDDBJylIjlkJJHKopDVnVlZnXoosqWMK27ttNpR5Gg51LoGyQYUO2Oa94+Oiij5lWfTjRxh3OcVBZpVjAH4oCVOh3gQs9gXLIoqzBtzk3edCgQUApzF1VtSfYLeSIHrxyEinr8xUcXxsJH0nu6CuBstTTx8QhDimUyvCrPpzomJpQxCc5w7eUfRpBSx8f7wKHZQJlqUHJGeTEpeA25yGv7CtjfODAgYxuWzxjyMl4vmDX4ieaS8KLVDhWkoloshui4T7DzU+ZfeC7SUJleiyBskyzkfryHw6k7TsBoXQcSKAs3ZSkDiVQJgyUjgMJlKWbktShBMqEgdJxIIGydFOSOpRAmTBQOg4kUJZuSlKHEigTBkrHgX8DsZVU4DH+vHQAAAAASUVORK5CYII=

Donde Xi es la marca de clase.

Medidas de posición no centrales

Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales.

MedidaDatos no agrupadosDatos agrupados

Cuartiles (Qk)

Los cuartiles dividen la distribución en cuatro partes iguales. Hay tres cuartiles (Q1, Q2 y Q3) que separan los datos en tramos del 25%.

Para encontrar la posición:

KQ2cQnzpgxI10vJ8txyJAhlKDKP5WOFAjKI75AQl4AHBC9PAAmyhAR54CgPOILJOQFwAFBeQBMlCEizgFBecQXSMgLgAOC8gCYKENEnAOC8ogvkJAXAAf+CwjIAG4UsJn1AAAAAElFTkSuQmCC     fr1602LjVTUm3YzrqU9GIh6UXvwHmftTRiIVNSbdjOupT0YiFTUHrzHWXsTBv4PFVfI2NlvX9UAAAAASUVORK5CYII=

gYXnxEYXJEyPwAAAABJRU5ErkJggg==

8FZw9Ko6NKCvEAAAAASUVORK5CYII=

Nota: El cuartil 2 (Q2) equivale al 50%, por lo tanto, es igual a la mediana.

Rango intercuartílico (RI)

1O1xAAAAABJRU5ErkJggg==

wAAAAASUVORK5CYII=

PToRIGSFPgfa8fC1C1D+RcAAAAASUVORK5CYII=

Donde:

  • Lli: Límite inferior del intervalo del cuartil.
  • c: Amplitud del intervalo.
  • Fa: Frecuencia acumulada del intervalo anterior al del cuartil.
  • Fq: Frecuencia absoluta del intervalo del cuartil.

Medidas de dispersión

Las medidas de dispersión indican qué tanto se alejan los datos respecto a la media aritmética, sirviendo para medir la variabilidad de los datos.

MedidaDatos no agrupadosDatos agrupados

Desviación media

Distancia promedio que existe entre cada dato y la media de la distribución.

AWaRTmlJGl42AAAAAElFTkSuQmCC

Varianza (S²)

Mide la dispersión de los datos respecto al valor medio.

NWVuuukmeYo4skl+Kz70hBNOmFMHl0AvIASSqC2gxcqhDkaAKg3bFaJln4hOVGzJkiWLFi0Khk5Y6D777HPSSSdV+rXBPWWJaUUg03lP68rkuJpHQCiVSClebGhchkk1j3dLPSRRawno7CYRSATaQSDFz3Zwzl4SgUSgJQSSqLUEdHaTCCQC7SCQRK0dnLOXRCARaAmBJGotAZ3dJAKJQDsIJFFrB+fsJRFIBFpCIIlaS0BnN4lAItAOAknU2sE5e0kEEoGWEEii1hLQ2U0ikAi0g0AStXZwzl4SgUSgJQSSqLUEdHaTCCQC7SCQRK0dnLOXRCARaAmBfwDmvLLlsunxKAAAAABJRU5ErkJggg==

wB0HgwF1irRsQAAAABJRU5ErkJggg==

Desviación estándar (S)

Es la raíz cuadrada de la varianza y ofrece información de la dispersión media de una variable.

Gei+FqR2ASyVi5RvWTUw10jqi49qX2XRUdjhiBSSRjEEtalGeDIUdexIg3XAw3DAQmlIzdFbbvvvumKzxZuYaBbPQZCIwMgYaXDcjBUZqEijMU4zXXXDOCMUe24WKgYSAwuWQ8DDSjz0BgShCYUKF6SrCOQQOBISEQZDwkYKPbQGB0CAQZjw7rGCkQGBICQcZDAja6DQRGh0CQ8eiwjpECgSEhEGQ8JGCj20BgdAgEGY8O6xgpEBgSAv8PduRp64aJDU0AAAAASUVORK5CYII=

CV0EPU1AAAAABJRU5ErkJggg==

ZoVYSq+g3XOIDKQxp3Pl0UYhvPRoxY6hmf6UTEgukjRueWvJOLOfjv7tneb2mSY2dwW3LotqGgIdvbMGmSTTZkW3LotqHgP1NGH1JojZAeAAAAAElFTkSuQmCC

B3WeJToSF0jgAAAAAElFTkSuQmCC

Coeficiente de variación (CV)

Medida de dispersión relativa que se utiliza para comparar la dispersión entre distintas muestras, ya que es adimensional.

Ef41Pu4WVw5GkAAAAASUVORK5CYII=

ZoVYSq+g3XOIDKQxp3Pl0UYhvPRoxY6hmf6UTEgukjRueWvJOLOfjv7tneb2mSY2dwW3LotqGgIdvbMGmSTTZkW3LotqHgP1NGH1JojZAeAAAAAElFTkSuQmCC

vGqAvYevqAk06EwQMjBaUFWEKQTV3AadCUIGRguqiiAUVHMbdCYIGRgtqCqCUFDNbdCZIGRgtKCqCEJBNbdBZ4KQgdGCqiIIBdXcBp0JQgZGC6qKIBRUcxt0JggZGC2oKn8BIRLhx97MzmUAAAAASUVORK5CYII=

Asimetría

Mide el grado de desviación de los datos hacia la derecha o izquierda de la media. En otras palabras, indica si los datos se distribuyen de forma simétrica alrededor de la tendencia central.

gfey+MMiCH9GAAAAABJRU5ErkJggg==

Coeficiente de asimetría de Pearson

L5jh8AFoXEbFAAAAAElFTkSuQmCC               fIAAAAASUVORK5CYII=

jK5NWazo1ngAAAAASUVORK5CYII=

Interpretación del coeficiente de asimetría (As)

Según su valor absoluto:
  • Si |As| ≤ 0,2: la Media se considera representativa de la distribución de datos. Aunque se desplace de la Mediana, su representatividad se mantiene.
  • Si |As| > 0,2: la Media deja de ser representativa. En este caso, la Mediana o la Moda son mejores indicadores de la tendencia central.
Según su signo:
  • As < 0 (Asimetría negativa): La cola de la distribución se alarga hacia la izquierda. La Media es menor que la Mediana (Media < Mediana).
  • As > 0 (Asimetría positiva): La cola de la distribución se alarga hacia la derecha. La Media es mayor que la Mediana (Media > Mediana).

Diagrama de cajas y bigotes (Box Plot)

El diagrama de cajas es una representación gráfica que resume las medidas de posición y dispersión, y ayuda a identificar valores atípicos de forma visual.

AdJH3FBDWQpBAAAAAElFTkSuQmCC

Entradas relacionadas: