Fundamentos de Estadística Descriptiva: Variables, Frecuencias y Medidas de Posición

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,93 KB

Conceptos Fundamentales de Estadística

Definición de Estadística

La estadística es una rama de la matemática que se ocupa de la recolección, organización, análisis e interpretación de los datos obtenidos; esta información se organiza en tablas y/o gráficos.

Definición de Población

La población es el conjunto de individuos que se pretende estudiar estadísticamente.

Definición de Muestra

La muestra es un subconjunto de la población. Para que las conclusiones sean válidas, la muestra debe ser representativa, es decir, debe elegirse de manera tal que arroje resultados muy próximos a los que se obtendrían encuestando a toda la población.

Tipos de Variables Estadísticas

  • Variable cualitativa: Queda definida por una característica, atributo o cualidad. Por ejemplo: sexo, nacionalidad, color de ojos, etc.

  • Variable cuantitativa discreta: Queda definida por un número natural. Por ejemplo: cantidad de hijos, número de vehículos, etc.

  • Variable cuantitativa continua: Queda definida por un número real, es decir, entre dos números consecutivos existen infinitos valores. Por ejemplo: temperatura, masa corporal, etc.

Medidas de Posición para Datos Simples

Siendo n la cantidad de observaciones:

Media Aritmética

La media aritmética se calcula sumando todos los valores de un conjunto de datos y dividiendo el resultado entre la cantidad total de esos valores.

Mediana

La mediana es el valor que ocupa la posición central una vez que los datos han sido ordenados de menor a mayor. Divide la muestra en dos partes con la misma cantidad de datos: un 50% de esos datos está a la izquierda y el otro 50% está a la derecha.

  • Si la cantidad de datos es par, la mediana es el promedio de los dos datos que ocupan la posición central.

Ejemplo:

Datos: 4, 2, 6, 9

1. Ordenamos: 2, 4, 6, 9

2. La mediana es el promedio de los valores en la posición n/2 = 2 y (n/2)+1 = 3.

3. Valores: 4 y 6.

4. Mediana = (4 + 6) / 2 = 5

Moda

La moda es el dato de mayor frecuencia (el que se repite más veces).

Tablas de Frecuencia para Datos Discretos Agrupados

Componentes de la tabla:

  • x: Valor que toma la variable.
  • f (frecuencia absoluta): Cantidad de veces que se repite el valor de la variable.
  • F (frecuencia absoluta acumulada): Se obtiene sumando las frecuencias absolutas.
  • fr (frecuencia relativa): Se calcula como f / n.
  • Frecuencia relativa porcentual (%): Se calcula como fr × 100.

Datos Agrupados en Intervalos de Clase

Cuando el tamaño de la muestra (n) es grande (generalmente mayor a 30 observaciones), es conveniente agrupar los datos en tablas de frecuencia. El agrupamiento se hace en clases o intervalos (números reales) si la variable es continua, o en valores puntuales (números naturales) si es una variable discreta.

Construcción de la Tabla de Frecuencias

La construcción de la tabla de distribución de frecuencias requiere, en primer lugar, construir los intervalos de clase, es decir, elegir los límites entre los cuales se encontrarán los valores observados. La amplitud del intervalo de clase depende del rango de las observaciones (diferencia entre el mayor y el menor valor observado) y del número de observaciones.

Se establece que la distribución de frecuencia debe tener como mínimo 5 intervalos y como máximo 15. Hay dos cuestiones a tener en cuenta:

  • Número de intervalos de clase (k): Resulta conveniente seleccionar un número natural k tal que 2k > n, siendo n el tamaño de la muestra.
  • Amplitud de los intervalos de clase (A): Se calcula como Rango / k.

Marca de clase (xi): Es el punto medio de cada intervalo. Se calcula como: (Límite inferior + Límite superior) / 2.

Fórmula para Hallar la Mediana en Intervalos de Clase

Para calcular la mediana, se siguen estos pasos:

  1. Calcular la posición n/2. Nos fijamos en la columna de frecuencia acumulada (F) para definir el intervalo base (intervalo mediano).
  2. Aplicar la fórmula: Mediana = Li + [ (n/2 - Fi-1) / fi ] × A

Donde:

  • Li: Límite inferior del intervalo base.
  • Fi-1: Frecuencia acumulada del intervalo anterior al intervalo base.
  • fi: Frecuencia absoluta del intervalo base.
  • A: Amplitud del intervalo.

Fórmula para Hallar la Moda en Intervalos de Clase

Para calcular la moda, se siguen estos pasos:

  1. El intervalo modal es el intervalo con la mayor frecuencia absoluta.
  2. Aplicar la fórmula: Moda = Li + [ d1 / (d1 + d2) ] × A

Donde:

  • Li: Límite inferior del intervalo modal.
  • d1: Diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia absoluta del intervalo anterior.
  • d2: Diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia absoluta del intervalo posterior.
  • A: Amplitud del intervalo.

Entradas relacionadas: