Fundamentos de Estadística: Tablas, Medidas y Cálculo de Muestras

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 6,21 KB

Tablas de Frecuencia en Estadística Descriptiva

Tablas con Datos Absolutos No Agrupados

Una tabla con datos absolutos no agrupados organiza la información de manera sencilla, mostrando la frecuencia de cada valor individual de la variable.

  • 1° columna: Valor de la variable; por ejemplo, el número de hijos.
  • 2° columna: Frecuencia Absoluta (f); es el número de veces que se repite una observación o valor de la variable.
  • 3° columna: Frecuencia Relativa (fr); se obtiene dividiendo la frecuencia absoluta (f) de cada valor por el total de observaciones.
  • 4° columna: Porcentaje (%); se calcula multiplicando cada frecuencia relativa (fr) por 100.

Tablas con Datos Absolutos Agrupados

Para construir una tabla con datos agrupados, es fundamental conocer el Rango o Recorrido de los datos.

  • 1° columna: Intervalo de Clase (Ki):
    • Se calcula el Rango o Recorrido restando el valor mayor con el menor. Ejemplo: 51 - 10 = 41.
    • Se determina el tamaño del intervalo dividiendo el recorrido por el número de intervalos deseados. Ejemplo: 41 (recorrido) dividido por 14 (número de intervalos aproximado) = 3.
    • Se comienza con el valor menor de los datos y se le suma el tamaño del intervalo para formar los límites. Ejemplo: 10-12; 13-15 y así sucesivamente.
  • 2° columna: Frecuencia Absoluta (f): Cantidad de valores que existen dentro de un intervalo determinado. Ejemplo: Para el intervalo 10-12, si en la tabla solo existe el número 10, entonces la frecuencia es 1.
  • 3° columna: Marca de Clase (Kmi): Valor central del intervalo o punto medio. Se suman los límites del intervalo y se dividen por 2. Ejemplo: (10 + 12) / 2 = 11.
  • 4° columna: Producto de Frecuencia por Marca de Clase (fi * Kmi): Se multiplica la marca de clase (columna 3) por la frecuencia (columna 2).
  • 5° columna: Desviación (Di): Se divide el valor total de la columna 4 por el valor total de la columna 2. Al número resultante se le asigna el 0, los valores superiores son negativos y los inferiores son positivos.
  • 6° columna: Producto de Frecuencia por Desviación (fi * Di): Se completa con la multiplicación de la columna 5 (Di) por la columna 2 (Frecuencia).

Nota: Antes de realizar cualquier cálculo, es crucial ordenar los datos.

Medidas Estadísticas Clave

Medidas de Tendencia Central

Media Aritmética

Se suman todos los datos y se dividen por la cantidad total de datos.

Mediana

Cuando la cantidad de datos es par, se suman los dos valores centrales y se dividen por 2; cuando es impar, la mediana es el valor central de los datos ordenados.

Medidas de Dispersión

Rango o Recorrido

Se resta el valor mayor con el valor menor de los datos.

Varianza y Desviación Estándar

Para calcular la Varianza y la Desviación Estándar, primero se calcula la distancia al cuadrado de cada dato respecto a la media.

  1. Se resta la media a cada dato individual.
  2. El resultado se eleva al cuadrado (se multiplica por sí mismo) para asegurar que el valor sea positivo.
  3. Se suman todos los datos elevados al cuadrado y se dividen por la cantidad total de datos. Este resultado es la Varianza.
  4. Para obtener la Desviación Estándar o Típica, se calcula la raíz cuadrada de la varianza.

Medidas de Posición: Deciles y Quintiles

Deciles

Un Decil representa el 10% de los datos. Para calcular su posición, se divide la cantidad total de datos por 10. Ejemplo: 60 datos / 10 = 6. Se forman grupos de 6 números.

  • El primer decil corresponde al 10%.
  • El segundo decil corresponde al 20%, y así sucesivamente, hasta llegar al 100%.

Quintiles

Los Quintiles dividen los datos en cinco partes iguales, cada una representando el 20%.

  • El primer Quintil es el 20%.
  • El segundo Quintil es el 40%.
  • El tercer Quintil es el 60%.
  • El cuarto Quintil es el 80%.
  • El quinto Quintil es el 100%.

Conceptos Fundamentales de Muestreo Estadístico

Cálculo del Tamaño de Muestra

Para determinar el tamaño de una muestra (n), se utilizan diferentes fórmulas dependiendo de si la población es infinita o finita. Se requieren los siguientes parámetros:

  • Z: Factor de confianza (por ejemplo, 1.96 para un 95% de confianza).
  • σ² (sigma al cuadrado): Varianza de la población (a menudo estimada como p*q, por ejemplo, 0.5 * 0.5 = 0.25 si no se conoce).
  • E: Error máximo permitido (por ejemplo, 3%, 5% o 1%).

Muestra Infinita

n = (Z² * σ²) / E²

Muestra Finita

n = (N * Z² * σ²) / (E² * (N-1) + Z² * σ²)

Tabla de Variables para Cálculo de Muestra

A continuación, se listan las variables comunes utilizadas en el cálculo del tamaño de muestra:

  • Comuna
  • Año
  • Población (N): Valor total de la población.
  • Factor de Confianza (Z)
  • Factor de Confianza al Cuadrado (Z²)
  • p*q (σ² = 0.25)
  • Error (E = 0.03)
  • Error al Cuadrado (E² = 0.03 * 0.03)

Definiciones Clave en Muestreo

Muestra

Un subconjunto representativo de elementos que han sido extraídos de la población.

Elementos

La unidad acerca de la cual se está recolectando la información.

Muestreo

El procedimiento mediante el cual se extraen algunos elementos de una población con ciertas características definidas.

Unidad de Muestreo

Elementos que se encuentran disponibles para su selección en alguna etapa del proceso de muestreo.

Entradas relacionadas: