Fundamentos de Estadística: Conceptos Clave y Organización de Datos

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,91 KB

La estadística es la ciencia que recolecta, analiza e interpreta datos. Se divide principalmente en dos áreas: la estadística descriptiva y la estadística inferencial.

Conceptos Fundamentales

  • Población o Universo: Es el conjunto de datos cuyas propiedades se desean analizar. La cantidad de datos de la población se denota por "N".
  • Muestra: Es un subconjunto representativo de la población. La cantidad de elementos de la muestra se denota por "n".
  • Variable: Es la característica o atributo que se desea analizar en los elementos de la población o muestra.
  • Datos: Es el valor numérico o nombre del atributo de los elementos de la variable.

Ejemplo de Conceptos

  • Población: Estudiantes de Administración de Empresas de 3er año.
  • Muestra: Sección 176.
  • Variable: Edad.
  • Datos: 23, 24, 25, 22, etc.

Tipos de Variables

  • Variable Cuantitativa: Se expresa por un valor numérico.
    • Variable Cuantitativa Discreta: Se expresa por un número natural.
    • Variable Cuantitativa Continua: Se expresa por un número real.
  • Variable Cualitativa: Se expresa por el nombre del atributo.
    • Variable Cualitativa Nominal: Se expresa por el nombre del atributo sin un orden inherente.
    • Variable Cualitativa Ordinal: Admite orden y se expresa por el nombre del atributo.

Ejemplos de Tipos de Variables

  • VCD (Variable Cuantitativa Discreta): Número de artículos vendidos por un trabajador en un día.
  • VCC (Variable Cuantitativa Continua): Temperatura; índice de crecimiento económico.
  • VCN (Variable Cualitativa Nominal): Color de telefonía preferente; partido político preferido.
  • VCO (Variable Cualitativa Ordinal): Rango dentro de una empresa; nivel socioeconómico.

Organización de Datos

Después de la recolección de datos, estos deben pasar por un proceso de organización con el fin de obtener una presentación que facilite las conclusiones y el cálculo de parámetros.

Métodos de Organización

  • Datos no agrupados: Se realiza cuando la cantidad de datos es baja. Para realizar el análisis, basta con ordenarlos de manera creciente.
  • Datos agrupados en una tabla de frecuencia: Se realiza cuando la cantidad de datos es alta y cada dato tiene una alta frecuencia absoluta.
  • Datos agrupados en una tabla de frecuencia con intervalos: Se realiza cuando la cantidad de datos es alta y cada dato tiene una baja frecuencia absoluta.

Tabla de Intervalos

Para construir una tabla de intervalos, se suelen seguir los siguientes pasos:

  1. Calcular el número de intervalos (k) usando la fórmula de Sturges: k = 1 + 3.322 * log(n), donde 'n' es el número total de datos.
  2. Calcular el rango (R) restando el valor máximo menos el valor mínimo de los datos.
  3. Determinar la amplitud del intervalo (A) dividiendo el rango entre el número de intervalos: A = R / k.

Elementos de una Tabla de Frecuencia

  • fi (Frecuencia absoluta): Es el número de veces que se repite un dato o un valor dentro de un intervalo.
  • Fi (Frecuencia absoluta acumulada): Es la suma de la frecuencia absoluta de un dato (o intervalo) con las frecuencias absolutas anteriores.
  • hi (Frecuencia relativa): Es la proporción de veces que aparece un dato o intervalo respecto al total. Se calcula como hi = fi / n.
  • Hi (Frecuencia relativa acumulada): Es la suma de las frecuencias relativas anteriores, incluyendo la del dato o intervalo actual.
  • Marca de clase (MCi): Es el punto medio de cada intervalo, calculado como el promedio entre el límite inferior y el límite superior del intervalo.

Tabla de Frecuencia Simple

Una tabla de frecuencia simple típicamente incluye las siguientes columnas:

  • xi: Los valores o datos.
  • fi: Frecuencia absoluta (cantidad de veces que aparece cada xi).
  • Fi: Frecuencia absoluta acumulada (suma acumulada de fi).
  • hi: Frecuencia relativa (fi / n).
  • Hi: Frecuencia relativa acumulada (suma acumulada de hi).

Cálculo de Medidas de Tendencia Central

Promedio (Media Aritmética)

Para calcular el promedio de datos agrupados en una tabla de frecuencia simple, se multiplica cada valor (xi) por su frecuencia absoluta (fi), se suman estos productos y el resultado se divide por el número total de datos (n).

Promedio = Σ(xi * fi) / n

Mediana

La mediana es el valor que divide el conjunto de datos ordenados en dos partes iguales. Si el número total de datos (n) es par, la mediana es el promedio de los dos valores centrales. En una tabla de frecuencia, se busca la posición central (n/2) y se identifica el valor de xi o el intervalo donde se encuentra ese valor acumulado en Fi.

Moda

La moda es el dato o valor que aparece con mayor frecuencia en el conjunto de datos. En una tabla de frecuencia, la moda corresponde al valor de xi que tiene la mayor frecuencia absoluta (fi).

Tabla de Frecuencia con Intervalos

Este tipo de tabla se utiliza para organizar datos cuantitativos continuos o discretos cuando hay muchos valores diferentes. Los datos se agrupan en rangos o intervalos, y se calculan las frecuencias correspondientes para cada intervalo.

Entradas relacionadas: