Conceptos Fundamentales de Estadística y Probabilidad para el Manejo de Datos

Enviado por Programa Chuletas y clasificado en Matemáticas

Escrito el en español con un tamaño de 5,26 KB

Conceptos Fundamentales de Estadística y Probabilidad

Estadística Descriptiva: Definiciones Clave

  • Estadística: Disciplina ligada a los métodos científicos en la organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. En un sentido más estricto, el término se utiliza para describir los datos numéricos que se derivan de ellos, por ejemplo, promedios.
  • Datos Estadísticos: Es la observación y anotación sistemática de un suceso estadístico.
  • Colectivos o Series Estadísticas: Es el conjunto formado por todos los datos estadísticos, a menudo denominados series estadísticas.
  • Población o Universo: Es el conjunto total de todos los elementos o datos posibles que cumplen una característica determinada.
  • Muestra: Es cuando se selecciona solo una parte o subconjunto de todos los datos de una población.

Probabilidad y Eventos: Conceptos Básicos

  • Probabilidad: Es la parte de la matemática que se encarga del estudio del carácter aleatorio de los sucesos o fenómenos.
  • Espacio Muestral: Es el conjunto de todos los resultados posibles de un experimento aleatorio.
  • Experimento Aleatorio: Es aquel cuyos resultados no se pueden predecir con certeza.
  • Evento o Suceso: Es cualquier subconjunto de un espacio muestral, asociado a un experimento aleatorio.

Nota: Los términos "Nunca, siempre y probable" se refieren a la probabilidad de un evento: imposible, seguro y probable, respectivamente.

Variables Estadísticas: Clasificación y Tipos

  • Variables Estadísticas: Son los fenómenos o sucesos que, bajo las mismas condiciones, dan resultados distintos debido a la intervención del azar. Se desglosan en:
    • Cualitativa: Cuando no se pueden medir con números y se describen con palabras.
    • Cuantitativa: Cuando se expresan con números.

Las variables cuantitativas pueden ser discretas y continuas:

  • Discretas: Cuando toman solamente un número finito de valores numéricos.
  • Continuas: Cuando son capaces de tomar cualquier valor en un intervalo dado y se expresan, a menudo, con números decimales.

Organización y Frecuencias de Datos

Elementos para la Distribución de Frecuencias

  • Límites de Intervalo: Li (límite inferior), Ls (límite superior).
  • Amplitud del Intervalo: Es el tamaño de cada intervalo en una distribución de frecuencias.
  • Marca de Clase (Xi): Es el punto medio de cada intervalo, calculado sumando los límites superior e inferior y dividiendo entre 2.

Tipos de Frecuencias

  • Frecuencia Absoluta (fi): Es el número de veces que se repite un dato en un conjunto.
  • Frecuencia Absoluta Acumulada (Fi): Es la suma de la frecuencia absoluta de un dato más las frecuencias absolutas de los datos anteriores.
  • Frecuencia Relativa (fr): Indica la proporción de veces que se repite un dato respecto al total de datos. Se obtiene dividiendo la frecuencia absoluta entre el número total de datos.
  • Frecuencia Relativa Acumulada (Fr): Es la suma de la frecuencia relativa de un dato más las frecuencias relativas de los datos anteriores.
  • Frecuencia Relativa Porcentual (fr%): Es la frecuencia relativa expresada como porcentaje. Se obtiene multiplicando la frecuencia relativa por 100.
  • Frecuencia Relativa Porcentual Acumulada (Fr%): Es la suma de las frecuencias relativas porcentuales de un dato más las de los datos anteriores.

Medidas de Tendencia Central: Cálculo y Significado

  • Media Aritmética (Promedio): Se calcula de dos formas principales:
    • Sin datos agrupar: Se suman todos los valores y se divide entre el número total de datos (N).
    • Con datos agrupados: Para calcular la media aritmética se utiliza la fórmula: Σ(Xi * fi) / N, donde Xi es la marca de clase, fi es la frecuencia absoluta y N es el número total de datos.
  • Mediana (Me): Es el valor central de una variable cuando los datos están ordenados. La mitad de los datos están por encima de este valor y la otra mitad por debajo.
    • Para datos sin agrupar: Se ordenan los datos de menor a mayor (o viceversa) y se escoge el valor central. Si quedan dos valores centrales, se suman y se dividen entre 2.
    • Para datos agrupados: Se identifica el intervalo que contiene la mediana. Para ello, se calcula N/2 y se ubica en la columna de frecuencia acumulada (Fi) el primer valor que sea igual o superior a N/2.
  • Moda (Mo): Es el valor que más se repite en un conjunto de datos. No necesariamente tiene que ser único (puede haber una o varias modas).

Entradas relacionadas: