Conceptos Fundamentales de Datos, Variables y Estadística Descriptiva
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en
español con un tamaño de 4,66 KB
1. Conceptos Fundamentales en Estadística
Tipos de Datos
Para empezar, un dato se entiende como una unidad de información que, en conjunto, puede clasificarse en dos tipos principales:
Datos Cuantitativos
- Se registran mediante números.
- Discretos: Se representan con números enteros, por ejemplo, la edad.
- Continuos: Se representan con números reales, por ejemplo, la estatura.
Datos Cualitativos o Categóricos
- Se registran mediante caracteres, palabras o símbolos no numéricos.
- Ordinales: Pueden adquirir un orden, por ejemplo, el grado de satisfacción de un producto (muy insatisfecho, insatisfecho, neutro, satisfecho, muy satisfecho).
- No Ordinales: Son de carácter descriptivo sin seguir un orden, por ejemplo, el color de ojos (azul, verde, marrón).
2. La Variable Estadística
Cuando se registra una característica observable de un objeto o fenómeno, en la mayoría de los casos, esta observación o dato varía en un conjunto de posibilidades; de lo contrario, no sería de interés.
Es entonces cuando a esta característica se le denomina variable, es decir, un dato que puede tomar valores en un conjunto de dos o más elementos. Las variables heredan la clasificación de los datos, y con ello, se distinguen variables cuantitativas y cualitativas o categóricas.
Ejemplo: Tipos de Variables
- La edad es una variable cuantitativa discreta que varía en el conjunto {0, 1, 2, 3,...}.
- El promedio de calificaciones es una variable cuantitativa continua que varía en el conjunto [5, 10].
- Los niveles de asma corresponden a una variable cualitativa ordinal que varía en el conjunto {leve, moderado, severo}.
- La prueba de COVID-19 es una variable cualitativa no ordinal que varía en el conjunto {positivo, negativo}.
3. Tipos de Estadística
Estadística Descriptiva
Describe las características de los datos. Utiliza gráficos, tablas e indicadores.
Estadística Inferencial
Engloba los métodos que permiten generalizar a partir del estudio de los datos de una muestra a una población.
Tipos de Estadística según el Modelo
Estadística Paramétrica
Obtiene conclusiones bajo el cumplimiento de una condición dada por ciertos parámetros.
Estadística No Paramétrica
No es posible suponer algún tipo de distribución ni parámetros para los datos estudiados.
4. Tablas de Frecuencia
La estadística descriptiva se encarga de los métodos de recolección y descripción de datos, principalmente a través de tablas de frecuencia (de datos agrupados o no agrupados). Ambas se construyen a partir de un conjunto de observaciones sobre una variable, extraídas de una población o muestra.
Tablas de Frecuencia para Datos No Agrupados
Para construir una tabla de datos no agrupados, es importante que estos varíen en un conjunto finito de elementos, que pueden ser cuantitativos o cualitativos (categóricos), pero sin variar en un número grande de posibles valores. A partir de 10 posibles resultados, convendría optar por lo que se definirá como una tabla de frecuencias de datos agrupados.
Para la construcción de una tabla de frecuencia de datos no agrupados, la primera columna debe estar conformada por los posibles resultados. Si los datos son ordinales, se deben colocar de forma ascendente.
Estructura de una Tabla de Frecuencia
Las columnas típicas de una tabla de frecuencia son:
- Resultados Posibles: Los valores únicos que puede tomar la variable.
- Frecuencia (f): El número de ocurrencias de cada resultado en el conjunto de datos recolectados.
- Frecuencia Acumulada (F): La suma consecutiva y acumulada de las frecuencias.
- Frecuencia Relativa (fr): La proporción de la ocurrencia de cada resultado con respecto al número total de datos.
- Frecuencia Relativa Acumulada (Fr): La suma consecutiva y acumulada de las frecuencias relativas.
Tablas de Frecuencia para Datos Agrupados
Las tablas de frecuencias para datos agrupados se utilizan cuando las observaciones pueden variar en un conjunto amplio de valores. Por ejemplo, si los datos recolectados son la estatura de un grupo de personas, no sería práctico enlistar todas las posibles opciones, incluso si la estatura varía entre dos valores relativamente cercanos como 1.50 m y 1.75 m.