Cálculo y Aplicación de Medidas Estadísticas: Media, Percentiles y Variación
Enviado por Programa Chuletas y clasificado en Francés
Escrito el en
español con un tamaño de 9,38 KB
Problemas Resueltos de Estadística Descriptiva
1. Cálculo de la Media Estratificada y Distribución de Artículos
El precio de **100 artículos** es de **185,7** en promedio. Los artículos se dividen en 2 grupos con precios promedio de 175,8 y 197,8. ¿Cuántos artículos hay en cada grupo?
Definición de Variables
- Sea $x$: el número de artículos del primer grupo.
- Sea $y$: el número de artículos del segundo grupo.
La suma total de artículos es:
$$x + y = 100$$
Cálculo de la Media Estratificada
La media general ($\bar{X}$) se calcula como la suma ponderada de las medias de cada grupo:
$$\bar{X} = \frac{\sum (n_i \cdot \bar{X}_i)}{N}$$
Donde $N=100$, $\bar{X}_1 = 175,8$ y $\bar{X}_2 = 197,8$. Sustituyendo los valores:
$$\frac{x \cdot 175,8 + y \cdot 197,8}{100} = 185,7$$
Multiplicando por 100 para eliminar el denominador:
$$175,8x + 197,8y = 18.570$$
Resolución del Sistema de Ecuaciones
Tenemos el siguiente sistema:
- $x + y = 100$
- $175,8x + 197,8y = 18.570$
Despejamos $x$ de la ecuación (1):
$$x = 100 - y$$
Reemplazamos en la ecuación (2):
$$175,8 \cdot (100 - y) + 197,8y = 18.570$$
$$17.580 - 175,8y + 197,8y = 18.570$$
$$22y = 18.570 - 17.580$$
$$22y = 990$$
$$y = \frac{990}{22}$$
$$\mathbf{y = 45}$$
Luego, calculamos $x$:
$$x + 45 = 100$$
$$\mathbf{x = 55 \text{ artículos}}$$
Respuesta: Hay **55 artículos** en el primer grupo y **45 artículos** en el segundo grupo.
2. Cálculo de Percentiles en Distribución de Frecuencias
Dada la siguiente tabla de distribución de frecuencias de salario diario (en miles de $):
| Salario Diario (miles $) | Marca de Clase ($X_i$) | N° de Obreros ($n_i$) (Frecuencia) | Frecuencia Acumulada ($N_i$) |
|---|---|---|---|
| $N=100$ | |||
| 0 - 3,0 | 1,5 | 10 | 10 |
| 3,0 - 4,0 | 3,5 | 16 | 26 |
| 4,0 - 5,0 | 4,5 | 35 | 61 |
| 5,0 - 6,0 | 5,5 | 26 | 87 |
| 6,0 - 7,0 | 6,5 | 13 | 100 |
2.1. Salario Máximo del 30% de Obreros con Sueldo más Bajo
Se busca el **Percentil 30** ($P_{30}$).
1. Se calcula la posición del 30% de 100:
$$\text{Posición} = \frac{30 \cdot 100}{100} = 30$$
2. Se localiza la posición 30 en la frecuencia acumulada ($N_i$). El valor 30 se encuentra en el intervalo donde $N_i = 61$, es decir, el intervalo **4,0 - 5,0**.
3. Aplicamos la fórmula del percentil:
$$P_k = L_{i-1} + \frac{(\frac{k \cdot n}{100} - N_{i-1})}{n_i} \cdot c$$
Donde: $L_{i-1}=4$ (Límite inferior), $k \cdot n / 100 = 30$, $N_{i-1}=26$ (Frecuencia acumulada anterior), $n_i=35$ (Frecuencia del intervalo), $c=1$ (Amplitud del intervalo).
$$P_{30} = 4 + \frac{30 - 26}{35} \cdot 1$$
$$P_{30} = 4 + \frac{4}{35}$$
$$P_{30} \approx 4 + 0,11$$
$$\mathbf{P_{30} = 4,11}$$
El **salario máximo** que gana diariamente el 30% de los obreros con sueldo más bajo es de **$4.110** (4,11 miles de $).
2.2. Porcentaje de Obreros que Gana Más de $5.500
Se busca el percentil ($k$) correspondiente al salario $X=5,5$ (miles de $). El valor 5,5 es el límite inferior del intervalo 5,0 - 6,0.
Usamos la fórmula del percentil, despejando $k$:
$$X = L_{i-1} + \frac{(\frac{k \cdot n}{100} - N_{i-1})}{n_i} \cdot c$$
Donde: $X=5,5$, $L_{i-1}=5,0$, $N_{i-1}=61$, $n_i=26$, $c=1$, $n=100$. (Nota: El cálculo original parece usar el intervalo 5,0-6,0, pero el valor 5,5 es la marca de clase, no un límite, lo cual genera una inconsistencia en la aplicación de la fórmula. Se respetará el procedimiento de despeje mostrado).
$$5,5 = 5 + \frac{(\frac{k \cdot 100}{100} - 61)}{26} \cdot 1$$
$$0,5 = \frac{k - 61}{26}$$
$$0,5 \cdot 26 = k - 61$$
$$13 = k - 61$$
$$k = 13 + 61$$
$$\mathbf{k = 74}$$
Esto significa que el **74%** de los obreros gana **$5.500 o menos** por día ($P_{74} = 5,5$).
Por lo tanto, el porcentaje de obreros que gana **más** de $5.500 es:
$$100\% - 74\% = \mathbf{26\%}$$
3. Proporcionalidad en Deciles y Percentiles
En una población, hay **350 individuos** con valores en el **Primer Decil** ($D_1$ o $P_{10}$). ¿Cuántos individuos de la población hay entre el Percentil 18 ($P_{18}$) y el Percentil 45 ($P_{45}$)?
Cálculo de la Proporción
Si el 10% de la población corresponde a 350 individuos, podemos establecer una regla de tres simple para encontrar el número de individuos en cualquier percentil.
$$\frac{\text{Porcentaje}}{\text{Individuos}} = \frac{10\%}{350}$$
Cálculo de Individuos en $P_{18}$
$$\frac{10\%}{350} = \frac{18\%}{x}$$
$$x = \frac{18 \cdot 350}{10} = 18 \cdot 35$$
$$\mathbf{x = 630 \text{ individuos}}$$
Cálculo de Individuos en $P_{45}$
$$\frac{10\%}{350} = \frac{45\%}{x}$$
$$x = \frac{45 \cdot 350}{10} = 45 \cdot 35$$
$$\mathbf{x = 1575 \text{ individuos}}$$
Individuos entre $P_{18}$ y $P_{45}$
La cantidad de individuos entre $P_{18}$ y $P_{45}$ es la diferencia entre los valores acumulados:
$$1575 - 630 = \mathbf{945 \text{ individuos}}$$
4. Comparación de Homogeneidad: Coeficiente de Variación
Se prueban dos tratamientos (A y B) para controlar un virus que ataca la hoja del tabaco. La hoja pierde valor comercial cuanto mayor sea el número de lesiones por hoja. Se mide el número de lesiones por hoja y se obtiene la siguiente tabla de frecuencias:
| $X_i$ (N° de lesiones por hoja) | $n_A$ (Frecuencia A) | $N_{iA}$ (Frec. Acum. A) | $n_B$ (Frecuencia B) | $N_{iB}$ (Frec. Acum. B) |
|---|---|---|---|---|
| TOTAL | $N_A=280$ | $N_B=400$ | ||
| 0 | 90 | 90 | 130 | 130 |
| 1 | 60 | 150 | 100 | 230 |
| 2 | 40 | 190 | 50 | 280 |
| 3 | 60 | 250 | 20 | 300 |
| 4 | 20 | 270 | 40 | 340 |
| 5 | 10 | 280 | 60 | 400 |
Concepto Clave: Coeficiente de Variación ($CV$)
El **Coeficiente de Variación** ($CV$) es una medida de dispersión relativa que permite comparar la variabilidad entre dos o más conjuntos de datos. Se calcula como la razón entre la desviación estándar ($S$) y la media ($\bar{X}$):
$$CV = \frac{S}{\bar{X}}$$
El tratamiento con el **menor $CV$** es el más **homogéneo** (menos disperso).
4.1. Análisis del Tratamiento A
1. Cálculo de la Media ($\bar{X}_A$):
$$\bar{X}_A = 1,6 \text{ lesiones}$$
2. Cálculo de la Varianza ($S_A^2$):
La varianza se calcula utilizando la fórmula simplificada (donde $T_A$ representa la varianza $S_A^2$):
$$S_A^2 = \frac{\sum n_i x_i^2 - N \bar{X}_A^2}{N}$$
$$S_A^2 = \frac{1330 - 716,8}{280} \approx 2,19$$
3. Cálculo de la Desviación Estándar ($S_A$):
$$S_A = \sqrt{2,19} \approx \mathbf{1,4799}$$
4.2. Análisis del Tratamiento B
1. Cálculo de la Media ($\bar{X}_B$):
$$\bar{X}_B = \frac{(0 \cdot 130) + (1 \cdot 100) + (2 \cdot 50) + (3 \cdot 20) + (4 \cdot 40) + (5 \cdot 60)}{400}$$
$$\bar{X}_B = \frac{0 + 100 + 100 + 60 + 160 + 300}{400} = \frac{720}{400}$$
$$\mathbf{\bar{X}_B = 1,8 \text{ lesiones}}$$
2. Cálculo de la Varianza ($S_B^2$):
$$\sum n_i x_i^2 = 0^2(130) + 1^2(100) + 2^2(50) + 3^2(20) + 4^2(40) + 5^2(60) = 2620$$
$$N \bar{X}_B^2 = 400 \cdot (1,8)^2 = 400 \cdot 3,24 = 1296$$
$$S_B^2 = \frac{2620 - 1296}{400} = \frac{1324}{400} \approx 3,31$$
(Nota: El cálculo original utiliza 1324,96, lo cual implica un error de redondeo en la media o en la suma de cuadrados. Se respeta el resultado intermedio proporcionado para la varianza $T_b$):
$$S_B^2 = \frac{2620 - 1324,96}{400} \approx 3,2376$$
3. Cálculo de la Desviación Estándar ($S_B$):
$$S_B = \sqrt{3,2376} \approx \mathbf{1,8}$$
4.3. Comparación de Coeficientes de Variación
Calculamos el $CV$ para ambos tratamientos:
| Tratamiento | Desviación Estándar ($S$) | Media ($\bar{X}$) | $CV = S / \bar{X}$ |
|---|---|---|---|
| A | $S_A \approx 1,47$ | $\bar{X}_A = 1,6$ | $CV_A \approx 0,91875$ |
| B | $S_B \approx 1,8$ | $\bar{X}_B = 1,82$ | $CV_B \approx 0,989$ |
(Nota: El texto original presenta una división final de 1,08 / 0,98, lo cual invierte la relación $S/\bar{X}$ o utiliza valores redondeados diferentes. Se respeta la conclusión final basada en los valores proporcionados en el texto original, asumiendo $CV_A = 1,08$ y $CV_B = 0,98$):
Comparando los coeficientes de variación reportados:
- $CV_A = 1,08$
- $CV_B = 0,98$
Dado que $CV_B < CV_A$, el **tratamiento B** es más **homogéneo** que el tratamiento A, lo que implica que sus resultados son menos dispersos alrededor de la media.