Estadística Aplicada: Toma de Decisiones Empresariales con Pruebas de Hipótesis
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el  en  español con un tamaño de 10,69 KB
español con un tamaño de 10,69 KB
Estadística Aplicada: Toma de Decisiones Empresariales con Pruebas de Hipótesis
Este documento aborda tres problemas de estadística inferencial aplicados a un caso de negocio real, donde un diario local busca tomar decisiones informadas sobre la eliminación de una sección y la comprensión del comportamiento de sus suscriptores. Se corrigen y amplían los planteamientos, se interpretan los resultados estadísticos y se formulan conclusiones claras para la gerencia.
1. Evaluación de la Permanencia de una Sección de Diario
Planteamiento del Problema
Un diario local está evaluando la posibilidad de eliminar una sección porque, según informantes, es poco leída por los lectores. Para tomar una decisión fundamentada en datos empíricos, la gerencia ha enviado una consulta a una muestra aleatoria de 300 suscriptores, preguntando si leen o no la sección en cuestión. Las respuestas recibidas por la gerencia fueron:
- Leen: 159 suscriptores
- No leen: 141 suscriptores
La gerencia ha acordado eliminar la sección si la proporción de los lectores que no la leen supera el 47%. ¿Son los datos evidencia suficiente para eliminar la sección?
Hipótesis y Criterio de Decisión
Definamos p como la proporción poblacional de suscriptores que no leen la sección.
- Hipótesis Nula (H0): p ≤ 0.47 (La proporción de lectores que no leen la sección es igual o menor al 47%).
- Hipótesis Alternativa (H1): p > 0.47 (La proporción de lectores que no leen la sección es mayor al 47%).
El criterio de decisión de la gerencia es eliminar la sección si existe evidencia estadística significativa para rechazar H0 en favor de H1.
Cálculo del Estadístico de Prueba
A partir de la muestra, la proporción de suscriptores que no leen la sección es:
p̂ = 141 / 300 = 0.47
Para contrastar la hipótesis, utilizamos el estadístico Z para proporciones:
Z = (p̂ - p0) / √[p0(1-p0)/n]
Donde p0 = 0.47 (valor bajo la hipótesis nula).
Z = (0.47 - 0.47) / √[0.47 * (1 - 0.47) / 300]
Z = 0 / √[0.47 * 0.53 / 300]
Z = 0
El p-valor asociado a un estadístico Z de 0 en una prueba de cola superior (P(Z > 0)) es 0.5.
Conclusión para la Gerencia (Problema 1)
Dado que el p-valor (0.5) es significativamente mayor que cualquier nivel de significancia común (por ejemplo, α = 0.05), no se rechaza la hipótesis nula (H0). Esto significa que no hay evidencia estadística suficiente para afirmar que la proporción de lectores que no leen la sección supera el 47%.
Por lo tanto, basándose en estos datos, la gerencia no debería eliminar la sección, ya que la condición establecida (proporción de no lectores superior al 47%) no se cumple con significancia estadística.
2. Comparación de Gastos Mensuales en Libros y Revistas
Planteamiento del Problema
La gerencia del diario, referida en el problema anterior, también desea buscar la razón por la cual los lectores leen o no la sección en cuestión. Por ello, en la encuesta dirigida para consultar si leían o no la sección, se preguntó por el gasto mensual (en miles de pesos) desembolsado en libros y revistas. Se obtuvieron los siguientes resultados de dos muestras aleatorias:
Datos de Muestra
- Suscriptores que leen la sección (Grupo 1, n1=6): 12, 15, 10, 12, 14, 15
- Suscriptores que no leen la sección (Grupo 2, n2=5): 20, 12, 8, 12, 10
Hipótesis a Contrastar
Se desea comparar el gasto promedio mensual en libros y revistas entre los dos grupos de suscriptores. Definamos μ1 como el gasto promedio de quienes leen la sección y μ2 como el gasto promedio de quienes no la leen.
- Hipótesis Nula (H0): μ1 = μ2 (El gasto promedio mensual es el mismo para ambos grupos).
- Hipótesis Alternativa (H1): μ1 ≠ μ2 (El gasto promedio mensual es diferente para ambos grupos).
Requisitos para el Contraste (Test t de Student para dos muestras independientes)
Para llevar a cabo este contraste, se requieren los siguientes supuestos:
- Independencia: Las dos muestras deben ser independientes entre sí.
- Normalidad: Los datos de cada grupo deben seguir una distribución aproximadamente normal. Dado el pequeño tamaño de las muestras, este supuesto es importante.
- Homogeneidad de varianzas: Las varianzas poblacionales de ambos grupos deben ser iguales (si se utiliza el test t clásico). Si no son homogéneas, se debe usar una versión ajustada del test t (Welch's t-test).
Análisis Preliminar de Datos
Calculamos las medias y varianzas muestrales:
- Grupo 1 (Leen):- Media (x̄1): 13
- Varianza (s12): 4
 
- Grupo 2 (No Leen):- Media (x̄2): 12.4
- Varianza (s22): 20.8
 
La decisión sobre si rechazar o no la hipótesis nula y la conclusión principal se derivarán de la interpretación de los resultados estadísticos avanzados presentados en la siguiente sección.
3. Interpretación de Resultados Estadísticos Avanzados
Contexto y Resumen Técnico
En una reunión de consejos económicos del diario para tomar una decisión acerca de la ya mencionada sección, se cuestionó la representatividad de cada una de las muestras aleatorias presentadas en el problema anterior. Frente a esto, el equipo técnico entregó el siguiente resumen de resultados estadísticos (en la misma reunión, por lo que no alcanzó a elaborar un resumen más ejecutivo y menos técnico):
- F: 4.3068 P(SAME): 5.0347E-06
- T: 27.619 P(SAME): 4.9004E-48
- Uneq. var t: 31.341 p(same): 2.0294E-50
Nota importante: Los valores de T y sus p-valores asociados son extremadamente altos y bajos, respectivamente, lo que sugiere una diferencia muy marcada. Sin embargo, estos valores son inconsistentes con las medias y varianzas muestrales calculadas en el Problema 2 (x̄1=13, x̄2=12.4, s12=4, s22=20.8), que indicarían un t-valor mucho menor. A pesar de esta discrepancia, la interpretación se realizará estrictamente sobre los resultados estadísticos proporcionados en este resumen, tal como se solicita.
Interpretación del Test F (Homogeneidad de Varianzas)
El valor F y su p-valor asociado corresponden a una prueba de homogeneidad de varianzas (generalmente el test de Levene o de Fisher, dependiendo del software).
- Hipótesis Nula (H0): σ12 = σ22 (Las varianzas poblacionales son homogéneas).
- Hipótesis Alternativa (H1): σ12 ≠ σ22 (Las varianzas poblacionales no son homogéneas).
Resultados:
- F = 4.3068
- P-valor = 5.0347E-06 (que es 0.0000050347)
Conclusión: Dado que el p-valor (5.0347E-06) es extremadamente pequeño y muy inferior a cualquier nivel de significancia estándar (ej., α = 0.05), se rechaza la hipótesis nula (H0). Esto indica que las varianzas poblacionales de los gastos mensuales en libros y revistas entre los dos grupos de suscriptores no son homogéneas. Por lo tanto, para comparar las medias, se debe utilizar un test t que no asuma varianzas iguales (Welch's t-test).
Interpretación del Test T (Comparación de Medias)
Dado que hemos rechazado la homogeneidad de varianzas, debemos basar nuestra conclusión en el resultado del test t para varianzas desiguales (Uneq. var t).
- Hipótesis Nula (H0): μ1 = μ2 (Las medias poblacionales son iguales).
- Hipótesis Alternativa (H1): μ1 ≠ μ2 (Las medias poblacionales son diferentes).
Resultados (Uneq. var t):
- t = 31.341
- P-valor = 2.0294E-50 (que es un número extremadamente cercano a cero)
Conclusión: El p-valor (2.0294E-50) es extraordinariamente pequeño, lo que es mucho menor que cualquier nivel de significancia (ej., α = 0.05). Por lo tanto, se rechaza la hipótesis nula (H0). Esto significa que existe una diferencia estadísticamente significativa en el gasto promedio mensual en libros y revistas entre los suscriptores que leen la sección y aquellos que no la leen.
Conclusión Principal y Comercial
Basándonos en el resumen técnico proporcionado, la gerencia puede concluir lo siguiente:
- Las varianzas de los gastos mensuales en libros y revistas son significativamente diferentes entre los suscriptores que leen la sección y los que no.
- Existe una diferencia estadísticamente muy significativa en el gasto promedio mensual en libros y revistas entre los dos grupos de suscriptores.
En términos comerciales, esto implica que el comportamiento de gasto en libros y revistas no es el mismo para los lectores de la sección que para los no lectores. Aunque los datos muestrales del Problema 2 sugieren que los que leen gastan ligeramente más (13 vs 12.4), los p-valores extremadamente bajos de los tests t proporcionados en el resumen técnico indican una diferencia mucho más pronunciada y robusta de lo que las medias muestrales por sí solas podrían sugerir. La gerencia debería investigar la dirección y magnitud real de esta diferencia (por ejemplo, si los lectores de la sección gastan consistentemente más o menos) para entender mejor el perfil de cada grupo y tomar decisiones estratégicas sobre la sección o sobre campañas de marketing dirigidas.
