Conceptos Estadísticos Fundamentales en Experimentación
Enviado por Chuletator online y clasificado en Matemáticas
Escrito el en español con un tamaño de 7,8 KB
DISEÑO EXPERIMENTAL
1) Distribución de probabilidad y desvío estándar (gráfica)
Se calcula tomando la desviación estándar de la distribución de muestreo (de todas las muestras posibles) para la estadística de prueba. Por lo tanto, la curva construida con medias variará dependiendo del tamaño de la muestra:
- Muestras pequeñas tienen una desviación típica mayor
- Muestras grandes tienen una desviación típica menor.
Desvío estándar (S): Indica cuánto se alejan los valores de una distribución de un valor central (media) → Da una idea de la variabilidad de las observaciones individuales.
CUANTO MENOS DESVÍO: MÁS ALTA ES LA GRÁFICA
2) Tabla de análisis de varianza
a- ¿Aceptar la hipótesis nula?
b- De acuerdo al valor del p-value, ¿el F calculado es mayor al F crítico de α?
F Crítico
Distribución F: Se calcula en base a los grados de libertad usados para calcular cada Cuadrado medio y buscar en la curva resultante si el valor de F0 se encuentra dentro de una región crítica superior de tamaño α. Curva de F generada a partir de k-1 grados de libertad en el denominador y n-k grados de libertad en el numerador
- Si la F calculada es < F crítico de α: ACEPTO LA H0: NO EXISTEN DIFERENCIAS ENTRE LOS TRATAMIENTOS
- Si la F calculada es > F crítico de α: RECHAZO LA H0: EXISTEN DIFERENCIAS SIGNIFICATIVAS ENTRE LAS MEDIAS DE LOS TRATAMIENTOS
3) Intervalo de confianza
Se pesaron 120 terneros al nacimiento y al calcular la media con el error estándar el resultado fue de 36 kg ± 4. Escriba el intervalo de confianza.
4) Tipos de errores
Si aceptamos la hipótesis nula, ¿qué tipo de error estamos cometiendo? ¿Cómo se simboliza la probabilidad de ocurrencia de este tipo de error?
Permite establecer la verdad o falsedad de una hipótesis acerca de una característica de una población o un conjunto de poblaciones.
- Error tipo 2: No rechazar H0 cuando es nula.
- Error tipo 1: Rechazar H0 cuando es verdadera.
5) Coeficiente de correlación
¿Qué significa un coeficiente de correlación entre dos variables 0.8 y -0.3?
Significa que hay una correlación baja en el -0.3, los datos van a estar muy dispersos, mientras que la correlación con 0.8 es alta. Esta correlación puede ser desfavorable dependiendo de lo que se vaya a buscar.
6) Selección de modelos
Se utilizaron modelos lineales mixtos generalizados para relacionar las variables implicadas en un experimento. ¿Cuál de los modelos evaluados elegiría? Justifique.
Siempre vamos a elegir el modelo que tenga los números más chicos en AIC y BIC.
7) Tipos de variables
Defina variable discreta y variable continua.
Variable cuantitativa:
- Discreta: Usa valores enteros - Ej: Nº De espigas
- Continua: Toma cualquier valor dentro de un intervalo - Ej: Rendimiento, peso
Variable Cualitativa:
- Categórica: No sigue un orden específico - Ej: Raza.
- Ordinal: Sigue un orden o jerarquía - Ej: Condición Corporal.
8) Gráfica de coeficiente
Cuanto más cercano a 0, ya sea negativa o positivamente, hay menos correlación, los datos están más dispersos.
9) Pruebas estadísticas para comparar tratamientos
Se dispone de una base de datos de rendimientos del cultivo como respuesta a 4 tratamientos con distintas dosis de fertilizantes. Se comprobó que los datos tienen distribución normal y homogeneidad de varianza. ¿Qué pruebas estadísticas realizaría para saber cuál tratamiento tuvo efectos significativamente diferentes en el rendimiento?
Test de distribución normal, que puede ser por la gráfica de dispersión, donde todos los puntitos estén lo más junto posible a la línea significa que es normal. Si no, también con Prueba de normalidad = Shapiro-Wilks.
CONCEPTOS
- Error Estándar: Cuánto varía el valor de una estadística de prueba de muestra a muestra, por lo que determina la incertidumbre de la ésta estadística.
- Desvío estándar: Cuánto se alejan los valores de una distribución de un valor central (media)
DISTRIBUCIÓN NORMAL ESTÁNDAR
- La distribución normal estándar o tipificada tiene por media el valor cero (μ =0) y por desviación típica la unidad (σ =1)
- Se utiliza cuando σ es conocida y el tamaño de la muestra es grande (mayor a 30)
DISTRIBUCIÓN t- Student
- Se utiliza cuando σ es desconocida y el tamaño de la muestra es pequeño.
- Cuando la población tiene distribución normal pero desconocemos σ, la misma es reemplazada por S (desvío estándar muestral) y se deja de tener una distribución normal estandarizada y tiene una distribución t Student con n-1 grados de libertad.
IC PARA UNA PROPORCIÓN
- Proporción ó % de una población
- Se utiliza para calcular la estimación de la proporción de elementos en una población que tiene características de interés.
- Si se tomaran muchas muestras de igual tamaño y en cada una de ellas se calculara la proporción de veces que ocurre un proceso, se encontraría:
- Su media se encuentra cerca de la proporción poblacional
- Su desviación estándar se hace menor a medida que el tamaño de la muestra se hace mayor
Determinantes de la amplitud del intervalo:
- Tamaño de la muestra (n)
- Variabilidad de la población (s)
- Nivel de confianza
TEST DE HIPÓTESIS
Permite establecer la verdad o falsedad de una hipótesis acerca de una característica de una población o un conjunto de poblaciones
ANÁLISIS DE VARIANZA
- Es una prueba estadística que permite realizar el contraste de hipótesis en determinadas situaciones:
- Evaluar el comportamiento de poblaciones, que pueden ser plantas o animales, sometidas a diferentes tratamientos.
- Determina la diferencia entre medias a través de la comparación entre diferentes estimaciones de varianzas o cuadrados medios.
- Se basa en la comparación de la variabilidad entre y la variabilidad dentro – Se rechaza la H0 cuando la variabilidad “entre” sea grande, pero utilizando como patrón de comparación la variabilidad “dentro”.
- La técnica de ANOVA consiste en particionar la variabilidad total en tantas fuentes de variación como lo indique el modelo propuesto
Pruebas de comparación de medias
- El objetivo de realizar un ANOVA es determinar si los efectos de todos los tratamientos son iguales o no.
- En el caso de que el p valor > 0,05, no rechazamos la H0 y consideramos que todos los tratamientos tienen el mismo efecto.
- En caso contrario, cuando el p valor < 0,05, rechazamos la H0 y se considera que los tratamientos tienen efectos diferentes.
- Al menos una de las medias es diferente, pero no sabemos cuál.
- En este caso es necesario realizar una prueba de comparación de medias con el fin de saber entre qué tratamientos hay diferencia.
- Para esto es necesario realizar una prueba de comparación múltiple.