Inferencia estadística y pruebas de hipótesis
Enviado por Programa Chuletas y clasificado en Matemáticas
Escrito el en español con un tamaño de 7,02 KB
Población
conjunto de individuos sobre os q se estudian una o varias carasteristicas
Muestra
subconjunto de elemento de la poblacion
Inferencia estadistica
: conunto de metodos q nos permiten tomar decisiones u obtener conclusiones sobre la poblacion total utilizando la informacion contenida de una muestra de esa poblacion
Inferencia para métrica
se conoce la distribucion de probabilidad de la poblacion estudiada salvo un numero finito de parametros y su objetivo es estimar el valor de dichos parametros, dar un intervalo donde puuedan tomar valores o contrastar alguna afirmacion psbre los parametros desconocidos. se divide en
- Estimación puntual: el obketivo es calcular un valor aproximado de un parametro de la poblacion
- Intervalo de confianza: en vez de obtener un valor aproximado, nos interesa calcular un intervalo donde se encuentre el parametro estudiado
- Contrastes de hipotesis: trata de apoyar o rechazar una afirmacion sobre el parametro *Prueba T y ANOVA
Inferencia no parametrica
abarca problemas similares cuando no se conoce la distribucion de la poblacion
- metodo de dunn
- chi cuadrado
- contraste de normalidad
- contrste de aleatoriedad
- contraste de kruskal-wallis
Estadistico
es una funcion de variables aleatorias de la muestra y como tal adquiere valores de una muestra a otra
Estimador
es un estadistico q toma valores admisibles para el parametro desconocido, es decir, es una funcion de las variables q componen la muestra
- media
- varianza
- Proporcion muestrales
Intervalo de confianza
la estimacion de un parametro desconocido en la poblacion suministra un valor θ, pero no permite tener una mayor o menos confianza en la estimacion pq θ tiene como fluctuaciones en el muestreo. para precisar la estimacion se construyen intervalos de confianza. Un intervalo de confianza para el parametro θ con coeficiente de confianza 1-alfa es un conjunto de valores posibles de θ q son compatibles con los valores mas probables del estimador correspondienre, el estdistico θ
Contraste de hipotesis
tiene como conjunto decidir si una determinada hipotesis sobre la distribucion de estudio es confirmada o invalida a partir de las observaciones de una muetsra. Si la hipotesis se formula sobre un parametro de la poblacion, se dice q el contrste es parametrico. Los contrastes parametricos necesitan el requisito de normalidad de las variables aleatorias q intervienen en el estadistico de contrste
Hipotesis nula
es la hipotesis que se contrasta . Nunca se considera aprobada aunque puede ser rechazada. Se llama asi pq con frecuencia afirma q no hay diferencia entre el verdadero valor del parametro el q se desea contrstar
Hipotesis alternativa
es la q aceptamos si rechazamos la hipotesis nula, es decir, es la negacion de la hipotesis nula
Nivel de sig
es la probabilidad de cometer un error de tipo 1
Potencia de un contraste
e la prob de rechazar la hipotesis nula cuando es falsa. si beta es la prob de cometer un error del tipo 2 entonces la potencia es igual a 1-beta. entre dos contrstes con una misma hipotesis se elige siempre el q tenega mayor potencia
Region de rechazo
es la region en la cual se rechaza la hipotesis Ho
P-valor
es el valor de alfa entre 0 y 1 mas pequeño q hace q la muestra observada nos indique q se debe rechazar Ho. cuanto menos sea el p-valor es menos probable q los datos observados ajusten a la hipotesis nula formulada ¿
¿que es mejor anova o kruskal-wallis?
la prueba anova es una prueba parametrica y como tal requiere una serie de supuestos para poder ser aplicada cprrectamente en caso de no poder utilizarf directamente anova, recurrimos a pruebas no parametricas como la de kruskal-wallis. Las pruebas parametricas asumen q las muestras obtenidas son aleatorias, q las observaciones siguen una distribucion normal y q existe un parametro de interes q buscamos estimarr, en cambio las pruebas no parametricas no asumen parcial o totalmente lo anterior, por esta razon el test anova e smjor q el otro
¿que sucede si no se cumple la hipotesis de aleatoriedad?
si no se verifica la hipotesis de aleatoriedad no tiene sentido ningun metodo de estimacion ni contraste de hipotesis, ya q para poder generalidar nietsras concluciones necesitamos q la muestra
sea aleatoria, ya q es la hipotesis mas importante de todos junto con la independencia q podemos asegurarnos de una investigacion seleccionando de forma adecuada la muestra
Analisis de regrecion
es una tecnica estadistica q investiga y modela la relacion entre las variables x e y en al poblacion y en q senido se da la relacion, otro de los objeticos de analisis de la regresion es estudiar si los valores de la variable x se pueden utilizar para predecir los valores de Y
Reesiduo
es la diferencia entre el valor observado y el valor estimado
¿cual es el error mas frecuente q se comete cuando se realiza un analisis de regresion?
abusar de la interpretacion del coeficiente de determinacion cmo unica medida de bondad del ajuste del modelo lineal estimado a un conjunto de datos ya q se pueden dar situaciones en las q una inadecuada interpretacion de r cuadrado puede llevarnos a situaciones como minimo paradojicas
¿Que sucede si aumenta el error de tipo 1?*
desde el pto de vista del intervalo de confianza, al aumentar el error tipo 1 o nivel de sig disminuye el nivel de confianza, por lo q su intervalo de confianza sera menor *desde el pto de vista de los ocntrastes si disminuye el error tipo 1 es mas probable q los datos observados se ajustan a la hipotesis nula formulada *desde el pto de vista del error tipo 2 como entre ellos hay una relacion inversa si uno aumenta el otro disminuye por lo q no podemos reducir simultaneamente los dos errores de un contraste de hipotesis, disminuir alfa implica reducir el tamaño de la region y por tanto aumentar beta por lo q estan relacionados inversamente
Factor
en Anova es una variable cualitativa q genera o q contempla una serie de poblaciones a comparar
nivel de un factor
son los grupos o poblaciones q delimitan a un factor
Objetivo de ANOVA
es contrstar si existen las diferencias entre las medias de los niveles de las variables (factores) Cuando solo hay dos medias el ANOVA equivale a la prueba t-studennt para el contrste de dos medias
Kruskall-wallis
es el metodo mas adecuado para comparar poblaciones cuyas distribuciones no son normales. inclusop cuando las poblaciones son normales este contrste funciona muy bien. Tambien es adecuado cuando las desviaciones tipicas de los diferentes grupos no son iguales entre si. Cuando se rechaza kruskall-wallis aplicamos el metodo Dunn para comprobar q pareja de distribuciones difieren en su tendencia central