Intervalos de confianza y análisis de regresión

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 23,55 KB

Intervalos de confianza

Para tener info sobre una determinada población cuando no es posible hacer un censo hay que recurrir al muestreo. Se obtiene una muestra de tamaño n y se constituyen distintos estadígrafos a través de los que se puede inferir la población.

Estimación puntual

Generar una función de las variables muestrales que proporcione la mejor info acerca del parámetro a estimar y una vez que se obtiene la muestra calcular el único valor del estimador.

Desventajas

No podré establecer cuán próximo del verdadero valor del parámetro se encuentra en punto de estimación.

Intervalo de confianza para el parámetro 0

Método de estimación que consiste en determinar un conjunto cerrado y acotado de posibles valores del parámetro y la correspondiente probabilidad de que dicho intervalo cubre al verdadero valor del parámetro.

Límites inferior y superior de un int de confianza

Son funciones del estimador.

Nivel de confianza

Probabilidad de que el intervalo de confianza cubre el verdadero valor de parámetro.

Nivel de riesgo

Probabilidad de que el intervalo no cubre el verdadero valor del parámetro.

Intervalo de confianza aditivo

Intervalo que permite que la probabilidad de la que la estimación difiera de parámetro en a lo sumo a veces el desvío estándar del estimador sea igual al nivel de confianza.

Error de muestreo

Máxima diferencia de que se está dispuesto a tolerar entre el estimador y parámetro mide la precisión de la estimación de los intervalos aditivos es la cantidad que se suma y resta del estimador puntual.

Intervalo s confianza para la media poblacional para poblaciones normales

Para construir intervalos de confianza hay que tener en cuenta Cuál es el estadígrafo de transformación del estimador del parámetro que se desea estimar Y qué distribución de probabilidad tiene. Las poblaciones pueden ser finitas o infinitas es posible que se conozca el valor de la varianza de la población o no en ese caso hay que utilizar el estimador de la varianza.

Variante poblacional conocida, poblaciones infinitas

La distribución es normal estandarizada

Variante poblacional conocida, poblaciones finitas

Distribución normal estandarizada.

Intervalo de confianza para la media poblacional de poblaciones no normales

Las distribuciones de poblaciones no siempre son conocidas para poder construir intervalos de confianza hay que recurrir al teorema del Límite. Tiene distribución asintóticamente normal estandarizada cuando el tamaño de la muestra tiende a infinito.

Muestras grandes

Si la distribución de probabilidad de la población no es conocida y el tamaño de la muestra es grande como para que se cumpla el teorema del límite entonces para poblaciones infinitas o finitas si la varianza poblacional es desconocida para poblaciones infinitas o finitas los intervalos son. Una muestra grande cuando su tamaño es mayor a 30.

Muestras chicas

Si la población no es conocida y el tamaño de la muestra no es grande como para que se cumpla el teorema del límite el nivel del intervalo de estimación es la Cota inferior de probabilidad que surge de la aplicación del teorema de tchebycheff. Entonces las poblaciones con varianza poblacional conocida infinitas o finitas los intervalos de confianza son..

Tamaño de la muestra

Una vez que se decida estimar un parámetro realizado un trabajo de muestreo hay que establecer Cuántas unidades experimentales formarán parte de la muestra cuál debe ser el tamaño de la muestra del modo que se pueda optimizar el procedimiento para que no sea costoso para poder hacer el cálculo de tamaño de la muestra hay que: definir Cuál es el procedimiento de estimar el grado de precisión medio con el error de muestreo en nivel de confianza requerido en el intervalo contenga al parámetro y la variación de la población.

Variante poblacional conocida

Para calcular el tamaño de la muestra hay que conocer:

  • El error de muestreo: factor proporcionado por el usuario de la muestra debe indicar cuál es la diferencia entre la media muestral y la media poblacional está dispuesto a aceptar el error de muestreo debe estar expresados en la misma unidad de medida de la variable.
  • Confianza en la estimación: factor proporcionado por el usuario de la muestra debe indicar cuál es la probabilidad de que el intervalo de confianza cubre el verdadero valor de la media poblacional.
  • La varianza de la población: indica grado de variabilidad de la población.
  • Tamaño de la población: en el caso de que la población finita es una restricción para el tamaño de la muestra.

Sector de muestreo

Se obtiene haciendo la semidiferencia entre los límites del intervalo de confianza.

Población infinita

Si n fuese un número con decimales el tamaño de la muestra Siempre será el próximo número entero.

Variante poblacional desconocida

El tamaño de muestra para estimar la media poblacional de poblaciones normales infinitas cuando no se conoce la variable poblacional se calcula mediante el uso de un proceso interactivo en proceso consiste en los siguientes pasos: se calcula una muestra piloto de tamaño arbitrario n y con ellas se calcula el valor de la varianza muestral. Se calculan tamaño muestral inicial. Se obtiene el tercer tamaño de muestra.

Tamaño de muestra para estimar la proporción poblacional

Universos infinitos: el cálculo del tamaño dela muestra se realiza teniendo en cuenta:

  • Error de muestreo: factor proporcionado por el usuario de la muestra debe indicar cuál es la máxima diferencia entre la proporción muestral y la propensión población Al que está dispuesto a aceptar el error de muestreo debe estar expresado en tanto por uno.
  • Confianza en la estimación: factor proporcionado por el usuario de la muestra debe indicar cuál es la probabilidad deseada de que un intervalo de confianza cubra el valor verdadero de la proporción poblacional.
  • Proporción: porción a info sobre grado de concentración de los elementos que tienen en el atributo A.
  • Tamaño de la población: en el caso de poblaciones finitas es una restricción para el tamaño de la muestra
  • El error de muestreo ser quien haciendo la semidiferencia entre los límites del intervalo de confianza.
  • Dado que el valor de p en el conocido por que se calcula con la muestra no puede formar parte de la Fórmula utilizada para el tamaño de la muestra se utiliza un valor alternativo al que simboliza P y rayita arriba.
  • El valor de p puede obtenerse de alguna de las siguientes formas: utilizando datos que surgen del trabajo anterior. Utilizando una muestra piloto Generalmente de tamaño 50. Sí es imposible alguna de la forma citada se utiliza directamente el valor 0,50.

Muestreo

Universo: conjunto de unidades experimentales que poseen características comunes observables y que se utilizan para obtener info sobre un hecho particular.

Queda determinado cuando se definen los objetivos del trabajo que se llevará a cabo Como así también las unidades experimentales sobre las que se realizan Las observaciones.

Población: cualquier variable particular que se estudia una universo. Cada universo puede generar varias poblaciones una por cada una de las variables cuya medición sea de interés para alcanzar los objetivos fijados.

Censo: medición en la totalidad de las unidades experimentales que conforman el universo de todas las variables que previamente hayan sido declaradas relevantes para la investigación a llevar a cabo

Si fuese necesario tener info precisa sobre la totalidad de los elementos que forman el universo Entonces se debe realizar un censo. El tamaño del universo Es demasiado grande y la tarea sensual resulta muy onerosa e impracticable. La ejecución de un censo es posible entre los censos donde hay que enfrentar a un universo infinito o cuando el proceso de media investigación de las características de cada elemento es destructivo.

Muestra: subconjunto o parte de una población tomada en forma tal que con ella se puede hacer un juicio acerca de una población completa.

Fracción de muestreo: cociente entre el tamaño dela muestra y el tamaño de la población.

Inferencia estadística: cualquier afirmación que se realiza sobre una determinada población basándose en los datos obtenidos con una muestra pudiéndose obtener una determinada medida de la incertidumbre que se genera. Se infiere la población a partir de la muestra producen un cierto grado de duda el cual puede ser controlado probabilísticamente si la muestra se toma utilizando métodos que garantizan aleatoriedad.

Muestreo: seguimiento mediante el cual se obtiene una muestra de una población dada.

Unidad de muestreo: a cada unidad experimental grupo de unidades experimentales que son tomadas para obtener una muestra

Diseño muestral: plan de muestreo específico donde se establece Cuáles eran los procedimientos a seguir para tomar una o más muestras.

Muestreo probabilístico: cuando las unidades experimentales que se componen la muestra son tomadas al azar. M es un tipo de muestreo objetivo porque como la obtención de las unidades experimentales es realizada al azar la inclusión de cada una de ellas de la muestra no dependen del sujeto que se encarga de tomar la muestra.

Muestreo intencional: cuando las unidades experimentales que componen la muestra son obtenidas siguiendo una regla preestablecida. Cada elemento que integraron la muestra será elegido por el sujeto que realiza el trabajo. Es un tipo de muestreo subjetivo y carece de una base satisfactoria la representatividad de la muestra depende de la intención del sujeto que toma la muestra y compensación puede estar influenciada por tendencias.

Muestreo sin norma: no por razones de comodidad costó la obtención de las unidades experimentales que componen la muestra se realiza sin una norma. Cada elemento que Integra la muestra es elegido por el sujeto sin un criterio fijado. La atención es cuasi aleatoria luego de muestreo es cuasi objetivo.

Método de obtención de muestras: que estudia la aplicación de los métodos estadísticos en un muestreo probabilístico se supone que cada elemento que interviene en la muestra es pomada lassar para garantizar que la obtención de cada uno de ellos sea realmente aleatoria es conveniente la utilización de una tabla de dígitos al azar. Una muestra de tamaño n cuyos elementos se obtienen al azar es un conjunto formado por n variables aleatorias que tienen la misma distribución de probabilidad.

Muestreo simple al azar: sin reemplazo consiste en obtener al azar una muestra de n elementos de entre los n que constituye el universo. Todas las muestras posibles de tamaño n deben tener la misma probabilidad de ser tomadas como que los elementos que integran la muestra tengan el momento de cada extensión de la misma probabilidad de ser obtenidos. Si la población es infinita y las variables muestrales son independientes la probabilidad de que una de ellas a suman determinado valor es la misma que para cualquier valor que asuman las otras. Dependencia estadística esa probabilidad dependerá del valor de las que ya fueron obtenidas. Para que se cumpla la condición de igualdad de probabilidad para todo este método debería ser utilizado solamente cuando se tiene real evidencia de la homogeneidad de la población de la cual se tomará la muestra.

Muestreo estratificado al azar: casos en los cuales la población Presenta una gran variabilidad o sea una población heterogénea. La utilización de muestreo simple puede proporcionar muestras no representativas y las conclusiones que surjan del Análisis no serán del todo confiables. Este método consiste en participar al universo en extractos dentro de los cuales si la variable debe presentar homogeneidad.

Afijacion igual o iniforme: el tamaño de muestra que le corresponde a cada estrato es igual ese tamaño se calcula haciendo el cociente entre el tamaño de la muestra n y la cantidad de estratos H.

Afijacion proporcional: el tamaño de la muestra que le corresponde a cada estrato es proporcional al tamaño del estrato se calcula haciendo el producto entre la fracción de muestreo y el tamaño de cada estrato.

Afijacion óptima: el tamaño de la muestra para cada estrato es proporcional al tamaño del estrato y al servicio estándar. Así se tiene en cuenta la falta de homogeneidad entre las subocupaciones.

Muestreo por englomerados polietapico: cuando se toman muestras utilizando el método de muestreo simple al azar o método estratificado al azar las unidades de muestreo coinciden con las unidades experimentales. El método que se presenta en parágrafo tiene como particularidad que la unidad de muestreo está formada por un grupo de unidades experimentales. Consiste en agrupar los elementos que conforman el universo en conglomerados de modo que entre ellos haya la suficiente homogeneidad para representar la población

Muestreo sistemático al azar: consiste en ordenar las n unidades y mentales que conforman el universo de acuerdo a Cómo fueron presentando así Y obtener la muestra eligiendo un elemento cada unidad tomado el primero en forma aleatoria.

Parámetro estadístico

Toda la población es una variable aleatoria su comportamiento probabilístico está explicado por una función de probabilidad si la variable discreta o por una función de densidad de probabilidad si se trata de una variable continua.

Universo finito y pequeño

Toda medida que resume info calculado con las variables poblacionales si no hay posibilidad de una equivocada interpretación a los parámetros estadísticos se lo denomina parámetros y se simboliza con las letras griegas.

Universo finito y grande o universo infinito

Parámetro matemático de una función de probabilidad o de densidad de probabilidad que brinda info acerca de una población.

Parámetro

DE LOS BUENOS ESTIMADORES:

vINSESGAMIENTO: esperanza del estimador es igual al parámetro. La media muestral y la proporción muestral son estibadores insesgados.

vSESGO: un estimador es insesgado cuando la diferencia entre la esperanza del estimador y el parámetro es nula.

vCONSISTENCIA: el estimador converge en la probabilidad al parámetro cuando el tamaño de muestra crece indefinidamente.   A medida  que aumenta el tamaño de la muestra la varianza del estimador tiende a cero.

vEFICIENCIA: un estimador es eficiente si tiene la mayor varianza que puede tener un estimador del parámetro.

vSUFICIENCIA: un estimador es suficiente se utiliza toda la info relevante acerca del parámetro contenida en la muestra.

METODO  DE ESTIMACIÓN  DE PARÁMETROS:

vESTIMACION PUNTUAL: calcular el valor numérico del estimador con los datos de la muestra punto de estimación.

vESTIMACION POR INTERVALO: calcular los límites de un conjunto cerrado y acotado de números reales con los datos de la muestra.

vINTERVALO  DE CONFIANZA: fondo cerrado y acotado de posibles valores de parámetros cuyos límites son funciones del estimador y la probabilidad asociada de que el intervalo aleatorio cubra el valor del parámetro.

vINTERVALO DE CONFIANZA ADITIVO: intervalo en el que la probabilidad de que el estimador difiera del parámetro a la suma de hbc desvío estándar del estimador = -1.

vCUÁLES SON LOS PARÁMETROS QUE SE ESTIMAN CON INTERVALOS FR CONFIANZA ADITIVOS:

-Media poblacional y proporción poblacional.

ANALIISIS DE REGRESIÓN Y CORRELACION

vANÁLISIS DE REGRESION: a un método estadístico que permite explicar el comportamiento de una variable cuantitativa a partir del comportamiento de otras variables que puedan estar relacionadas Estableciendo la expresión funcional del modelo matemático que describa dicho comportamiento.

vVARIABLE EXPLICADA: variable cuantitativa cuyo comportamiento se desea de escribir a partir del comportamiento de otras unidades.

vVARIABLES EXPLICATIVAS: variables que explican el comportamiento de la variable explicada.

vANÁLISIS DE REGRESION: construir un modelo que permita predecir el valor de la variable explicada utilizando valores de K variables explicadas el modelo consta de dos partes la función real y la variable aleatoria.

vFUNCIÓN DE REGRESION: modelo matemático que interviene en el modelo estadístico de regresión.

vRESIDUO  ALEATORIO: variable aleatoria que forma parte del modelo estadístico de regresión.

vSUPUESTOS BÁSICOS DE LA REGRESION:

-La variable aleatoria residual U tiene distribución normal.

-La esperanza matemática de la variable aleatoria residual U cero.

-La varianza de la variable residual U se mantiene constante.

-Las variables aleatorias residuales de un para las dos cualquiera son independientes de la varianza Entre ella de 0.

-Las variables aleatorias residuales independientes de cada una de las variables explicativas.

-La variable explicada y la variable explicativa son variables aleatorias y representa población es la función de regresión es una función que relaciona poblaciones es una función poblacional.

vANNALISIS DE REGRESION SIMPLE: análisis que se realiza cuando a cada unidad experimental de un determinado Universo se le miden Sólo dos variables una variable explicativa y explicada. Los valores individuales de cada una de las variables que se miden se presentan como pares ordenados cada par ordenado representa un punto en el plano todos los posibles padres del universo se pueden presentar en un gráfico utilizando coordenadas cartesianas ortogonales.

vDIAGRAMA DE PUNTOS: representación gráfica de los pares ordenados de los valores de las variables que intervienen en el análisis de regresión.

vMODELO DE REGRESION LINEAL SIMPLE: modelo de regresión que se forma cuando la función de regresión es una función afín una recta. El valor promedio esperado de la variable explicada para cada valor de la variable explicativa es la recta de regresión. Y la varianza de la variable explicada para cada valor de la variable explicativa es igual a la varianza residual. Un valor individual de la varianza residual es la diferencia entre el valor de la variable explicativa y el valor de la recta de regresión para un valor dado de la variable explicativa.

vVariable explicativa como la variable explicada son poblaciones variables aleatorias luego sus parámetros individuales son la esperanza matemática y la varianza.

vRECTA DE REGRESION ESTIMADA:' compensa los desvíos que se producen entre cada valor muestral de la variable explicativa y el correspondiente valor de la recta. Para construir los estimadores de la regresión se usa el método estadístico llamado método de mínimos cuadrados Calcula los valores b0 y B1 de modo que minimice la suma del cuadrado de los desvíos

vLA SCRES: es una función escalar cuyas variables son dos estimadores para minimizar esta función hay que hacerlos derivadas parciales.

vDESVACION TOTAL: la diferencia entre valor individual de y el promedio.

vDESVIACIÓN EXPLICADA POR LA REGRESION: diferencia entre valor de la recta de regresión estimada correspondiente al valor x 0 y el promedio de la variable y. La diferencia entre el valor individual de y el valor de la recta de regresión estimada correspondiente al valor x cero se llama desviación residual.

vSUMA DE CIADRADOS TOTAL: es igual a la suma de la suma de los cuadrados explicada más la suma de cuadrados residual se puede calcular haciendo la diferencia entre la suma del cuadrado total y la suma de cuadrados explicada.

vVARIANZA RESIDUAL MUESTRAL: cociente entre la suma de cuadrados residual y sus correspondientes grados de libertad es un estimador insesgado de la varianza residual poblacional.

vCOCIENTE DE DETERMINACIÓN R2: cociente entre la suma del cuadrado explicado y la suma del cuadrado total.

vCOCIENTE DE DETERMINACION: es un cociente que mide la proporción de la variación total que está explicada por la regresión.

vINTERVALO  DE CONFIANZA: se constituyen para estimar con un nivel de confianza igual a 1 – e tanto los parámetros de la recta de regresión como los valores de la recta poblacional para un valor dado de la variable explicativa x son intervalos de tipo aditivo.

vESTADIGRAFO DE PRIWBA PARA OAO  POBLACIONAL: se usa para probar un valor a la ordenada de origen a la recta de regresión poblacional es el estadígrafo de transformación de la ordenada al origen de la recta de regresión muestral.

vESTADIFRAFO DE PRUEBA PARA LA PENDIENTE POBLACIONAL: te utiliza para probar el valor de la pendiente de la recta de regresión poblacional es el estadígrafo de transformación de la ordenada y la pendiente de la recta de regresión muestral.

vANÁLISIS DE CORRELACIÓN LINEAL: se lleva a cabo cuando la función de regresión que explica el comportamiento conjunto de las variaciones en la función afín o sea una recta.

vCOEFICIENTE DE CORRELACIÓN LINEAL POBLACIONAL: mide la intensidad de la relación lineal entre las variables es un número que necesariamente está entre -1 y 1.

vCOEF DE CORRELACIOB LINEAL MUESTRAL: se construye el coeficiente de correlación lineal y muéstralo tiene distribución normal no es posible construir intervalos de confianza.

vPRUEBA DE SIGNIFICACIÓN: prueba de hipótesis que se plantea para probar si el coeficiente de correlación lineal poblacionales cero o no es cero la hipótesis es nula. Si se rechaza la hipótesis nula del coeficiente de correlación lineal poblacional es significativo distinto a cero.

vANÁLISIS DE CORRELACION: es un método estadístico que permite medir el grado de asociación entre variables aleatorias.

vMIDE: mide la intensidad de la asociación mediante el coeficiente de relación.

vSe coeficiente de correlación poblacional es mayor a 0,80 se considera que hay buena relación lineal entre las variables. Para estimar el coeficiente de regresión como el coeficiente de correlación se necesitan la suma de cuadrados y la suma de los productos.

vLA SPXY: el número que termina el signo de coeficiente de correlación y del coeficiente de regresión deben tener siempre el mismo signo ambos deben ser negativos o positivos.

vCOEF DE CORRELACION MUESTRAL: indica que es relación directa entre el tamaño del hogar y la cantidad de basura a mayor tamaño del hogar mayor cantidad de basura.

Entradas relacionadas: