Estadística

Enviado por Programa Chuletas y clasificado en Otras materias

Escrito el en español con un tamaño de 10,08 KB

ESTADISTICA DESCRIPTIVA:análisis descriptivo de datos, conjunto de métodos, medidas y representaciones gráficas que tiene como finalidad describir, ordenar, resumir,sintetizar, la información obtenida en un conjunto de datos y poner de manifiesto sus características básicas.POBLACION:ind k son proposito de estudio. MUESTRA: grupo reducido a estudio.

VARIABLES:.características de la poblacion que nos interesan para nuestro estudio. NUMERICAS O CUANTITATIVAS(discretas:uno, dos... /continuas:37.4, 94.8,..)CATEGORICAS O CUALITATIVAS(ordinales:leve,moderado,grave../nominal:h-m,estado civil..)

ni(FRECUENCIA ABSOLUTA)numero de veces que se repite cada modalidad: x de una variable en los valores de la muestra.La suma de todas es el tamaño muestral(N)

fi(FRECUENCIA RELATIVA)cociente entre la ni y el tamaño muestra.La suma de todas es 1.

NI,FI(FRECUENCIA ACUMULADA)suma de lo elementos de una muestra cuya modalidad es inferior o igual a una dada, xq puede ser relativa o absoluta.

TABLAS DE ESTADISTICAS POR INTERVALOS:AMPLITUD DE INTERVALO:diferencia entre los limites del intervalo.MARCA DEL INTERVALO DE MODALIDAD:punto medio del intervalo que lo representa.Ej: entre 10-30 su amplitud es:30-10=20.Ej:entre 10-25 la marca es (10+25)/2=15#############~~~CUESTIONES A TERNER EN CUENTA:a.-utiles para la diversidad de valores especialmente en las continuas(34.5,76.8...)b.-perdida de informacion/c.-cuidados de los extremos,tratarlos./d.-los intervalos no tienen por qué tener la misma longitud.

REPRESENTACIONES GRAFICAS:no son medios definitivos.GRAFICO DE BARRAS:a.-variables categoricas/b.-en el eje horizontal se ponene las categorias de las variables/c.-en el eje vertical las frecuencias absolutas o relativas de cada variable.GRAFICO DE SECTORES(quesitos):a.-para variables categoricas/b.-para %.HISTROGRAMAS:para variables numericas continuas; en el eje horizontal se ponen intervalos en vez de valores aislados.

DISTRIBUCIONES DE FRECUENCIAS:nos sirven para sintetizar toda la informacion que nos proporcionan las tablas estadisticas:son las medidas de posicion, de dispersion,forma y concentracion.

MEDIDAS DE POSICION:med aritmetica(     ),geometrica(G),armonica(H),mediana(MED),moda(mo)y percentiles.

Media aritmetica:a-medida central por excelencia/b.-centro geometrico de los datos observados/c.-se suele identificar como representante de la muestra/d.-es la mas usada.e.-en variables cualitativas no sirve la media artimetica.PROPIEDADES:a.-la suma de los valores respecto a su media es cero.b.-cambios de origen y cambios de esacala.c.-media de una combinacion lineal.INCONVENIENTE:se ve afectada por valores anormalmente grandes o pekeños por lo que puede ser poco representativa.FORMULA:(x1+x2+...xn)/poblacion.CAMBIO DE ORIGEN:si a cada una de las modalidades de la muestra le subes una constante a la media le esta subiendo esa constante.CAMBIO DE ESCALA:es lo mismo pero con multiplicacion.

Media geometrica:se usa para variables que representen variaciones acumulativas:%, partes de un total, indices.PROPIEDADES:a.-el logaritmo de la media geometrica es igual a la media aritmetica de los logaritmos de la variable.b.-el cuadrado de la media geometrica es igual a la media geometrica de los cuadrados de la variable.c.-los valores extremos tienen menos influencia.c.-SOLO PUEDE CALCULARSE CON VALORES POSITIVOS.

Media armonica:no sirve para nada.Para velocidades,rendimientos,tiempos...PROPIEDADES:a.-la inversa de la media armonica es igual a la media aritmetica de la inversa de los valores.b.-le afectan mucho los valores pequeños pero no tanto los extremos.c.-no se puede utilizar con valores nulos.

Mediana:si todas las modalidades las ponemos en orden la que queda en medio es la mediana.Variable discreta cuando no usamos intervalos y variable continua cuando en el enunciado nos dan intervalos.

Moda:valor que mas veces se repite.PROPIEDADES:a.-es la medida de posicion central  mas representiva cuando se trabaja con datos susceptibles de ordenacion(categoricos).b.-cambios de origen y de escala.

RELACION ENTRE MEDIA,MEDIANA,MODA:a.-deben de emplearse de forma excluyente.b.-en simetricas coinciden exactamente las tres medidas.

Cuantiles:valor de la variable que se situa en una determinada posicion de la distribucion de la variable.Los mas importantes son:cuartiles(3),deciles(9), percentiles.PERCENTIL DE ORDEN K:medida de posicion NO central que nos da el valor de la muestra ordenada de menor a mayor que deja tras de si el k% de los valores.Nos expresan el % de casos en el grupo especifico de referencia cuyo valor es igual o inferior al dado.Para ser interpretados hay que conocer el grupo de referencia.

MEDIDAS DE DISPERSION:son rango o recorrido(Re),rango o recorrido intercuartilico(RI),varianza(    ),desviación tipica(s),desviacion mediana(DeM),coef de apertura(A),rango o recorrido semiintercuartilico(RS)y coeficiente de variacion(CV).Todos estos sirven para medir la variablidad que hay en los datos para ver lo homogenea o heterogenea que es respecto a la variable de interes y para saber hasta que punto las medidas de posicion son representativas de la muestra.

Rango o recorrido: Rs:valor max- valor min.

Rango o recorrido intercuartilico:recoge entre que valores se encuentra el 50% central de la muestra.RI=C3-C1

Varianza: acompaña a la media aritmetica.mide la dispersion de los valores entorno al valor central.si se toma un valor grande la media no es representativa.PROPIEDADES:varianza siempre mayor o igual que cero.Es la medida cuadratica de dispersion optima.Cambio de origen y de escala.FORMULA:

DESVIACION TIPICA:raiz cuadrada de varianza.PROPIEDADES:a.-desv tipica mayor o igual que cero.b.- es una medida de dispersion optica.c.- cambio de origen y de escala.d.- debe acompañar siempre a la media aritmetica.

DESVIACION MEDIANA:util si la mediana se usa como medida de posicion central.si tomo un valor alto indico que la mediana no es representativa del conjunto.ES COMO LA VARIANZA MENOS LA MEDIANA ( NO MEDIA)Y SIN ELEVAR AL CUADRADO.

COEFICIENTE DE APERTURA:medida de dispersion relativa.medida adimensional independiente.Es como el rango pero dividiento max/min.

RANGO O RECORRIDO SEMIINTERCUARTILICO. C3-C1/C3+C1

COEFICIENTE DE VARIACION: la mas empleada. mide lo grande que es la desviacion tipica en relacion a la media.FORMULA:desv tipica/media aritmetica.

MEDIDAS DE LA FORMA:Fisher: sirve para estudiar si la distribucion esta centrada entorno a su media o si presenta grado de sesgadez a izq o derecha.PROPIEDADES:G1 menor que cero-distribucion simetrica a la izq~~~~~G1 igual que cero distribucion simetrica~~~~G1 mayor que cero-distribucion simetrica a la derecha. FORMULA:igual q varianza pero al cubo y partido por la desv. tipica al cubo.CURTOSIS:refleja lo concentrados o no que estan los valores en torno a los valores centrales. se aplican sobre distribuciones simetricas o con simetria leve.G2 menor q cero-distribucion platicurtica~~~igual q cero-mesocurtica~~~~ mayor que cero-leptocurtica.



 PROBABILIDAD:0!=1  m=num de elem. n=tamaño del grupo.

variaciones:noentran-siimportan-no repiten     FORMULA.m!/(m-n)!

variaciones con repeticion: no si si    FORMULA: vr= m(ELEVADO A N Q ES TAMAÑO DEL GRUPO)

permutaciones: si si no. FORMULA: Pn= n!.

permutacion con repeticion: si si si.  FORMULA: PR ( elevado a a b c )= Pn/a! · b! · c!

combinacion: no no no . FORMULA: c= m!/n!(m-n)!l

combinacion con repeticion: no no si. FROMULA: CR= (m+n-1)!/n!(m-1)!

EJERCICIOS:1.-cuantos numeros de 5 cifras se puenden formar con los digitos 1,2 3, 4 , 5,---- si si no~~~~~~2.-de cuantas formar diferentes se pueden cubrir los puestos de presi, vicepresi, tesorero si hay 12 candidatos---nosino~~~~~~3.-de cuantas formar distintas pueden sentarse 8 personas en una fila de cine----si si no~~~~~4.- de cuantas formas pueden mezclarse los 7 colores si hacemos grupos de 3-----no no no ~~~~~~5.- 10 personas se intercambian saludos----no no no~~~~~6.-de cuantos partidos consta una liga de 4 equipos si ixta el orden----- no si no~~~~~~7.-2, 2, 2, 3, 3, 3, 3 ,4, 4, cuantos num de 9 cifras se pueden formar---- si si si

ESPACIO MUESTRAL: conjunto de todos los posibles resultados de un experimento aleatorio. puede ser finito(valores discretos) o infinito.

SUCESO: subconjunto.ejemplo: de un dado par 2,4,6--- eso es el subconjunto.

UNION: son todos los numeros si existe un numero en los dos sitios solo se pone una vez.EJEMPLO: A(1,2,3); b(2,3,4) Y SU UNION ES 1,2,3,4.

INTERSECCION:son los que estan en ambos sitios.EJEMPLO: A(1,2,3);B(2,3,4) Y SU INTERSECCION ES 2,3.

COMPLEMENTARIO: los que no estan.EJEMPLO EL COMPLEMENTARIO DE A SERA 2,3,4.

DIFERENCIA DE SUCESOS: son los que estan en A y no en B.EJEMPLO: A(2,4,6); B(3,6). La diferencia seria 2,4,. xk el 6 esta en b.

PROBABILIDAD CLASICA: siempre va a estar entre 0 y 1. P(A)= CASOS FAVORABLES/CASOS POSIBLES. EJEMPLO:SACAR EN UN DADO 2 Ó 3. P(A)= 2/6

PROBABILIDAD ASIOMATICA O DE KOLMOGOROW:la p(a) es mayor o igual que cero. La probabilidad del espacio muestral es igual a 1. PROPIEDADES: la p(a) union (b)= p(a)+p(b)//////consecuencias de los axiomas:la probabilidad del complementario de a es igual a 1-p(a)///// la probabilidad del conjunto vacio el igual a cero es decir DISJUNTO( A Y B NO TIENEN NADA EN COMUN)//// cuando  no son disjuntos la p(a) union (b) es la p(a) +p(b)- la interseccion de la probabilidad de a y b.

PROBABILIDAD CONDICIONADA: cuando disponemos de informacion adicional que nos permite actuallizar el espacio muestral, de esta manera varia cuando se tiene en cuenta la nueva informacion.EJEMPLO. TENEMOS UN DADO Y UNOS CHIVAN QUE VA A SALIR PAR. P(A)=1/3.     

Entradas relacionadas: