Analisis estadístico unidimensional

Enviado por Programa Chuletas y clasificado en Otras materias

Escrito el en español con un tamaño de 30,34 KB

Análisis estadistico unidimensional.

Distribucion de frecuencias.

Distribución de frecuencias para valores no agrupados:

Valor de la variable: xi

Frecuencia absoluta: ni

Frecuencia relativa: fi = ni / N

Frecuencia absoluta acumulada: ni

Frecuencia  relativa acumulada: fi

 Número total d datos: N

Distribución de frecuencias para valores agrupados en intervalos: 

Amplitud del intervalo: ai= li-1-l1

Valor de la variable: xi=L0+L1/2

Frecuencia absoluta: ni

Frecuencia relativa: fi = ni / N

Frecuencia absoluta acumulada: ni

Frcuencia  relativa acumulada: fi

Amplitud d intervalo: ci= Li- Li-1

Altura de cada intervalo: hi=fi/ci

Porcentaje: fi*100= %

Medidas de Posicion

Medidas de posicion central:

Media Aritmtica: x=   xi*ni/no tambien: x= xi*fi

Propiedades:

1)si a<xi<b entonces a<X<b

2)No varia si se multiplica o divide por una constante.

3)    (xi-x)ni=0

4)Teorema de könig: la suma de las desviaciones al cuadrado de las desviaciones de la variable respecto de una constante cualquiera (c) se hace minima cuando c=X.

5)Se ve afctada por cambios de origen .

Es decir (yi= xi+c) entonces Y=X+c.

 caso particular Y=X-X entoncs Y= X-X=0

6)se ve afectada por cambios de escala. Es decir (yi=cxi), entonces Y=cX

7) X= X1N1+X2N2+...+XkNk/ N1+N2+...Nk

Media Geometrica:G(x)=   

Propiedades:

1)Su logaritmo es igual a la X d los logaritmos de los valores de la variable.

2)Es siempre menor o igual q la X

3)para %, tasas, numeros indice.

Mediana:

Datos sin agrupar

Caso1.El porcentaje N/2 no figura en la columna de frecuencias absolutas acumuladas;

Es dcir , Ni-1<N/2<Ni .Entonces, Me(x)=xi

caso2. El porcentaje N/2 coincide con una de las frecuencias absolutas acumuladas;

 Es decir, si N/2 =Ni .Entonces , Me(x)=xi+xi+1/2

Datos agrupados en intervalos

Calculamos el valor n/2. se encontrara entre dos frecuencias acumuladas:

Ni-1<N/2<Ni   Me(x)=  Ii-[Li-1,Li)  

Su valor se obtiene como: Me(x)=Li-1+ci[(N/2)-Ni-1/ni].

Si trabajaramos con frecuencias relativas, la  formula seria:     Me(x)=Li-1+ci[0,5-Fi-1/fi] 

Moda:

Datos sin agrupar.

 Se localiza la frecuencia maxima (ni=nmax).l valor xi asociado sra la moda

Datos agrupados en intervalos.

Se trabaja con las alturas de los intervalos. Se localiza la altura maxima (hi=hmax).

En el intervalo correspondiente (Ii) se hallara la moda.

Su valor se calcula como: Mo(x)=Li-1+ci[hi+1/hi-1+hi+1]

Medidas de posicion no central

Cuartiles:

Los cuartiles son los tres valores de la variable dividen a un conjunto de datos ordnados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Datos agrupados en intervalos.

Qk=Li+[(k*N/4)-Fi-1/fi]*ai    k=1,2,3

Datos sin agrupar.

El cuartil coincide con mayor Ni.

Deciles:

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

Datos agrupados en intervalos.

Dk=Li+[(k*N/10)-Fi-1/fi]*ai    k=1,2,3

Datos sin agrupar.

El decil coincide con mayor Ni

Percentiles:

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

Datos agrupados en intervalos.

Pk=Li+[(k*N/100)-Fi-1/fi]*ai    k=1,2,3

Datos sin agrupar.

El percentil coincide con mayor Ni.

 



Medidas de Dispersión .

Medidas de Dispersión Absolutas.

Recorrido: Re=xmax-xmin

Recorrido Intercuartílico: RI= Q3-Q1

Varianza: Sx2=        (xi-X)ni/N

Propiedades:

1) Sx2>0. Si Sx2=0.  Entonces x será constante.

2)No cambia ante cambios de origen. Es decir Y=cX, entonces Sy2=Sx2.

3)Si realizamos un cambio de escala, la varianza queda multiplicada por el cuadrado de la constante. Es decir, Y=cX, entonces Sy2= c2Sx2

4) Sx2=[     xi2ni/N]-X2

Desviación Tipica: Sx=+    Sx2

Tipificación de una variable.

Tipificar una variable equivqle q centrar los datos (se les resta su X)y realizar un cambio de escala (se divide entre la Sx).Comparamos variables expresadas en unidades diferentes.

Si x es una variable con X, Sx2 y Sx entonces una variable tipificada tendrá como expresión:

Y= X-X/Sx. Se puede comprobar que Y=0, Sy2=1, Sy=1

Desviación Media respecto de la Media: DX=    xi-X  ni/N

Desviación Media respecto de la Mediana: DMe =     xi-Me(x) ni/N

Medidas de Dispersión Relativas.

Coeficiente de variación de Pearson: CVx= Sx/X

La interpretación de este coeficiente es:

      0<CVx<0´25  

0´25<CVx<0´50

         CVx>0´50                                                                                                                                                

Indice de dispersión respecto de la mediana: IMe= DMe/Me

La interpretación de este coeficiente es:

      0<IMe<0´25

0´25<IMe<0´50

         IMe>0´50

Momentos.

Momento relativo de orden r respecto del origen: ar =     xirni/N   r =0,1,2.....

Casos particulares: a0= 1; a1= X; a2=    xi2ni/N

Momento relativo de orden r respecto de X:  mr =     (xi-X)rni/N, r=0,1,2....

Casos particulares: m0=1; m1= 0; m2=    (xi-X)2ni/N=Sx2=    (xi2ni/N)-X2= a2-a12

Medidas de forma.

Asimetría:

1erCoeficiente de asimetría de Pearson: Hace referencia a la forma de la distribución.

 Ap= X- Mo(x)/Sx

Ap= 0 la distribución es simétrica

Ap>0 La distribución es asimétrica por la derecha o positiva

Ap<0 La distribución es asimétrica por la izquierda o negativa

2º Coeficiente de asimetría de Pearson: Hace referencia a la forma de la distribución.

 A´p= 3[X-Me(x) /Sx]

p= 0 la distribución es simétrica

p>0 La distribución es asimétrica por la derecha o positiva

p<0 La distribución es asimétrica por la izquierda o negativa

Coeficiente de Bowley-Yule:Hace referencia a la forma de la distribución.

 C= [(Q3-Me(x))-(Me(x)-Q1]/Q3-Q1

siendo -1<C<1

C= 0 la distribución es simétrica

C>0 La distribución es asimétrica por la derecha o positiva

C<0 La distribución es asimétrica por la izquierda o negativa

Coeficiente de asimetría de Fhiser: Hace referencia a la forma de la distribución.

g1=m3/Sx3, siendo m3=     (xi-X)3ni/N

g1= 0 la distribución es simétrica

g1>0 La distribución es asimétrica por la derecha o positiva

g1<0 La distribución es asimétrica por la izquierda o negativa

Curtosis:Hace referencia al grado de apuntamiento de la distribución

g2= (m4/Sx4 )-3, siendo m4=     (xi-X)4ni/N

Si g2=0, diremos que la distribución es mesocúrtica (mismo apuntamiento que la normal).

Si g2>0, diremos que la distrubución es leptocúrtica (mayor apuntamiento que la normal).

Si g2<0, diremos que la distribución es platicúrtica (menor apuntamiento que la normal).

Medidas de concentración.

Indican el grado de equidistribución de la variable, para variables como renta, salarios, riqueza,etc.

Indice de Gini:

 Valor total de los valores de xi: si=xini

Valor totalde los valores menores oiguales que xi: Ai=      Sj

Proporción respecto del total de los valores menores o iguales a xi: pi=Fi=Ni/N

Proporción respecto del total de la suma de los valores menores o iguales a xi: qi=Ai/Ak

Construiremos la tabla de la siguiente forma: xi,ni,Ni,pi,si,Ai,qi,(pi-qi)

IG=         (pi-qi)/    pi

Propiedades:

1) Si x es una variable que toma valores positivos, entonces para todo i, pi>qi

2)Cuando la concentración es minima (x1=x2=...=xk), IG=0

3)Cuando la concentración es maxima (q1=q2=...=qk-1=0;qk=1); IG=1

4)El índice de Gini toma valores entre 0 y 1            0<IG<1

Cuantomenor sea el índice de Gini, más baja será la concentración y por tanto el reparto será más equitativo. Por el contrario, valores elevados del índice, indican que la concentración es elevada y por tanto el reparto menos equitativo.

5)Es adimensional e invariante ante cambiios de escala, pero no de origen.

Curva de Lorenz:

Es la poligonal que une los puntos (pi qi), i= 1,2,...,k

Se encuentra por debajo de la bisectriz del primer cuadrante, ya que pi es menor o igual que qi

Representa de forma gráfica la concentración.

Cuanto mayor es el área de concentración (área entre la poligonal y la bisectriz), mayor será la concentración.

El Ig cumple: IG    Área de concentración/Área     , siendo Área    =1/2

Se pueden dar diferentes situaciones:

Concentración mínima. IG=0

Concentración máxima. IG=1

IGde A<IG de B

IG de A=IG de B

Entradas relacionadas: