tglroi

Enviado por Chuletator online y clasificado en Formación y Orientación Laboral

Escrito el en gallego con un tamaño de 25,46 KB

Dichas medidas, también denominadas estadísticos, pueden ser de cuatro Tipos:

A)

Medidas de posición

Las cuales Sintetizan toda la información obtenida reduciéndola a un solo valor.
Dentro de Ellas podemos distinguir:

a.

Medidas de posición central

En las Que se hace referencia a un número “central” que se considera representativo de Toda la muestra o población. Tal es el caso de la media aritmética, la media geométrica, la media armónica, la mediana Y la moda.

b.

Medidas de posición no central

Que Permiten conocer otros aspectos característicos de la distribución que no están Relacionados con los valores centrales. Entre las medidas de posición no Central más importantes están los cuantiles.

B)

Medidas de dispersión

También Llamadas de variabilidad, muestra la Variabilidad de una distribución, indicando numéricamente si los diferentes Valores de una variable están muy alejados con respecto a una medida de Posición central., como puede ser la media aritmética de la distribución. Dentro de este grupo están el rango, el Recorrido intercuartílico, la desviación media, la varianza, la desviación Típica y el coeficiente de variación de Pearson.

C)

Medidas de forma

Las cuales Permiten establecer una tipología de distribuciones comparando su Representación gráfica con la de la distribución normal. Dentro de las medidas De forma podemos distinguir a su vez medidas De asimetría y medidas de apuntamiento o curtosis.

D)

Medidas de concentración

Cuyo Objetivo es cuantificar el grado de desigualdad en el reparto o distribución de Una variable como por ejemplo la renta, beneficios… entre un número determinado De unidades (individuos, familias, empresas…) Dentro de este grupo estudiaremos El índice de Gini y la curva de Lorenz.

2. MEDIDAS DE POSICIÓN

2.1 Media Aritmética


La media aritmética de un conjunto finito de Números se obtiene sumando todas las observaciones y dividiendo elresultado por el tamaño de la muestra. En el caso de distribuciones de frecuencias con datos agrupados por intervalos, Los valores xi utilizados para el cálculo de la media aritmética serán las marcas de clase.

Es Recomendable utilizar la media aritmética cuando los datos sean de naturaleza Aditiva (rentas, salarios, beneficios, pesos, estaturas, puntos…) de tal forma Que su suma representa el total de los recursos repartidos entre todos los Elementos de la distribución.

En Estos casos podemos utilizar la media Aritmética ponderada, xw, en la que cada valor de la variable xi recibe una Ponderación o peso independientemente de su frecuencia.

Propiedades de la media aritmética

- La suma de las desviaciones de los valores de la variable con respecto a la Media aritmética es igual a cero. - Si a todos los valores de la variable se Les suma o resta una misma cantidad, la media aritmética queda aumentada o Disminuida también en dicha cantidad (cambio De origen).
- Si todos los valores de la variable se multiplican o se Dividen por una misma cantidad, la media aritmética queda multiplicada o Dividida también por dicha constante (cambio De escala).-
Si una variable Y es transformación lineal de otra variable X, tal que Y = a + bX, entonces la media aritmética de la variable Y sigue la Misma transformación lineal con respecto a la media aritmética de lavariable X

Ventajas e inconvenientes de la media Aritmética

Ventajas: -
Su cálculo es muy sencillo.- Se puede calcular en las variables De naturaleza cuantitativa.- Para Su cálculo se utilizan todos los valores de la distribución.- Está perfectamente definida de forma Objetiva y es única para cada distribución de frecuencias.- Tiene un claro significado, ya que al ser el centro de gravedad De toda la distribución nos representa a todoel conjunto de valores observados.

Inconvenientes:-
Es una medida de posición muy sensible a los Valores extremos de la distribución, con lo que puede llegar aser poco representativa del conjunto Si la dispersión de los datos es muy elevada.- No puede ser calculada cuando la variable es de tipo Cualitativo.- Podemos tener Dificultades para su cálculo en distribuciones con intervalos abiertos.

2.2 Media Geométrica


La media geométrica, denotada por G, es una Medida de posición central utilizada generalmente cuando los valoresde la variable no son de naturaleza Aditiva, sino acumulativa o con efectos multiplicativos. Tal es el caso de los Tiposde interés, porcentajes, Tasas, números índices…

En Estos casos es aconsejable utilizar la media geométrica, pues se trata de la Medida de posición central más representativa cuando la variable presenta Variaciones acumulativas.

Su Valor se obtiene como la raíz enésima del productorio (idem a sumatorio pero Con productos) de los valores de la variable elevados a sus frecuencias Respectivas.

Ventajas e inconvenientes de la media Geométrica

Ventajas:
- Si su cálculo es posible, está definida de Forma objetiva y es única. - Tiene en cuenta en su cálculo a todos los valores De la distribución. - Los valores extremos tienen menor influencia que en la Media aritmética por estar definida a través de productos en vez de sumas. - Es Más representativa que la media aritmética cuando la variable evoluciona de Forma acumulativa con efectos multiplicativos.

Inconvenientes: -
Su cálculo es más complicado que el de la Media aritmética.- Si algún valor de la variable es igual a cero, el resultado Obtenido no es representativo al obtenerse unamedia geométrica nula.- Así mismo, si la variable presenta valores negativos podría darse el caso de Que no fuera posible calcularla,ya Que se obtendrían soluciones imaginarias.

2.3 Media Armónica

Existen Situaciones en las que no es adecuado utilizar la media aritmética ni la Geométrica, ya que los datos observados no son de naturaleza aditiva ni Multiplicativa. Esto ocurre en los casos en los que se desea promediar velocidades, Rendimientos, productividades… es decir, aquellos casos en los que la variable Está medida en unidades relativas. Para este tipo de variables resulta más Apropiado el uso de la media armónica.

La Media armónica, H, es la inversa de la media aritmética de los inversos de los Valores de la variable

Ventajas e inconvenientes de la media Armónica

Ventajas: -
Está definida de forma objetiva y es única.- Intervienen todos los valores de la Distribución.- Es más Representativa que las otras medias en los casos de obtener promedios en Velocidades, rendimientosy Productividades.

Inconvenientes: -
Si algún valor de la variable es nulo, no es Posible calcular la media armónica.- La presencia de valores de la variable muy pequeños pueden provocar que sus Inversos aumentenmuchísimo haciendo Despreciable frente a ellos la información de otros valores mayores de xi

2.4 Mediana

La Mediana (Me) es aquel valor tal que, tras ordenar los valores de la variable en Orden creciente, deja a su izquierda y a su derecha el mismo número de Frecuencias.

A) Cálculo de la mediana en Distribuciones con valores no agrupados en intervalos:

El Cálculo de la mediana se realiza de la siguiente manera:

O Si la distribución de frecuencias es Unitaria


-En el caso de que El número de datos N sea impar, la mediana será el valor central de la distribución.

--Por el Contrario, si el número de datos N es par, existirán dos valores centrales, por Lo que la mediana será la media aritmética entre ellos.

o Si la distribución de frecuencias no Es unitaria, deberemos de calcular el valor N/2 y compararlo con la columna de Frecuencias absolutas acumuladas. Se observa cuál es la primera frecuencia acumulada Que supera o iguala N/2, distinguiéndose dos casos:

-Si N/2 coincide Con algún valor de la columna de frecuencias absolutas acumuladas, entonces la Mediana será la media aritmética entre el valor de la variable cuya frecuencia Absoluta acumulada coincide con N/2 y el siguiente valor variable.

-Si N/2 no coincide con ningún valor de la Columna de frecuencias absolutas acumuladas, entonces la mediana será el primer Valor de la variable cuya frecuencia absoluta acumulada sea superior a N/2.

B) Cálculo de la mediana en Distribuciones con valores agrupados en intervalos:

. Una vez determinado el intervalo cuya frecuencia absoluta es igual o mayor que N/2, el procedimiento para obtener la mediana es el siguiente:

o Si se cumple que Ni = N/2 coincide con algún valor de la columna de frecuencias Absolutas acumuladas, entonces por convención el valor de la mediana será el Extremo superior del intervalo que verifica dicha condición.

o Si no hubiera ningún valor Ni igual a N/2, entonces el intervalo que contiene a La mediana será el valor de la variable cuya frecuencia absoluta acumulada Nisea mayor que N/2..

Ventajas e inconvenientes de la mediana

Ventajas: -
Se trata de la medida más representativa en El caso de variables que sólo admiten escala ordinal.- Su interpretación y Cálculo son sencillos.- No es Sensible a valores extremos de la variable ya que en su cálculo sólo Intervienen los valores centralesde La distribución.

Inconvenientes:


- En su determinación no intervienen todos los valores de la variable, por lo que No se utiliza toda la información presente en la distribución.

2.5 Moda

La Moda (Mo) se define como el valor de la variable que más veces se repite, es Decir, se trata de aquel valor de la variable que presenta la mayor frecuencia Absoluta. Dado que la moda está definida en relación a valores de la variable Asociados a sus distintas frecuencias no tiene sentido hablar de moda en las distribuciones De frecuencias de tipo unitario.

A) Cálculo de la moda en Distribuciones con valores no agrupados:

En El caso de que los valores no estén agrupados en intervalos, la moda será Simplemente aquel valor de la variable que presente la máxima frecuencia.

Moda relativa


Valor (o valores) de la variable cuya Frecuencia absoluta no es superada por la de sus valores contiguos

B) Cálculo de la moda en Distribuciones con valores agrupados en intervalos:

En Este caso no hablaremos de un valor para la moda sino de un intervalo modal que Será aquel que presente la mayor frecuencia, siempre que la amplitud de todos Los intervalos sea la misma. En caso contrario, la moda será aquel intervalo Que presente la mayor densidad de frecuencia, di , en relación a la amplitud Del intervalo ni , es decir, aquel que presente el mayor valor di = ni / Ai  (ai corresponde con la amplitud del Intervalo).

Ventajas e inconvenientes de la moda

Ventajas: -
Sencillez de cálculo y fácil interpretación.- Es posible calcularla tanto para Variables cuantitativas como para variables cualitativas.

Inconvenientes: -
En su determinación no intervienen todos los Valores de la distribución, centrándonos sólo en la mayorfrecuencia absoluta de un determinado valor de la variable o de la Modalidad de los atributos.

2.6 Cuantiles

Los cuantiles, Q, son aquellos valores que dividen la distribución en un cierto Número de partes iguales, de manera que en cada una de ellas hay el mismo Porcentaje de valores de la variable. Los cuantiles mas utilizados son:

• Los cuartiles, Ci , son tres valores que dividen a la Variable en cuatro partes iguales (C1 , C2  Y C3) por lo que dentro de cada uno está incluido el 25% de los valores. Los cuartiles corresponden pues al 25%, 50% y 75%.

• Los deciles, Di , son nueve valores que dividen a la variable En diez partes iguales (D1, D2,…,D9), por lo quedentro de cada uno está incluido el 10% de los valores. Los Deciles corresponden al 10%, 20%...90%.

• Los percentiles, Pi , son noventa y nueve valores que dividen la Distribución en cien partes iguales (P1,P2,…P99) por lo que dentro de cada uno está incluido el 1% de los valores. Los percentiles corresponden al1%, 2%,…,99%,.

A) Cálculo de cuantiles en Distribuciones con valores no agrupados en intervalos:

El Primer paso para calcular cuantiles en distribuciones con valores no agrupados Es obtener los diferentes valores teóricos de las frecuencias acumuladas de Cuantil. Para ello utilizaremos la expresión rN / q, en la que r es el cuantil Correspondiente, q el número de intervalos con iguales frecuencias en que se Divide la distribución utilizando dicho cuantil y N es el total de datos.

o Si el valor rN / q coincide con algún valor de la columna de frecuencias Absolutas acumuladas de la distribución entonces el valor del cuantil será Igual a la media aritmética del valor de la variable cuya frecuencia absoluta Acumula es rN / q y el siguiente valor de la variable.

o Por el contrario, si no existe alguna frecuencia acumulada igual a rN / q, el Valor del cuantil será el primer valor de la variable cuya frecuencia absoluta Acumulada sea superior a rN / q.

3. MEDIDAS DE DISPERSIÓN

Mediante Las medidas de dispersión podemos cuantificar la separación o la variabilidad De los valores de la distribución con respecto a un valor central. Cuanto mayor Sea la dispersión, menos representativa de la distribución será la medida de Posición.

medidas De dispersión en:

• Medidas absolutas:


son aquellas cuyo valor está expresado en las Unidades de medida de la variable, y que, por lo tanto no son comparables entre Diferentes distribuciones. Tal es el caso del rango, el recorrido intercuartílico, la desviación media y la Desviación típica.

• Medidas relativas: cuyo resultado está expresado sin unidades de medida, por lo Que sirven para comparar la dispersión de distribuciones de frecuencias Distintas. Un ejemplo de medida de dispersión relativa es el coeficiente de variación de Pearson.

3.1 Medidas de dispersión absoluta

3.1.1 Rango

El Rango R, también denominado recorrido, se define como la diferencia entre el Mayor y el menor valor de la variable, de tal forma que si ordenamos los Valores de la variable de manera creciente tenemos que el rango se calcula: R = Xk  – x1

La Ventaja fundamental del rango es su Sencillez de cálculo, pero presenta un claro inconveniente:
Se trata de una medida imprecisa puesto que sólo Tiene en cuenta el máximo y el mínimo de la distribución, sin tener en cuenta La frecuencia de cada valor.

3.1.2 Recorrido intercuartílico

El Recorrido intercuartílico, RI, se define como la diferencia entre el tercer y El primer cuartil de la distribución, tal que: RI = C3  – C1 Esta media evita la influencia que Tienen en la dispersión los valores más extremos, ya que recoge el 50% central De las observaciones.

3.1.3 Desviación absoluta

Para Medir la representatividad de una determinada media de posición P parece razonable Utilizar como medida las distancias de todas las observaciones con respecto a Ella, ya que cuanto más agrupados estén los valores en torno a una medida de Posición, más representativa será esta. Sin embargo, no podemos utilizar las Distancias con su signo, ya que al agregar todas se compensarían entre sí y no Sería posible obtener una medida de la dispersión. Para evitar este problema, Una posible solución consiste en definir las distancias a la medida de posición En valor absoluto y obtener un promedio de ellas, obteniendo así el estadístico Denominado desviación absoluta, el cual denotaremos por D.

3.1.4 Varianza


Otra alternativa para resolver el problema de Compensación entre desviaciones de diferente signo  consiste en la elevación al cuadrado, Obteniendo así el estadístico denominadovarianza cuadrática

Tiene La ventaja de que es una buena medida de dispersión cuando se ha utilizado la Media como medida de posición. Sin embargo, presenta el inconveniente de que Viene expresada en distinta unidad que la variable (la unidad de la variable al Cuadrado).

La Varianza está acotada inferiormente de tal forma que nunca puede ser negativa Al ser una suma de cuadrados, verificándose que 0 ≤ S2  ≤ ∞. En el caso particular de S2 = 0 estaremos Ante una situación de nula dispersión, lo que indica que todos los valores de La variable son iguales a una constante.

3.1.5 Desviación típica

La Desviación típica se define como la raíz cuadrada de la varianza, tomando el Resultado con signo positivo. Presetna la ventaja frente a la varianza de que Su valor viene expresado en la misma unidad que la variable. Matemáticamente la Desviación típica , denotada por S

3.2 Medidas de dispersión relativa

para Poder establecer comparaciones entre diferentes niveles de dispersión en torno A un determinado parámetro de dos distribuciones distintas. Por ello Utilizaremos medidas de dispersión relativa, cuyos valores se expresan adimensionalmente, Lo que posibilita la comparación de distribuciones medidas en distintas Unidades. Dentro de estas medidas, la más utilizada en estadística es el Coeficiente de Variación de Pearson.

3.2.1 Coeficiente de variación de Pearson

El Coeficiente de variación de Pearson, representado por γ, se define como el Cociente entre la desviación típica y el valor absoluto de la media,

Esta Medida nos da la dispersión en porcentaje, por lo que permite su interpretación De forma fácil, y además, facilita poder comparar la dispersión de varias Distribuciones aunque las variables estén en diferentes unidades de medida.

El valor mínimo del coeficiente de Variación de Pearson es cero, lo cual quiere decir que si S = 0, es decir, Todos los valores de la variable coinciden con la media, y por tanto, no hay Dispersión. El problema a la hora de Calcular este coeficiente es que la media de la variable analizada sea igual a Cero, lo que impediría obtener un valor numérico para el coeficiente. En este Caso, sería adecuado realizar un cambio de origen de la variable para solventar El problema.

3.2.2 Tipificación de Variables

procedimiento Mediante el cual podemos transformar cualquier variable en una nueva quedenominaremos Z con media igual a cero Y varianza igual a uno.

4. MEDIDAS DE FORMA

4.1 Medidas de Asimetría

El Objetivo de la medida de asimetría es estudiar la deformación horizontal de los Valores de la variable respecto al valor central de la media. En términos Generales diremos que una distribución es simétrica Cuando a la derecha y a la izquierda de su media existe el mismo número de Valores, equidistantes dos a dos de la media, y además con la misma frecuencia.

En Caso de que no satisfaga esa condición diremos que la distribución es Asimétrica, pudiendo ser de dos tipos: • Asimétrica a la izquierda: Mo ≥ Me ≥ X • Asimétrica a la derecha: Mo ≤ Me ≤ X

4.1.1 Coeficiente de asimetría de Pearson

Este Coeficiente, denotado por Ap, se calcula como el cociente entre la diferencia De la media aritmética y la moda, y la desviación típica. Matemáticamente:

El Signo del resultado dependerá del numerador, ya que la desviación típica Siempre es positiva. Su interpretación es la siguiente:

• Si Ap > 0, la distribución es asimétrica a la derecha.

• Si Ap = 0, la distribución es simétrica.

• Si Ap < 0, la distribución es asimétrica a la izquierda.

Si Bien se trata de una media muy sencilla de calcular, sólo puede utilizarse en El caso de que la distribución sea unimodal y campaniforme. Asimismo, al Basarse sólo en la distancia entre media y moda, no es adecuado para medir asimetrías Leves.

4.1.2 Coeficiente de asimetría de Fisher

Si La distribución no fuera unimodal y campaniforme, debemos recurrir al Coeficiente de asimetría de Fisher, cuya expresión es: gi

• Si las diferencias positivas superan a las negativas, el resultado será Positivo, por lo gi  > 0 y la Distribución será asimétrica a la derecha.

• Si las diferencias negativas superan a las positivas, el numerador será Negativo y por tanto gi  < 0 y la distribución Será asimétrica a la izquierda.

• Finalmente si las diferencias positivas se compensan con las negativas anulando El numerador tal que gi  = 0, la Distribución será simétrica.

Generalmente, El coeficiente de Fisher es más preciso que el de Pearson

4.2 Medidas de apuntamiento o curtosis

Las Medidas de apuntamiento o curtosis tratan de estudiar la distribución de frecuencias En la zona central de la distribución. Una mayor o menor concentración de Frecuencias en torno a la media de la distribución dará lugar a una distribución Más o menos apuntada.

Para Estudiar el apuntamiento hay que definir una distribución tipo que nos sirva de Referencia. Esta distribución esconocida como la distribución Normal y se Corresponde con numerosos fenómenos de la naturaleza. Su forma es la de una Campana

• Una distribución es mesocúrtica si La distribución de sus datos es la misma que la variable normal.

• Una distribución es leptocúrtica si Está apuntada más de lo normal.

• Una distribución es platicúrtica si La distribución está menos apuntada.

4.2.1 Coeficiente de apuntamiento de Fisher

El Coeficiente más utilizado para medir la curtosis es el coeficiente de Apuntamiento de Fisher, el cual se calcula deacuerdo con la siguiente Expresión: g2

• Si g2  > 0, la distribución es leptocúrtica.
• Si g2 = 0, la distribución es mesocúrtica.
• Si g2< 0, la distribución es platicúrtica.

5. MEDIDAS DE CONCENTRACIÓN

Las Medidas de concentración tratan de poner de manifiesto el mayor o menor grado De igualdad en el reparto total de los valores de la variable. Son por tanto, Indicadores del grado de equidistribución de la variable, es por ello que este tipo De medidas proceden del cambo de la Economía, aplicándose a distribuciones de Rentas, salarios…

• Concentración máxima, o menor equidad en el reparto. En este caso, un solo Individuo percibe el total y los demás nada. En este caso no encontramos ante Un reparto no equitativo tal que: x1  = X2  = xk-1 = 0 y xk = P. El hecho de ser El individuo k el que más cobra (el único) se debe a que los xi  se expresan siempre de manera creciente.

• Concentración mínima o menor equidad en el reparto. Ahora el conjunto total de Valores de las variable está repartido por igual, es decir, se trata de una Situación de reparto equitativo verificándose que x1  = x2  = …= xk = P / k.

5.1 Curva de Lorenz

Una Forma de estudiar gráficamente la concentración es a través de la curva de Lorenz, la cual se construye representando en el eje de abscisas el porcentaje De frecuencias acumuladas y en el eje de ordenadas de los porcentajes Acumulados de total de la variable. Al unir los puntos resultantes obtenemos la Curva, cuya forma nos permitirá determinar el nivel de concentración.

Generalmente La curva se representa junto con la diagonal del cuadrado, denominada línea de equidad.

• Concentración mínima: la curva coincide con la diagonal, verificándose por Tanto que pi = qi  para todo i. Se trata De una situación de máxima equidad.

• Concentración máxima: la curva coincide con los lados del cuadrado, Verificándose que qi  = 0 para i = 1,2…k-1 Y qi = 100. En este caso, no existe equidad alguna en el reparto.

5.2 Índice de Gini

El índice de Gini cuantifica el grado de aproximación existente entre la curva de Lorenz y la línea de equidad. Matemáticamente se expresa como: IG =

Es Importante resaltar que el sumatorio termina en k-1 porque el numerador, aunque El sumatorio abarca hasta k, sólo tendríamos (k - 1) sumandos, al ser pi  = qi  = 100, con lo que pi  – qi  es siempre igual a cero.

En Función de los resultados que podemos obtener al calcular este índice, podemos Distinguir dos casos extremos:

• Concentración mínima (IG = 0): al verificarse que p = qi.

• Concentración máxima (IG = 1): al verificarse que qi  = 0 para i = 1,2…k-1 y qi = 100.

Por Tanto el índice de Gini oscila entre 0 y 1. Cuanto más próximo esté su valor a Cero, menor será la concentración, es decir, mayor equidad habrá en el reparto De la variable entre los individuos; por el contrario, cuanto más próximo esté A la unidad, mayor será la concentración.

Entradas relacionadas: