Discriminante de belson

Enviado por Chuletator online y clasificado en Matemáticas

Escrito el en español con un tamaño de 8,63 KB

ANTECEDENTE HISTÓRICO

•Ronald   Aymer   Fisher   se considera el fundador del análisis discriminante.
Desarrolló un procedimiento empírico para establecer los Determinantes de la clasifi- cación  de Diferentes  espe- cíes            biológicas,   es   Decir, qué  carácterísticas Explican que    una especie se clasifi- Que en un grupo u otro.

DEFINICIÓN

El análisis discriminante es una técnica Estadística que permite asignar un individuo a un grupo definido previamente en función de sus carácterísticas, esto es, de sus puntuaciones en un conjunto de Variables.Variable que define el grupo al que pertenece el individuo se toma Como variable dependiente (a explicar) y las variables que definen las Puntuaciones o           las Carácterísticas de los individuos se consideran como las variables Independientes (explicativas).Como la variable dependiente establece el grupo Al que pertenece cada individuo se trata de una variable categórica.Las Variables independientes a partir de las cuales se lleva a cabo la asignación a Grupos deben ser dos o más y de carácter métrico.En el análisis discriminante Se trata de analizar cuáles son las variables que contribuyen en mayor medida a Discriminar a los sujetos en los diferentes grupos.Para conseguirlo, las Variables que mejor discriminen se   reducen A variables canónicas, esto es,  a una Combinación lineal de las variables independientes, conocidas como funciones Discriminantes.En  consecuencia,  el  Análisis  discriminante  es  una Técnica de dependencia que construye combinaciones lineales de variables Independientes métricas que se utilizan para predecir la clasificación de los Casos en una variable dependiente categórica.El objetivo fundamental es Predecir el valor que adquirirá un caso en una variable criterio a partir          del  Conocimiento  de  las  puntuaciones  que adquiere en un conjunto de variables Predictoras. Se reduce el número de variables a un número menor de funciones Discriminantes., una técnica de clasificación.Trata de determinar qué Carácterísticas de cada caso definen su pertenencia a un grupo. Cuando en la Variable dependiente se distingue entre tres o más grupos, se habla de análisis Discriminante múltiple (ADM),.

OBJETIVOS


1. Determinar  si  existen  Diferencias  significativas entre   los perfiles multivariantes de dos o más grupos Definidos con anterioridad.2. Establecer el conjunto de variables que expli- Quen en mayor medida las diferencias en los perfiles entre los grupos.3. Usar El conjunto de variables para desarrollar una   función    que    Represente    la    máxima separación o discriminación entre Los grupos.4. Establecer reglas de clasificación o asignación de nuevos casos a Los grupos a partir de sus puntuaciones en las funciones calculadas., los Objetivos del análisis discriminante tienen que ver, por una parte, con la Discriminación y, por otra, con la clasificación:1. Discriminación: encontrar Las variables que mejor diferencien entre la pertenencia a un grupo y a los Demás.2. Clasificación: derivar una regla que pueda usarse de manera óptima Para asignar nuevos casos a los grupos predefinidos.. En la utilización Explicativa se trata de determinar la contribución de cada variable Independiente a la clasificación correcta de cada uno de los casos. En el uso Predictivo, se trata de determinar el grupo al que pertenece un caso para el Que se conocen los valores que toman las variables independientes.

PERFILES MULTIVARIANTES

Los perfiles multivariantes pueden Representarse en un diagrama de perfiles, un gráfico que muestra las Puntuaciones tipificadas en un conjunto de variables. La idea de partida del Análisis discriminante es que aquellas variables que presenten mayores Diferencias en      las medias  para cada  Grupo pueden ayudar  a separar Mejor la pertenencia a uno u otro grupo. Se pueden comparar estas dos matrices Mediante una    prueba de F multivariante Para determinar si existen o no diferencias significativas entre grupos.

Para   Valorar   qué   variables   Presentan   mayores diferencias  en  Las  medias  para  Cada  uno  de  los Grupos se utiliza el estadístico Lambda De Wilks (λ).Trata de probar la hipótesis nula según la cual no existen Diferencias significativas entre las medias de los grupos en las variables. Una λ=1 significa que la SC intra-grupos es igual a la SC total y que la SC entre Grupos es igual a 0, y así, no existe diferencia entre las medias de los Grupos. Valores de λ próximos a 0 significan que una gran parte de la Variabilidad total es atribuible a la diferencia entre las medias de los Distintos grupos. A partir del valor de λ de Wilks se estima el corres- pondiente   valor  De  F,  que  Implica  un  nivel  De significación determinado. Altos valores en λ de Wilks implican un Bajo valor deF y, en consecuencia, una alta significación.Cuando el valor de Significación es <.05, entonces las medias          de  los  Grupos  no  presentan  Diferencias significativas y, por tanto, la variable no sirve para Discriminar entre la pertenencia a un grupo u otro.

VARIABLES DISCRIMINANTES

A partir de los resultados de las Pruebas de igualdad de     las medias de Los grupos, se puede determinar qué variable o qué conjunto de variables se Tomarán en cuenta para discriminar la pertenencia a grupos. El método “paso a paso” selecciona las variables De forma análoga a como se hace en la regresión. Existen varios criterios de selección de las variables:1. Directo:  todas  Las  variables  entran  A  la  vez, siempre que cumplan el criterio de Tolerancia.2. Lambda de Wilks: se selecciona la variable que minimiza el valor Global de Lambda de Wilks. 3. Varianza   Explicada:   entra   la   Variable   que minimiza la suma de La varianza no explicada para todos los pares de grupos. 4. D de Mahalanobis: Entra la variable que maxi- miza la D2 entre los dos grupos más próximos. 5. Menor razón F: basado en la D de Mahalanobis, contrasta la hipótesis de Igualdad de medias en la población para dos conjuntos de variables en uno y Otro grupo. 6. V de Rao o traza de Hotelling: se selecciona la variable que            produce el mayor aumento en            el valor de la V           de Rao. Cuanto más próxima a 0 sea la Tolerancia, mayor probabilidad de que la variable sea altamente colineal con el Resto de las variables presentes en cada paso.

FUNCIONES DISCRIMINANTES

El análisis discriminante estima Aquellas combinaciones de variables que maximicen las diferencias en la medias Entre los grupos. Cada  una  de  Esas  combinaciones  lineales  De  las variables se conoce como Función discriminante.La base del análisis discriminante supone establecer una Combinación lineal de las variables que permita discriminar mejor entre la Pertenencia a los grupos.El  criterio  Discriminante  es  una  Estimación  de  la variabilidad entre grupos explicada por Cada una de las funciones discriminantes. Cuanto más alto sea  de una función más eficacia presenta esa Función para discriminar entre los grupos.La medida en que una función Discrimine depende cuánto aumente las diferencias entre los grupos y disminuya Las diferencias dentro de cada grupo.La primera función discriminante será la Que más discrimine, la segunda será la segunda que más discrimine, etc.En  principio,  Pueden  distinguirse  tantas  Funciones discriminantes como variables independientes haya o como Grupos menos uno (k-1), lo que sea menor.Para  Valorar  la  capacidad  Discriminante  de  cada función  Se  puede utilizar  el  Autovalor,  la varianza explicada Y la correlación canónica de cada función.El autovalor es la razón entre la Suma de cuadrados entre los grupos y la suma de cuadrados dentro de los grupos (intra-grupos).

Entradas relacionadas: