Correlació i regressió: conceptes bàsics
Enviado por Chuletator online y clasificado en Física
Escrito el en catalán con un tamaño de 6,32 KB
Una distribució bidimensional o bivariant està formada per un conjunt de valors (Xi , Yi) de dues variables quantitatives X i Y. Cada par de valors representa les dades d’un individu que s’organitza en una taula.
Correlació:
Relació entre dues variables quantitatives. Quantifica la força de l’associació. Canvis d’una tingui influència sobre l’altra variables correlacionades.
Regressió Lineal:
Estudiar la relació entre dues variables quantitatives, descrivint el comportament d'una en funció de l'altra.
Diagrama dispersió:
Mostra la relació entre dues variables quantitatives mesurades als mateixos individus en que cada punt disposa del seu par de coordenades (X, Y) que correspon als valors observats per cada variable. Hem de recordar que: Variable independent o explicativa (X), abscisses, (Y) dependent, ordenada.
Covariància de dos variables X i Y (Sxy):
Aquest estadístic mesura la variabilitat o dispersió entre dues variables quantitatives continues X i Y indicant la relació lineal entre elles, podent ser aquesta relació directa o inversa: El seu resultat ens indica: Directa: Sxy > 0. Inversa: Sxy < 0. Incorrelades: Sxy = 0.
Tanmateix, per mesurar la força d’aquesta relació es fa servir el coeficient de correlació lineal de Pearson.
Coeficient de correlació lineal de Pearson (r):
Indica el grau o força d’associació o relació, de dos variables. r, ens indica si els punts tenen tendència a disposar-se alineadament. Aquesta mesura es calcula a partir de la covariància i de les desviacions típiques de les dos variables X i Y, sent convenient fer servir una calculadora o un programa estadístic. r= Sxy/Sx*Sy
Tipus de correlació:
Tal i com s’ha vist a la covariància de dos variables, la relació lineal entre elles pot ser directa, inversa o incorrelada (sense relació). Directa: Quan a l’augmentar una de les variables l’altra augmenta. La recta és creixent.
Característiques del coeficient de correlació (r):
El coeficient és adimensional (no disposa d’unitats de mesura), Pren valors entre -1 i 1. La força i grau de relació lineal milloren quan el coeficient r s’aproxima a -1 o 1. Existeix una relació lineal perfecta quan r = +1 o r = -1. Les variables són incorrelades si r = 0 i pròxims a 0 seran relacions lineals dèbils. Una r positiva = associació directa i una r negativa = associació inversa. Si r>0,8 hi ha bona relació lineal (associació forta). 0,8>r>0,5 és una associació moderada. 0,5>r>0,2 és una associació dèbil. Si r<0,2 és una associació molt dèbil
Anàlisi de la relació. Recta:
Si existeix una correlació lineal forta entre dues variables, podem obtenir una equació matemàtica de la recta que millor representi a tots els punts del diagrama de dispersió (línia de tendència). Ens permet predir el valor d’una variable a partir de les dades conegudes d’una altra variable amb la que està relacionada. La recta descriu com canvia una variable resposta (Y) a mesura que canvia una variable explicativa (X).
Model de regressió lineal simple:
Donades dos variables, X (independent, predictora) i Y (dependent), busquem l’equació que ens permet predir o aproximar un valor Y a partir de X. Podem trobar la millor recta per predir aquest valor mitjançant la tècnica d’estimació mínim quadràtica.
Per obtenir l’equació de la recta mínim-quadràtica calcularem “r”, mitjanes i desviacions típiques de X i Y, ordenada en origen (a) i pendent (b). Amb un programa estadístic directament podem obtenir tan l’equació com les mesures. És important destacar que ^ Y(valor estimat), només serà fiable si està dintre dels parells de valors on hem comprovat que la relació és lineal, és a dir, amb els que hem calculat l’equació. Coeficient de determinació (R2): És una mesura estadística de la fiabilitat del model estimat de les dades. El seu valor és de 0 a 1. Contra més pròxim a 1, més fiable és la predicció de comportament de la variable Y. (R2 = r2)
Anàlisi de la relació. Característiques:
Les característiques de la recta de regressió són: Si a = 0 la recta passa per l’origen de ordenades. Si b = 0 la pendent és 0 i la recta és paral·lela a l’eix d'abscisses. Si la correlació és positiva, la pendent b és major que 0. Si la correlació és negativa, la pendent b és menor que 0. Els valors de la variable Y depenen de les de la variable X, és a dir, la Y és la variable resposta de la variable X explicativa. La recta de regressió sempre passa per al punt (X, Y).
ANÀLISI DE LA RELACIÓ. RECTA: Si existeix una correlació lineal forta entre dos variables, podem obtenir una equació matemàtica de la recta que millor representi a tots els punts del diagrama de dispersió (línia de tendència). Ens permet predir el valor d’una variable a partir de les dades conegudes d’una altra variable amb la que està relacionada. La recta descriu com canvia una variable resposta (Y) a mesura que canvia una variable explicativa (X).
ANÀLISI DE LA RELACIÓ. CARACTERÍSTIQUES: Les característiques de la recta de regressió són: Si a = 0 la recta passa per l’origen de ordenades. Si b = 0 la pendent és 0 i la recta és paral·lela a l’eix d'abscisses. Si la correlació és positiva, la pendent b és major que 0. Si la correlació és negativa, la pendent b és menor que 0. Els valors de la variable Y depenen de les de la variable X, és a dir, la Y és la variable resposta de la variable X explicativa. La recta de regressió sempre passa per al punt (X, Y).
ANÀLISI DE LA RELACIÓ. PROCEDIMENT 1. Calcular els estadístics: L’excel por treure tots els càlculs. 2. Dibuixar el diagrama de dispersió: 3. Calcular el coeficient de correlació de Pearson (r) i comparar amb el coeficient de correlació de la taula: (PRIMERA FORMULA) - Comparació: r teòric 0,99 > r taula = 0,811, per tant, significa que la relació és estadísticament significativa amb una seguretat del 95%. 4. Recta: Com el r és elevat, podem calcular l’equació de la recta i el coeficient de determinació R2. (LAS FORMULAS TRES ESAS) 5. Aplicant l’equació de regressió podem predir la pressió sistòlica corresponent per a una determinada dosi de fàrmac.