lunes, 27 de mayo de 2019

TEMA 12: CONCORDANCIA Y CORRELACIÓN

Correlación paramétrica: Pearson
Correlación no paramétrica: Sperman.

REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN 
  • Se trata de estudiar la asociación lineal entre 2 variables cuantitativas. 
  • Regresión lineal simple: una sola variable independiente. 
  • Regresión lineal múltiple: más de una variable independiente. 
Ecuación de la recta: y=a+bx
Pendiente de la recta: b → b expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio en la variable independiente. "b" es el coeficiente que va a acompañar a la "X", el cual vamos a llamar coeficiente de regresión. (Indica cuanto cabe esperar que cambie la respuesta por cada incremento unitario de la "X". Es decir, indica la pendiente o inclinación de la recta. 
Punto de intersección con el eje de coordenadas: → a expresa cuál es el valor de la variable dependiente (eje y) cuando la independiente vale cero (eje x). 
Si x=0 → y=a
b>0→ relación directa (cuando x aumenta y también aumenta). 
b<0→ relación inversa (cuando x aumenta y disminuye).
  • A: modelo lineal, buen ajuste. Cuando "x" crece "y" crece.
  • B: modelo lineal, mal ajuste. Cuando "x" crece "y" crece.
  • C: modelo no lineal, buen ajuste. Cuando "x" crece "y" crece. 
  • D: modelo lineal, buen ajuste. Cuando "x" crece "y" decrece. 
  • E: modelo no lineal, buen ajuste.  Cuando "x" crece "y" decrece. 
  • F: Variables no relacionadas. Ninguna curva de regresión es adecuada. 
Calculamos los valores de "a" y "b" que proporcionan la recta que mejor se ajusta. 
- Se parte del criterio de los mínimos cuadrados. Consiste en obtener un punto sobre la gráfica que se denomina (Yi), que es el punto observado, y posteriormente en coger un punto sobre la recta que hemos dibujado, denominado (Yi*), este punto es el que estima el modelo. 
- A continuación se calcula la diferencia entre ambos y nos interesa que la diferencia sea lo más pequeña posible. 

"a" y "b" se calculan

COEFICIENTE DE CORRELACIÓN: número adimensional (entre -1 y 1) que mide la fuerza y sentido de la relación lineal entre dos variables. 

El coeficiente de correlación cuanto más próximo a 1 más relación y cuanto menos próximo menos relación. 

- COEFICIENTE DE DETERMIANCIÓN: número adimensional (entre 0 y 1) que dá idea  de la relación entre las variables relacionadas linealmente. r (cuadrado)= coeficiente de determinación.

  • Modelos lineales deterministas: la variable independiente determina el valor de la variable dependiente.

1 valor independiente → 1 valor dependiente


  • Modelos lineales probabilísticos: para cada valor de la variable independiente existe una distribución de probabilidad de la dependiente, con una probabilidad de entre 1 y 0. 

COEFICIENTE DE CORRELACIÓN DE PEARSON 
Paramétrica por lo que requiere que la distribución siga la normal. 


  • Análisis de correlación: se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables. 
  • Coeficiente de correlación r de Pearson: es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta. 
r<0→ relación lineal inversa 
r>0→ relación lineal directa
r = independientes 




REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETRMIACIÓN 



COEFFICIENTE DE CORRELACIÓN EN NO PARAMÉTRICAS 
El coeficiente de correlación por rango de rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal. 
  • En el siguiente enlace que os voy a mostrar, os explicará de que forma usar este de coeficiente de correlación con una serie de ejemplos. Espero que no os queden dudas. Sitio web 1

rs=-1. La asociación es negativa e inversas, las ordenaciones son perfectamente contrarias.
rs=0. No existe asociación. 
rs=1. Las ordenaciones son todas concordantes.


PRUEBAS DE NORMALIDAD
Prueba de Kolmorov-Smirnov (n>50) y la prueba de Shapiro-Wilk (n<50). 











No hay comentarios:

Publicar un comentario

CONCLUSIÓN

Pues como todo, todo tiene su fin, y esta asignatura esta llegando a su fin. Personalmente puedo decir que nunca me había enfrentado a esto,...