lunes, 21 de mayo de 2018

TEMA-12-CONCORDANCIA Y CORRELACIÓN


ESTUDIO CONJUNTO DE DOS VARIABLES

Una de las formas de recoger los datos obtenidos observando dos variables en varios individuos de una muestra, es en una tabla.
  • En las filas tendremos los datos de un individuo.
  • En cada columna se representará los valores que toma una variable sobre los mismos.
  • Los individuos no se muestran en ningún orden particular.
Dichas observaciones pueden ser representadas en un diagrama de dispersión. En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables.
Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

DIAGRAMAS DE DISPERSIÓN O NUBE DE PUNTOS


RELACIÓN ENTRE VARIABLES


PREDICCIÓN DE UNA VARIABLE EN FUNCIÓN DE OTRA




RELACIÓN DIRECTA E INVERSA

Incorrelación: Para valores de X por encima de la media tenemos de Y por encima y por debajo en proporciones similares.

Relación directa: para los valores X mayores que la media le corresponden valores de Y mayores también, y viceversa con ambos.

Relación inversa: para los valores de X mayores que la media le corresponden valores de Y menores.


MODELOS DE ANÁLISIS DE REGRESIÓN



REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN
  •          Se trata de estudiar la asociación lineal entre dos variables cuantitativas
  •          Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica
  •         Regresión lineal simple: una sola variable independiente
  •         Regresión lineal múltiple: más de una variable independiente
  •         Ecuación de la recta: y = ax + b (ej: TAS=a· edad +b)
  •         Pendiente de la recta a = β1
  •         Punto de intersección con el eje de coordenadas b=β0
  •         Pendiente de la recta a = β1
  •         Punto de intersección con el eje de coordenadas b=β0
  •     Β1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente
  •          Β0 expresa cuál es el valor de la variable dependiente cuando la independiente vale cero
  •     Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente
  •    Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
  •          La recta a determinar es aquélla con la menor distancia de cada punto a ella.




ANÁLISIS DE CORRELACIÓN

El análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

VARIABLES CUANTITATIVAS NORMALES:

Coeficiente de Correlación r de Pearson: mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.
La magnitud del Coeficiente de Correlación (r) indica cuán cerca están los puntos de la recta, tomando valores entre 1 y -1.

VARIABLES ORDINALES:

El coeficiente de Correlación por Rango de rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal.

ALGUNAS DE LAS FORMAS DE COMPROBAR LA NORMALIDAD DE LOS DATOS

  • Prueba de Kolmogorov-Smirvov
  • Prueba de Shapiro-Wilk
REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN

  •          Y = β1 · x + β0
  •          Yi= β1 · x + β0 + ei
  •      Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente Yi= y + ei
  •          Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1
  •          No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el comportamiento de la variable dependiente en función de la variable independiente



Teniendo una nube de puntos, ¿cómo elegir la recta que mejor se ajuste a esos puntos?: Mediante el método de los mínimos cuadrados.
Se trata de la recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube.


·       Coeficiente de correlación (Pearson y Spearman): Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre dos variables.
·         r= β1 • sx /sy
·     Coeficiente de determinación: número adimensional (entre 0 y 1) que dá idea de la relación entre las variables relacionadas linealmente. Es r2

No hay comentarios:

Publicar un comentario

REFLEXIÓN

Bueno y aquí llegamos juntos al final del camino. Me gustaría hacer una pequeña reflexión con respecto a la asignatura de ETIC´S. Para empe...