Grafico de dispersión
El gráfico de dispersión es una representación visual muy útil de la relación entre dos variables numéricas (atributos) y suele utilizarse antes de empezar a trabajar en una correlación lineal o en una linea de regresión. El patrón resultante del grafico indica el tipo (lineal o no lineal) y la fuerza de la relación entre las dos variables. Se puede agregar mas información en el gráfico de dos ejes de dispersión, por ejemplo, podemos etiquetar los puntos con un código que indica el nivel de una tercera variable. Si estamos trabajando con muchas variables en un set de datos, la forma de presentar todas las posibles dispersiones de dos variables es utilizar una matriz de dispersion.
Correlación Lineal
La correlación lineal cuantifica la fuerza de una relación lineal entre dos variables numéricas. Cuando no hay correlación entre las dos variables, es porque no hay una tendencia para que cuando uno de los valores aumente o disminuya, el otro de los valores también cambie acorde.
r solo mide la fuerza de una relación lineal y siempre existe entre el -1 y el +1. Mientras -1 significa que hay una correlación lineal perfectamente negativa, el +1 implica una perfectamente positiva, y un cero (0) implica que no hay correlación lineal.
Ejemplo:
Temperatura | 83 | 64 | 72 | 81 | 70 | 68 | 65 | 75 | 71 | 85 | 80 | 72 | 69 | 75 |
Humedad | 86 | 65 | 90 | 75 | 96 | 80 | 70 | 80 | 91 | 85 | 90 | 95 | 70 | 70 |
Varianza | Covarianza | Correlacion | |
Temperatura | 40.10 | 19.78 | 0.32 |
Humedad | 98.23 |
Hay una débil correlación lineal entre la Temperatura y la Humedad