Mapa -> Exploración -> Univariables
Una variable (o atributo) numerica o continua o analógica es una variable que puede tomar cualquier valor dentro de un intervalo finito o infinito (ej. altura, peso, temperatura, etc). Hay dos tipos de variables numéricas, intervalo y ratio.
Una variable del tipo intervalo tiene falores cuyas diferencias son interpretables, pero que no tiene un verdadero cero. Un buen ejemplo es la temperatura en grados Centigrados. Los datos en una escala de intervalos pueden ser sumadas y restadas pero no pueden ser multiplicadas ni divididas. Por ejemplo no podemos decir que un dia es el doble de caluroso que otro. En cambio, las variables de ratio tiene valores con un cero verdadero que pueden ser sumadas, restadas, multiplicadas o divididas (ej. el peso).
Variable Univariable – Variables Numéricas | |||
Estadisticas | Visualizacion | Ecuación | Descripción |
Count | Histograma | N |
La cantidad de valores (observaciones) de la variable. |
Minimo | Diagrama de Caja | Min |
El menor valor de la variable. |
Maximo | Diagrama de Caja | Max |
El mayor valor de la variable. |
Media (Promedio) | Diagrama de Caja |
|
La suma de los valores dividida por la cantidad. |
Mediana | Diagrama de Caja |
|
El valor del medio. Por encima y por debajo de la mediana hay la misma cantidad de valores. |
Moda | Histograma |
El valor mas frecuente. Puede haber más de una moda. |
|
Quantil | Diagrama de Caja |
|
Un conjunto de puntos de corte que dividen el conjunto de datos en grupos que contienen la misma cantidad de valores (Quartil, Quintil, Percentil, etc) |
Rango | Diagrama de Caja |
Max-Min |
La diferencia entre el maximo y el minimo. |
Varianza | Histograma |
|
Una medida de dispercion de datos. |
Desviacion Estandard | Histograma |
|
La raiz cuadrada de la Varianza. |
Coeficiente de Desvio | Histograma |
|
Una medida de dispersion de datos dividida por el promedio. |
Distorcion (Skewness) | Histograma |
|
Una medida de simetria o asimetria en la distribucion de los datos. |
Kurtosis | Histograma |
|
Una medida de si los datos son mayores o iguales en relacion a la distribucion normal. |
Diagrama de Caja e Histograma para el dataset “iris“.
Ejemplo:
Analisis estadístico utilizando Microsoft Excel (iris)
sepal length |
|
Count | 150 |
Minimum | 4.3 |
Maximum | 7.9 |
Mean | 5.84 |
Median | 5.8 |
Mode | 5 |
Quartile 1 | 5.1 |
Range | 3.6 |
Variance | 0.69 |
Standard Deviation | 0.83 |
Coefficient of Variation | 14.2% |
Skewness | 0.31 |
Kurtosis | -0.55 |