Categoricas con Categoricas

Mapa -> Exploración -> Bivariables

Gráfico de Columnas Apiladas

Este gráfico es muy util para visualizar la relacion entre dos variables categoricas. Compara que porcentaje de cada categoria de una de las variables contribuye al total de cada categoria de la segunda variable.

Grafico Combinado

Este grafico utiliza dos o mas tipos de graficas para enfatizar el hecho de que posee más de un solo tipo de informacion. Aqui, utilizamos un grafico de barras para mostrar la distribucion de una variable categorica y un grafico de lineas para mostrar el porcentaje de la categoria seleccionada en la segunda variable categorica. El grafico combinado es el mejor metodo de visualizacion para demostrar el poder de predicibilidad de un predictor (eje X) contra un objetivo o target (eje Y).

Prueba Chi al cuadrado

Esta prueba se puede utilizar para determinar la asociacion entre variables categoricas. Se basa en la diferencia entre las frecuencias esperadas (e) y observadas (n) en una o mas categorias de la tabla de frecuencias. La distribucion Chi2 devuelve una probabilidad para el Chi2 calculado y el grado de libertad de este. Una probabilidad de cero (0) muetra una dependencia completa entre dos variables categoricas mientras que una probabilidad de uno (1) indica que las dos variables categoricas son totalmente independientes una de la otra. El Coeficiente de Contingencia Tchouproff mide el nivel de dependencia entre dos variables categoricas.

Ejemplo:

La siguiente tabla de frecuencias (tabla de contingencia) con un chi-cuadrado de 10,67, con un grado de libertad (df) de 2 y una probabilidad de 0,005 muestra una dependencia significativa entre dos variables categoricas (color de pelo y ojos).


Ejercicio en Orange Ejercicio en R

Dejá una respuesta