Un R/OneR, que significa “Unica Regla” (en ingles One Rule), es un algoritmo de clasificacion simple pero preciso que genera una regla para cada predictor en los datos y luego selecciona la regla con el menor error en total como su “unica regla”. Para crear una regla para un predictor, construimos una tabla de frecuencias para cada predictor contra el target. Se sabe y ha quedado demostrado que UnR genera reglas apenas menos precisas que otros algoritmos muchisimos mas modernos y avanzados, y lo hace al mismo tiempo que genera reglas lo suficientemente simples como para que un humano las pueda interpretar.
Algoritmo UnR
1 2 3 4 5 6 7 |
Para cada predictor, Por cada valor de ese predictor, crea una regla de la siguiente forma: Contar cuan a menudo aparece cada valor del target (class) Encontrar la clase más frecuente Crear la regla que asigne esa clase a ese valor del predictor Calcular el error total de las reglas para cada predictor Seleccionar el predictor con el menor error total. |
Encontrar el mejor predictor con el menor error total utilizando un algoritmo UnR basado en tablas de frecuencia relacionadas.
El mejor predictor es:
Contribucion de los predictores
Simplemente el error total calculado de la tabla de frecuencias es la medida de contribucion de cada predictor. Un error total bajo implica una mayor contribucion a la predictibilidad del modelo.
Evaluación del modelo
La siguiente matriz de confusión muestra un poder de predicción significativo. UnR no genera un score o probabilidad, lo que implica que las gráficas de evaluacion (Gain, Lift, K-S y ROC) no pueden ser aplicadas.
Matriz de Confusión | Play Golf | ||||
Si | No | ||||
UnR | Si | 7 | 2 |
Valor Predictivo Positivo |
0.78 |
No | 2 | 3 |
Valor Predictivo Negativo |
0.60 | |
Sensitivity | Specificity |
Precisión= 0.71 |
Intenta inventar un algoritmo UnR nuevo utilizando ANOVA y Chi2test