Ejemplo Matriz Confusión 3 Clases
Ejemplo Matriz Confusión 3 Clases
Ejemplo Matriz Confusión 3 Clases
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
Clase a=bueno
Primero nos centramos en la clase a=bueno. Para calcular sus métricas consideramos que la
clase a es la clase positiva y las instancias del resto de clases son miembros de la clase
negativa. La clase positiva viene marcada en la matriz con color rojo y la negativa en azul:
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
49 1 | a = bueno
Como la fila indica la clase real de las instancias, tenemos 49+1 instancias de la clase positiva
(a=bueno) y 47+3+2+48 instancias de la clase negativa (la unión de las clases b y c).
Los falsos positivos son aquellos que son de la clase b o c y se han catalogado en la clase a.
Serían aquellos que están en la columna “classified as a”, exceptuando los 49 de la diagonal
que son los verdaderos positivos. Son los rodeados en la matriz de confusión a continuación:
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
Los TN o verdaderos negativos, cuando estamos centrados en la clase a, son todas aquellas
instancias que no son de la clase a y no se han catalogado como a, así que son el total de
instancias de la clase b y c que no se han catalogado como de la clase a. Lo rodeado en la
matriz de confusión a continuación:
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
El denominador del FPR no es más que la suma de todas las instancias negativas (las de la clase
b y c).
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
𝑇𝑇𝑇𝑇 49
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃ó𝑛𝑛 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐴𝐴 = = =1
𝑇𝑇𝑇𝑇 + 𝐹𝐹𝐹𝐹 49 + 0 + 0
Clase B=regular
Calculamos ahora las métricas para la clase B. Entonces ahora la clase positiva es la b y las
negativas son las clases a y c, esto es, todo lo que no es clase b. Marco en la matriz de
confusión a la clase positiva en rojo y a las negativas en azul:
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
Para calcular la TPR nos tenemos que centrar en las cifras que aparecen en la fila de la clase b.
Hay 47 instancias correctamente clasificadas en la clase b luego serán los TP y hay 3 instancias
catalogadas en otra clase, luego son falsos negativos (FN)
𝑇𝑇𝑇𝑇 47
𝑇𝑇𝑇𝑇𝑇𝑇 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐵𝐵 = = = 0.94
𝑇𝑇𝑇𝑇 + 𝐹𝐹𝐹𝐹 47 + 3
Para calcular la FPR consideramos negativos a todas las instancias que no son de la clase B,
luego serían las marcadas en azul en la matriz anterior. Los falsos positivos son 3, que son
aquellas instancias que no siendo de la clase b (ya sean de la clase a o c) han sido catalogadas
como b, una instancia de la clase a ha sido catalogada como b y dos instancias de la clase c se
han catalogado como b, luego su suma son los falsos positivos de la clase b.
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
𝐹𝐹𝐹𝐹 1+2
𝐹𝐹𝐹𝐹𝐹𝐹 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐵𝐵 = = = 0.03
𝐹𝐹𝐹𝐹 + 𝑇𝑇𝑇𝑇 1 + 2 + 49 + 0 + 0 + 48
Para calcular la precisión nos centramos en la columna “classified as b”. Tenemos 1+47+2
instancias clasificadas como b, siendo 1 de ellas de la clase a (luego es un FP) y 2 de ellas de la
clase c(luego es un FP):
𝑇𝑇𝑇𝑇 47
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃ó𝑛𝑛 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐵𝐵 = = = 0.94
𝑇𝑇𝑇𝑇 + 𝐹𝐹𝐹𝐹 47 + 1 + 2
Clase c=malo
A continuación calculamos las métricas para la clase C, y por tanto se considera positiva a la
tercera fila y negativas a las otras dos filas.
a b c <-- classified as
49 1 0 | a = bueno
0 47 3 | b = regular
0 2 48 | c = malo
𝑇𝑇𝑇𝑇 48
𝑇𝑇𝑇𝑇𝑇𝑇 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐶𝐶 = = = 0.96
𝑇𝑇𝑇𝑇 + 𝐹𝐹𝐹𝐹 48 + 2
𝐹𝐹𝐹𝐹 3
𝐹𝐹𝐹𝐹𝐹𝐹 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐶𝐶 = = = 0,03
𝐹𝐹𝐹𝐹 + 𝑇𝑇𝑇𝑇 3 + 49 + 1 + 47
𝑇𝑇𝑇𝑇 48
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃ó𝑛𝑛 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝐶𝐶 = = = 0.9411
𝑇𝑇𝑇𝑇 + 𝐹𝐹𝐹𝐹 48 + 3
Estos son los cálculos que hace Weka para mostrar los siguientes datos en su salida: